操作系统实现-loader

内存检测

在loader中，最重要的一点就是检测内存，检测一些系统参数，到时候给kernel使用，那么下面我们就介绍下loader中如何检测内存。还是一样，我们先看下检测内存的代码

    detect_memory:
    ; 置为0
    xor ebx, ebx

    ; es:di赋值
    mov ax, 0
    mov es, ax
    mov edi, ards_buffer

    mov edx, 0x534d4150 ;固定签名

.next:
    mov eax, 0xe820
    mov ecx, 20
    ; 执行系统调用
    int 0x15

    ; 检测cf标志位
    jc error
    ; 将缓存指针指向下一个结构体
    add di, cx

    ; 将结构体数量+1
    inc word [ards_count]
    ; 检测ebx是否为0
    cmp ebx, 0
    jnz .next

    mov si, detecting
    call print

注意，我们这里获取内存的方式是采用BIOS中int 0x15中子功能0xE820。我们先给出int 0x15下3个子功能的具体描述

EAX=0xE820 ：遍历主机上全部内存
AX=0xE801：分别检测第15MB和16MB-4GB的内存
AH=0x88：最多检测出64MB内存

BaseAddrLow（4字节）：基地址的低32位
BaseAddrHigh（4字节）：基地址的高32位
LengthLow（4字节）：内存长度的低32位，以字节为单位
LengthHigh（4字节）：内存长度的高32位，以字节为单位
Type（4字节）：本段内存的类型

返回值如下

CF位：若CF位为0表示调用未出错
EAX：0x534d4150
ED:DI：ARDS的地址
ECX：写入到ARDS的字节数，一般为20字节
EBX：下一个ARDS的地址，当CF=0，且EBX=0，表示结束

准备进入保护模式

进入保护模式需要三个步骤

打开A20
加载GDT
将cr0的pe位置1

全局描述符表

段地址 << 4 + 偏移地址

段选择子（16位）：段内偏移（32位）

typedef struct selector
{
    unsigned char RPL : 2; // Request PL 
    unsigned char TI : 1; // 0  全局描述符 1 局部描述符 LDT Local 
    unsigned short index : 13; // 全局描述符表索引
} __attribute__((packed)) selector;

上面出现了一个全局描述符表的东西（GDT），全局描述符表中每一项都是一个全局描述符，每个全局描述符都指向内存中的一个位置，下面的图展示了其关系

typedef struct descriptor /* 共 8 个字节 */
{
    unsigned short limit_low;      // 段界限 0 ~ 15 位
    unsigned int base_low : 24;    // 基地址 0 ~ 23 位 16M
    unsigned char type : 4;        // 段类型
    unsigned char segment : 1;     // 1 表示代码段或数据段，0 表示系统段
    unsigned char DPL : 2;         // Descriptor Privilege Level 描述符特权等级 0 ~ 3
    unsigned char present : 1;     // 存在位，1 在内存中，0 在磁盘上
    unsigned char limit_high : 4;  // 段界限 16 ~ 19;
    unsigned char available : 1;   // 该安排的都安排了，送给操作系统吧
    unsigned char long_mode : 1;   // 64 位扩展标志
    unsigned char big : 1;         // 32 位 还是 16 位;
    unsigned char granularity : 1; // 粒度 4KB 或 1B
    unsigned char base_high;       // 基地址 24 ~ 31 位
} __attribute__((packed)) descriptor;

memory_base equ 0 ; 内存开始的位置
; 32位下，内存为4G，然后选用的粒度为4KB
memory_limit equ ((1024 * 1024 * 1024 * 4) / (1024 * 4) - 1) ; 内存界限 4G / 4k -1

; 准备进入保护模式
prepare_protected_mode:

    cli; 关闭中断
	...
    ; 加载GDT
    lgdt [gdt_ptr]
	...


gdt_ptr:
    dw (gdt_end-gdt_base)-1
    dd gdt_base
gdt_base:
    ; dd 4个字节，全局描述符表中第一个8字节为null描述符
    dd 0,0 ;null描述符
gdt_code:
    dw memory_limit & 0xffff ; 段界限 0 ~ 15 位
    dw memory_base & 0xffff ; 基地址 0 ~ 15 位
    db (memory_base >> 16) & 0xff ; 基地址 16 ~ 23 位
    ; 存在位，1 在内存中
    ; 特权等级 00
    ; 1 表示代码段或数据段
    ; 段类型 | X | C/E | R/W | A | 1 0 1 0 代码段-非依从-可读-没有访问
    db 0b_1_00_1_1_0_1_0
    ; 1 粒度 4KB
    ; 1 32 位
    ; 0 非64 位扩展标志
    ; 0 available 随意
    ; 段界限 16 ~ 19
    db 0b_1_1_0_0_0000 | (memory_limit >> 16) & 0xf
    ; 基地址 24 ~ 31 位
    db (memory_base >> 24) & 0xff

gdt_data:
    dw memory_limit & 0xffff ; 段界限 0 ~ 15 位
    dw memory_base & 0xffff ; 基地址 0 ~ 15 位
    db (memory_base >> 16) & 0xff ; 基地址 16 ~ 23 位
    ; 存在位，1 在内存中
    ; 特权等级 00
    ; 1 表示代码段或数据段
    ; 段类型 | X | C/E | R/W | A | 0 0 1 0 数据段-向上-可写-没有访问
    db 0b_1_00_1_0_0_1_0
    ; 1 粒度 4KB
    ; 1 32 位
    ; 0 非64 位扩展标志
    ; 0 available 随意
    ; 段界限 16 ~ 19
    db 0b_1_1_0_0_0000 | (memory_limit >> 16) & 0xf
    ; 基地址 24 ~ 31 位
    db (memory_base >> 24) & 0xff
gdt_end:

我们重点来看重点部分，其他我们后续来说

lgdt [gdt_ptr]; 加载GDT 将gdt_ptr所指向的区域加载到GDT register中
sgdt [gdt_ptr]; 保存 gdt 将GDT register中的内容保存到gdt_ptr所指向的区域

然后我们构建代码段和数据段的段选择子，通过选择子的结构进行构建

; 构建代码段和数据段的段选择子 ; 1 << 3 => 0001 根据段选择子的结构，第0-1位为 RPL ,第2位为TI ,后面为index code_selector equ (1 << 3) data_selector equ (2 << 3)

A20线

其实就是为了在保护模式下可以使用更大的寻址线，因此打开A20线，方式很简单，就是将端口0x92的第1位置1就可以，代码如下：

; 打开A20线 in al, 0x92 or al, 0b10 ; 第1位置1 out 0x92, al

CR0寄存器

我们需要将CR0寄存器的第0位（PE位）Protection Enable打开，方式如下

mov eax, cr0 or eax, 1 ; 第0位置1 mov cr0, eax

刷新流水线

我们可以看到一条很奇怪的jmp指令

; 用跳转来刷新缓存，启用保护模式 jmp dword code_selector:protect_mode ; 提醒编译器，到了32位的保护模式 [bits 32] protect_mode:

因为我们知道在跳转前是实模式，可能是16位，但是跳转到保护模式后，需要在32位下进行，那么CPU指令却不知道，仍然可能用16位的方式去解析32位指令，就会出错，因此采用1个jmp模式进行

进入保护模式

[bits 32]
protect_mode:

    mov ax, data_selector
    ; 初始化段寄存器
    mov ds, ax
    mov es, ax
    mov fs, ax
    mov gs, ax
    mov ss, ax

    ; 在0x7e00-0x9fbff可用区域间随便找一个位置
    mov esp, 0x10000 ;修改栈顶

    ; 因为system.bin(kernel文件夹里面的程序编译的)是从第10个扇区开始写入，写了200个扇区
    mov edi, 0x10000;读取的目标内存
    mov ecx, 10 ;起始扇区
    mov bl, 200 ;扇区数量
    call read_disk
    ; 内核代码被放在0x10000处，所以跳转到这里执行内核代码
    jmp dword code_selector: 0x10000

我们在编译的时候，先将system.bin写入到磁盘的第10个扇区，命令如下

dd if=system.bin of=master.img bs=512 count=200 seek=10 conv=notrunc

终于我们可以编写c语言了，前面写汇编实在难受，哈哈哈。

void kernel_init(){
    char *video = (char*)0xb8000; // 文本显示器的内存位置
    for (int i = 0; i < sizeof(message); i++)
    {
        // 第一个位是字符，第二个位是该字符的特性，比如是闪烁还是不闪烁等，所以每个字符要在内存位置占2个位
        video[i*2] = message[i];
    }
}

注意下0xb8000，在这个系列的第2章中，有如下代码

; 0xb8000 文本显示器的内存区域 mov ax, 0xb800 mov ds, ax mov byte [0], 'H'

0xb8000已经超过16位了，所以在实模式下，需要使用方式，而在保护模式下有32位，所以可以直接访问

编程笔记 » 操作系统实现-loader