- 内核文档:
在x86的平台中,linux内核采用了一种相当复杂的引导方式。 在早期的时候内核是被设计为具有自我引导功能的,加上复杂的PC内存模型以及当时实模式Dos逐渐成为主流操作系统等原因,一步步演进导致了现在的这个结果。
目前,Linux/x86 包含以下几种版本的引导协议:
Old kernels: 仅仅支持zImage/Image。 有些早期的内核甚至可能都不支持命令行参数。
Protocol 2.00: (Kernel 1.3.73) 增加了对bzImage和initrd的支持, 使得boot loader和内核之间有了一种正式的通信方式。 setup.S被编译为可重定向的,但是仍然保留了传统setup区域的可写性。
Protocol 2.01: (Kernel 1.3.76) 增加了堆溢出的告警。
Protocol 2.02: (Kernel 2.4.0-test3-pre3) 提供了一个新的命令行(command line)协议。 降低了传统的内存上限。 该版本的协议没有覆盖传统的setup区域, 使得系统可以使用EBDA(Extended BIOS Data Area)从SMM或32-bit的BIOS入口更安全的进行引导启动。 此时zImage已经是不赞成使用,但是该版本仍然支持。
Protocol 2.03: (Kernel 2.4.18-pre1) 明确指定了bootloader可以使用initrd的高地址。
Protocol 2.04: (Kernel 2.6.14) 将syssize字段扩展为4字节。
Protocol 2.05: (Kernel 2.6.20) 提供了保护模式下内核的可重定位功能。 引入了relocatable_kernel 和 kernel_alignment字段。
Protocol 2.06: (Kernel 2.6.22) 增加一个字段用于保存引导的命令行的大小。
Protocol 2.07: (Kernel 2.6.24) 增加了半虚拟化引导协议。 引入了 hardware_subarch 和 hardware_subarch_data 字段,并在load_falgs中新增了KEEP_SEGMENTS标志。
Protocol 2.08: (Kernel 2.6.26) 增加了CRC32校验和ELF格式有效载荷功能。 引入payload_offset 和 payload_length 字段用于定位(locate)有效载荷(payload)。
Protocol 2.09: (Kernel 2.6.26) 增加了一个64-bit的指针字段, 指向setup_data结构体的单链表。
Protocol 2.10: (Kernel 2.6.31) Added a protocol for relaxed alignment beyongd the kernel_alignment added, new init_size and pref_address fields. Added extended boot loader IDS.
Protocol 2.11: (Kernel 3.6) 增加了一个字段handover_offset 用于保存EFI(Extensible Firmware Interface, 可扩展固件接口) handover协议入口地址的偏移量。
Protocol 2.12: (Kernel 3.8) 增加了一个xloadflags字段,扩展了struct boot_params结构体,使其能够在64bit系统中能够在4G以上的地址中加载bzImage和ramdisk。
大于0x100000 的地址称为高内存(“high memory”)
0x1000 - 0x100000 之间的地址称为低内存(“low memory”)
当使用bzImage的时候,Protected-mode kernel会被重定位到0x100000(“high memory”),同时内核实模式块(kernel real-mode block),包括boot sector, setup, and stack/heap, 被设计为可重定位到 从 0x10000 到 0x100000 之间的任何位置。 不幸的是,在2.00和2.01版本中,0x90000+ 的内存区间仍然被内核用来存放实模式代码,2.02之后的版本解决了这个问题。
由于新的BIOS中包含了EBDA(Extended BIOS Data Area, 扩展BIOS数据域), 需要申请较多的内存,所以bootloader的内存上限(memory ceiling),即bootloader占用的低内存最高处的地址,越低越好。 bootloader通常应该使用”INT 12h”中的来检查低内存还有多少空间可以使用。
不幸的是,如果”INT 12h”上报没有足够的内存使用时,bootloader除了能报告一个错误为用户外,没有其他办法。 所以bootloader通常应该被设计为尽可能少的占用低内存空间。 对于zImage或者老的bzImage的内核(需要将数据写到0x90000段),bootloader应该要保证不会使用0x9A000+ 的地址空间,但是很多BIOS都会破坏这一点。
对于协议版本 >= 2.02 的使用bzImage的内核,内存布局如下图所示:
在下文及内核引导序列(kernel boot sequence)中,一个扇区(sector)指的是512字节大小,与底层的介质真实的扇区大小是相互独立的。
内核加载的第一个步骤是加载实模式代码(boot sector 和 setup 代码),然后检查0x01f1偏移量处的首部信息。 实模式代码能达到32K,虽然bootloader有可能只加载前面的两个扇区(1K)就会去检查首部信息。
struct setup_header{
//setup 代码的大小,单位为512字节。
//如果该字段被设置为0, 那么会当作4来使用。
//在实模式下该代码包括boot sector(通常一个扇区大小) 加上 setup代码
__u8 setup_sects;
__u16 root_flags;
__u32 syssize;
__u16 ram_size;
__u16 vid_mode;
__u16 root_dev;
__u16 boot_flag;
//包含了x86的一个跳转指令,0xEB followed by a signed offset relative to byte 0x202
__u16 jump;
//Contains the magic number "HdrS" (0x53726448).
__u32 header;
//协议版本号,使用(major << 8) + minor格式,比如0x0204表示版本2.04,0x0a11表示不存在的版本10.17
__u16 version;
//bootloader hook,详细参见 ADVANCED BOOT LOADER HOOKS
__u32 realmode_swtch;
//The load low segment (0x1000). 已废弃
__u16 start_sys;
//该字段的值应该小于 0x200*setup_sects
//如果该字段的值为0x1c00,那么它只有在setup_sects >= 15 的情况下才有效。
__u16 kernel_version;
//如果bootloader被分配过ID,该字段里面填充的内容为0xTV, T表示bootloader的ID, V表示版本号
//如果T的值大于0xD,那么需要向该字段的T位置写如0xE,然后将 T - 0x10的值填入 ext_loader_type字段。
//类似的,ext_loader_ver 字段用于扩展bootloader的版本
//例如, T=0x15, V=0x234,那么type_of_loader = 0xE4, ext_loader_type = 0x05 and ext_loader_ver = 0x23
// 0 LILO (0x00 reserved for pre-2.00 bootloader)
// 1 Loadlin
// 2 bootsect-loader (0x20, all other values reserved)
// 3 Syslinux
// 4 Etherboot/gPXE/iPXE
// 5 ELILO
// 7 GRUB
// 8 U-Boot
// 9 Xen
// A Gujin
// B Qemu
// C Arcturus Networks uCbootloader
// D kexec-tools
// E Extended (see ext_loader_type)
// F Special (0xFF = undefined)
// 10 Reserved
// 11 Minimal Linux Bootloader <http://sebastian-plotz.blogspot.de>
// 12 OVMF UEFI virtualization stack
__u8 type_of_loader;
// Bit 0 (read): LOADED_HIGH
// 0表示保护模式代码的加载位置为0x10000 (传统内存布局)
// 1表示保护模式代码的加载位置为0x100000 (现代内存布局)
// Bit 1 (kernel internal): KASLR_FLAG
// 内核内部使用,表示KASLR的状态,1表示KASLR开启,0表示KASLR关闭。
// Bit 5 (write): QUIET_FLAG
// 0表示打印早期信息,1表示不打印早期信息
// 该标志位要求内核不打印早期信息时,需要直接访问显示硬件设备。
// Bit 6 (write): KEEP_SEGMENTS
// Protocol: 2.07+
// 0表示在进入保护模式时重新加载段寄存器
// 1表示不重新加载段寄存器
// Bit 7 (write): CAN_USE_HEAP
// 1表示heap_and_ptr的值是有效的
// 0表示setup代码的功能将被禁止
__u8 loadflags;
//The unit is bytes starting with the beginning of the boot sector
__u16 setup_move_size;
//该字段表示在保护模式下的跳转地址。 该地址表示内核的加载地址,该地址可以被bootloader使用。
// 1. 作为bootloader的hook(详情参见 ADWANCED BOOT LOADER HOOKS)
// 2. 对于没有安装hook的bootloader需要在一个非标准地址加载一个可重定位的内核时,需要修改该字段的内容
__u32 code32_start;
//initial ramdisk或ramfs的线性地址,如果没有initial ramdisk 或ramfs时,设置为0
__u32 ramdisk_image;
//initial ramdisk或ramfs的大小,如果没有initial ramdisk或ramfs时,设置为0
__u32 ramdisk_size;
__u32 bootsect_kludge;
//该字段表示setup stack/heap结尾地址相对于实模式代码其实地址的偏移,减去0x200
__u16 heap_end_ptr;
//该字段用于type_of_loader中version的扩展。 最终的版本号为(type_of_loader & 0x0f) + (ext_loader_ver << 4)
__u8 ext_loader_ver;
//如果type_of_loader中的type为0xE,那么真实的类型应该是(ext_loader_type + 0x10)
__u8 ext_loader_type;
//该字段用于保存内核命令行的线性地址。 内核的命令行可以被置于setup heap的end 至 0xA0000之间的任何位置
__u32 cmd_line_ptr;
//initial ramdisk/ramfs可能用到的最大地址。
//对于2.02或更早的协议来说, 不存在该字段,最大地址为固定的0x37FFFFFF
__u32 initrd_addr_max;
//该字段表示可重定位内核的对齐方式。 可重定位的内核在内核初始化的时候按照这种方式进行重新排列
//bootloader可以修改该字段为更小的对齐方式。 可以参考下面的min_alignment和pref_address字段
__u32 kernel_alignment;
__u8 relocatable_kernel;
//通常情况下 kernel_alignment = 1 << min_alignment
//从kernel_alignment到该字段之间的 power-of-two 的值的对齐方式。
__u8 min_alignment;
// 该字段表示位掩码
// Bit0(read): XLF_KERNEL_64
// 1表示内核在0x200地址处有一个64-bit的入口地址
// 1表示kernel/boot_params/cmdline/ramdisk可以使用4G以上地址
// Bit2(read): XLF_EFI_HANDOVER_32
// 1表示内核支持32bit EFI handoff入口地址(handover_offset)
// Bit3(read): XLF_EFI_HANDOVER_64
// 1表示内核支持64bit EFI handoff入口地址(handover_offset + 0x200)
// Bit4(read): XLF_EFI_KEXEC
// 1表示内核支持kexec EFI boot with EFI runtime support
__u16 xloadflags;
//命令行的大小的最大值(不包含结束符)。 这表示命令行可以包含最多cmdline_size个字符
__u32 cmdline_size;
// 0x00000000 The default x86/PC environment
// 0x00000001 lguest
// 0x00000002 Xen
// 0x00000003 Moorestown MID
// 0x00000004 CE4100 TV Platform
__u32 hardware_subarch;
__u64 hardware_subarch_data;
//有效载荷有可能会被压缩。 不管是压缩还是未被压缩的数据都会采用相同的魔数
//当前支持的压缩方式有 gzip(magic: 1F8B or 1F9E), bzip2(magic: 425A)
//LZMA(magic: 5D00), XZ(magic: FD37) 和 LZ4(magic: 0221)
//未压缩的目前都是ELF格式(magic: 7F454C46)
__u32 payload_offset;
//The length of the payload
__u32 payload_length;
//该字段表示64-bit的物理地址,指向struct setup_data的单链表
// struct setup_data {
// u64 next; //指向单链表的下一个节点
// u32 type; //used to identify the contents of data
// u32 len; //data 的长度
// u8 data[0]; //保存实际的payload数据
// }
//在启动过程中可能会修改该链表。 因此,当修改这个链表的时候,必须考虑到链表中存在节点的情况
__u64 setup_data;
//该字段如果不为0表示内核的优先加载地址。 一个可重定向的bootloader应该能在该地址进行加载
__u64 pref_address;
// if(relocatable_kernel)
// runtime_start = align_up(load_address, kernel_alignment)
// else
// runtime_start = pref_address
__u32 init_size;
//该字段表示EFI handover协议入口地址相对内核映像起始地址的偏移量
//采用EFI handover协议来引导内核的bootloader会跳转到该偏移地址
__u32 handover_offset;
Offset/Size | ProtoVer | Name | Meaning | Type |
01F1/1 | All1 | setup_sects | The size of the setup in sectors | read |
01F2/2 | All | root_flags | If set, the root is mounted readonly | modify(optional) |
01F4/4 | 2.04+2 | syssize | The size of the 32-bit code in 16-bytes paras | read |
01F8/2 | All | ram_size | DO NOT USE - for bootsect.S use only | kernel internal |
01FA/2 | All | vid_mode | Video mode control | modify(obligatory) |
01FC/2 | All | root_dev | Default root device number | modify(optional) |
01FE/2 | All | boot_flag | 0xAA55 magic number | read |
0200/2 | 2.00+ | jump | Jump instruction | read |
0202/4 | 2.00+ | header | Magic signature “HdrS” | read |
0206/2 | 2.00+ | version | Boot protocol version supported | read |
0208/4 | 2.00+ | realmode_swtch | Boot loader hook (see below) | modify(optional) |
020C/2 | 2.00+ | start_sys_seg | The load-low segment(0x1000) (obsolete) | read |
020E/2 | 2.00+ | kernel_version | Pointer to kernel version string | read |
0210/1 | 2.00+ | type_of_loader | Boot loader identifier | write(obligatory) |
0211/1 | 2.00+ | loadflags | Boot protocol option flags | modify(obligatory) |
0212/2 | 2.00+ | setup_mode_size | Move to high memory size (used with hooks) | modify(obligatory) |
0214/4 | 2.00+ | code32_start | Boot loader hook (see below) | modify(optional, reloc) |
0218/4 | 2.00+ | ramdisk_image | initrd load address (set by bootloader) | write(obligatory) |
021C/4 | 2.00+ | ramdisk_size | initrd size (set by bootloader) | write(obligatory) |
0220/4 | 2.00+ | bootsect_kludge | DO NOT USE - for bootsect.S use only | kernel internal |
0224/2 | 2.01+ | heap_end_str | Free memory after setup end | write(obligatory) |
0226/1 | 2.02+3 | ext_loader_ver | Extended boot loader version | write(optional) |
0227/1 | 2.02+3 | ext_loader_type | Extended boot loader ID | write(obligatory if(type_of_loader&0xf0) == 0xe0) |
0228/4 | 2.02+ | cmd_line_str | 32-bit pointer to the kernel command line | write(obligatory) |
022C/4 | 2.03+ | initrd_addr_max | Highest legal initrd address | read |
0230/4 | 2.05+ | kernel_alignment | Physical addr alignment required for kernel | read/modify(reloc) |
0234/1 | 2.05+ | relocatable_kernel | Whether kernel is relocatable or not | read(reloc) |
0235/1 | 2.10+ | min_alignment | Minimum alignment, as a power of two | read(reloc) |
0236/2 | 2.12+ | xloadflags | Boot protocol option flags | read |
0238/4 | 2.06+ | cmdline_size | Maximum size of the kernel command line | read |
023C/4 | 2.07+ | hardware_subarch | Hardware subarchitecture | write(optional, defaults to x86/PC) |
0240/8 | 2.07+ | hardware_subarch_data | Subarchitecture-specific data | write(subarch-dependent) |
0248/4 | 2.08+ | payload_offset | Offset of kernel payload | read |
024C/4 | 2.08+ | payload_length | Length of Kernel payload | read |
0250/8 | 2.09+ | setup_data | 64-bit physical pointer to linked list or struct setup_data | write(special) |
0258/8 | 2.10+ | pref_address | Preferred loading address | read(reloc) |
0260/4 | 2.10+ | init_size | Linear memory required during initialization | read |
0264/4 | 2.11+ | handover_offset | Offset of handover entry point | read |
如果0x202偏移处(“header”字段)的magic不是”Hdrs”, 表示boot protocol的版本是老的。加载的是旧内核,会假设下面的参数被设置:
Image type = zImage
initrd not supported
Real-mode kernel must be located at 0x90000
否则,”version”字段就包含了协议的版本。比如, 协议版本是 2.01 的话,version里面的值为 0x0201, 注意一定要确保填写的各个字段的值是当前这个protocol协议所支持的。
read : 表示信息从kernel 到 bootloader write : 表示信息由bootloader填写 modify: 表示信息先从kernel 读到 bootloader,然后bootloader会做修改
所有普通意义上的bootloader都应该填写带有obligatory的字段。 对于需要采用非标准地址加载内核的bootloader需要填写带有reloc标志的字段, 其他的bootloader可以忽略带有该标志的字段。
从2.08版本的引导协议开始,对整个文件都会进行CRC-32进行校验,CRC-32校验算法采用典型的生成多项式0x4C11DB7和余数部分0xFFFFFFFF。 校验和被增加到文件后面,所以当对首部中的syssize大小的整个文件再次CRC校验时,结果应该总是为0。
内核命令行是bootloader与内核之间进行通信的一种重要方式。 有些内核命令行选项对bootloader也是有意义的。具体信息参见下面的 special command line options 部分。
内核命令行是一个包含结束符的字符串。 它的最大长度保存在cmdline_size字段中。 在2.06之前的协议中,最大长度为255个字符。 如果长度超过最大长度是,内核会自动截断。
在2.02及以后的协议版本中,内核命令行的地址被保存在首部的cmd_line_ptr字段中。 这个地址可以是setup head结尾到0xA0000之间的任何一个位置。
At offset 0x0020 (word), "cmd_line_magic", enter the magic
number 0xA33F.
At offset 0x0022 (word), "cmd_line_offset", enter the offset
of the kernel command line (relative to the start of the
real-mode kernel).
The kernel command line *must* be within the memory region
covered by setup_move_size, so you may need to adjust this
实模式代码启动时需要一个堆栈和一个用于存储内核命令行的内存空间。 这些内存需要在最低的1M空间内分配。
When loading below 0x90000, use the entire segment:
0x0000-0x7fff Real mode kernel
0x8000-0xdfff Stack and heap
0xe000-0xffff Kernel command line
When loading at 0x90000 OR the protocol version is 2.01 or earlier:
0x0000-0x7fff Real mode kernel
0x8000-0x97ff Stack and heap
0x9800-0x9fff Kernel command line
Such a boot loader should enter the following fields in the header:
unsigned long base_ptr; /* base address for real-mode segment */
if ( setup_sects == 0 ) {
setup_sects = 4;
if ( protocol >= 0x0200 ) {
type_of_loader = <type code>;
if ( loading_initrd ) {
ramdisk_image = <initrd_address>;
ramdisk_size = <initrd_size>;
if ( protocol >= 0x0202 && loadflags & 0x01 )
heap_end = 0xe000;
heap_end = 0x9800;
if ( protocol >= 0x0201 ) {
heap_end_ptr = heap_end - 0x200;
loadflags |= 0x80; /* CAN_USE_HEAP */
if ( protocol >= 0x0202 ) {
cmd_line_ptr = base_ptr + heap_end;
strcpy(cmd_line_ptr, cmdline);
} else {
cmd_line_magic = 0xA33F;
cmd_line_offset = heap_end;
setup_move_size = heap_end + strlen(cmdline)+1;
strcpy(base_ptr+cmd_line_offset, cmdline);
} else {
/* Very old kernel */
heap_end = 0x9800;
cmd_line_magic = 0xA33F;
cmd_line_offset = heap_end;
/* A very old kernel MUST have its real-mode code
loaded at 0x90000 */
if ( base_ptr != 0x90000 ) {
/* Copy the real-mode kernel */
memcpy(0x90000, base_ptr, (setup_sects+1)*512);
base_ptr = 0x90000; /* Relocated */
strcpy(0x90000+cmd_line_offset, cmdline);
/* It is recommended to clear memory up to the 32K mark */
memset(0x90000 + (setup_sects+1)*512, 0,
32-bit(非实模式)内核在起始于内核文件的(setup_sects+1)*512的偏移量处(如果setup_sects为0,强制修改为4)。 对于Image/zImage内核,需要加载在0x10000处,对于bzImage内核,需要加载0x100000处。
判断内核是否为bzImage的方式为protocol >= 2.00 且 loadflags = 0x01(LOAD_HIGH)
is_bzImage = (protocol >= 0x0200) && (loadflags & 0x01);
load_address = is_bzImage ? 0x100000 : 0x10000;
Image/zImage内核最大可以达到512K,所以使用的内存空间为0x10000 - 0x90000。 这就要求这种内核的实模式部分必须加载在0x90000处。 bzImage内核就有更多的灵活性。
如果bootloader提供的命令行是用户输入的,那么用户可能期望使用下面的命令行选项。 即使这些参数对于内核来说没有什么意义,最好也不要删除这些参数。 bootloader的实现者需要增加新的命令行选项时,需要先将他们注册在 Documentation/kernel-parameters.txt ,确保没有与当前的内核选项有冲突。
auto 表示内核不需要用户的交互直接启动。
如果bootloader增加了这些参数选项,强烈建议这些参数放在用户指定或配置型指定之前。否则,”init=/bin/sh” auto 这样的配置会让人产生困惑。
内核的入口地址位于实模式内核段偏移0x20处。 这意味着,如果你加载的实模式内核代码位置为0x90000,那么内核的入口地址为 9020:0000。
在入口处,ds=es=ss 这些都指向实模式内核代码的起始地址(如果起始地址为0x90000那么ds=0x9000),sp 通常指向heap的顶部,同时需要禁止中断。 此外,为了预防内核bug,建议bootloader设置fs = gs = ds = es = ss。
/* Note: in the case of the "old" kernel protocol, base_ptr must
be == 0x90000 at this point; see the previous sample code */
seg = base_ptr >> 4;
cli(); /* Enter with interrupts disabled! */
/* Set up the real-mode kernel stack */
_SS = seg;
_SP = heap_end;
_DS = _ES = _FS = _GS = seg;
jmp_far(seg+0x20, 0); /* Run the kernel */
如果bootloader运行在一个非正常环境时(如运行在DOS下的LOADLIN),有可能无法获取标准内存。 这种情况下,bootloader需要使用hook了,内核会在合适的时间会调用hook。 hook就是最后的手段了。
重要: 所有的hook在调用时,都需要保存%esp, %ebp, %esi和%edi。
realmode_swtch: 在进入保护模式之前需要进行16位实模式下远子程序调用。 默认程序会禁止NMI。
realmode_swtch: A 16-bit real mode far subroutine invoked immediately before entering protected mode. The default routine disables NMI, so your routine should probably do so, too.
code32_start: A 32-bit flat-mode routine jumped to immediately after the transition to protected mode, but before the kernel is uncompressed. No segments, except CS, are guaranteed to be set up (current kernels do, but older ones do not); you should set them up to BOOT_DS (0x18) yourself.
After completing your hook, you should jump to the address
that was in this field before your boot loader overwrote it
(relocated, if appropriate.)
For machine with some new BIOS other than legacy BIOS, such as EFI, LinuxBIOS, etc, and kexec, the 16-bit real mode setup code in kernel based on legacy BIOS can not be used, so a 32-bit boot protocol needs to be defined.
In 32-bit boot protocol, the first step in loading a Linux kernel should be to setup the boot parameters (struct boot_params, traditionally known as “zero page”). The memory for struct boot_params should be allocated and initialized to all zero. Then the setup header from offset 0x01f1 of kernel image on should be loaded into struct boot_params and examined. The end of setup header can be calculated as follow:
0x0202 + byte value at offset 0x0201
In addition to read/modify/write the setup header of the struct boot_params as that of 16-bit boot protocol, the boot loader should also fill the additional fields of the struct boot_params as that described in zero-page.txt.
After setting up the struct boot_params, the boot loader can load the 32/64-bit kernel in the same way as that of 16-bit boot protocol.
In 32-bit boot protocol, the kernel is started by jumping to the 32-bit kernel entry point, which is the start address of loaded 32/64-bit kernel.
At entry, the CPU must be in 32-bit protected mode with paging disabled; a GDT must be loaded with the descriptors for selectors __BOOT_CS(0x10) and __BOOT_DS(0x18); both descriptors must be 4G flat segment; __BOOT_CS must have execute/read permission, and __BOOT_DS must have read/write permission; CS must be __BOOT_CS and DS, ES, SS must be __BOOT_DS; interrupt must be disabled; %esi must hold the base address of the struct boot_params; %ebp, %edi and %ebx must be zero.
For machine with 64bit cpus and 64bit kernel, we could use 64bit bootloader and we need a 64-bit boot protocol.
In 64-bit boot protocol, the first step in loading a Linux kernel should be to setup the boot parameters (struct boot_params, traditionally known as “zero page”). The memory for struct boot_params could be allocated anywhere (even above 4G) and initialized to all zero. Then, the setup header at offset 0x01f1 of kernel image on should be loaded into struct boot_params and examined. The end of setup header can be calculated as follows:
0x0202 + byte value at offset 0x0201
In addition to read/modify/write the setup header of the struct boot_params as that of 16-bit boot protocol, the boot loader should also fill the additional fields of the struct boot_params as described in zero-page.txt.
After setting up the struct boot_params, the boot loader can load 64-bit kernel in the same way as that of 16-bit boot protocol, but kernel could be loaded above 4G.
In 64-bit boot protocol, the kernel is started by jumping to the 64-bit kernel entry point, which is the start address of loaded 64-bit kernel plus 0x200.
At entry, the CPU must be in 64-bit mode with paging enabled. The range with setup_header.init_size from start address of loaded kernel and zero page and command line buffer get ident mapping; a GDT must be loaded with the descriptors for selectors __BOOT_CS(0x10) and __BOOT_DS(0x18); both descriptors must be 4G flat segment; __BOOT_CS must have execute/read permission, and __BOOT_DS must have read/write permission; CS must be __BOOT_CS and DS, ES, SS must be __BOOT_DS; interrupt must be disabled; %rsi must hold the base address of the struct boot_params.
This protocol allows boot loaders to defer initialisation to the EFI boot stub. The boot loader is required to load the kernel/initrd(s) from the boot media and jump to the EFI handover protocol entry point which is hdr->handover_offset bytes from the beginning of startup_{32,64}.
The function prototype for the handover entry point looks like this,
efi_main(void *handle, efi_system_table_t *table, struct boot_params *bp)
‘handle’ is the EFI image handle passed to the boot loader by the EFI firmware, ‘table’ is the EFI system table - these are the first two arguments of the “handoff state” as described in section 2.3 of the UEFI specification. ‘bp’ is the boot loader-allocated boot params.
The boot loader must fill out the following fields in bp,
o hdr.code32_start
o hdr.cmd_line_ptr
o hdr.ramdisk_image (if applicable)
o hdr.ramdisk_size (if applicable)
All other fields should be zero.