日期:2014-05-16  浏览次数:20597 次

linux启动过程浅析(1)

?

没有阅读过源码之前,对操作系统总是抱有神秘感,总是认为操作系统是很奥妙的东西. 其实,对于一个有一定编程基础和系统知识的程序员,操作系统并不是可望而不可及的东西. 操作系统的最终目标只是在应用程序层面与硬件层面之间做的一层协调,可能这个定义有些片面,但本着这样的思想读代码应该会轻松一点.
由于发展到现在,LINUX已经可以支持各种平台,本文讲主要针对一个"古老"的版本--0.11--进行讨论,这也是赵炯博士在"linux内核完全注释"一书中做使用的版本,由于本人也是初学者,不敢妄自对2.6内核作出定论. 我将在以下分析的过程中偶尔加入一些自己对2.6的理解.

linux的启动过程主要涉及到三个源文件: bootsect.s head.s setup.s
在0.11版本中,这三个文件均位于linux/boot/目录下,而在最新版本中,因为支持的平台的多样性,我们可以在linux/arch/i386/下找到它们.
i386体系结构的启动过程大致是这样的:机器首先进入实模式,然后从地址0xFFFF0处开始执行,一般这个地址是在BIOS中,于是BIOS程序会对机器做一些自检工作. 在此之后,一般从磁盘启动的机器会从可启动设备的第一扇区中把启动程序读入内存0x07C00位置,并且跳转到该处继续执行.这里所说到的从磁盘读入的第一扇区内容,其实就是bootsect.s经过汇编以后的二进制码,也就是说,在操作系统意义上系统是从bootsect.s开始的. 在观看bootsect.s源码之前,让我们先看看操作系统得到运行机会以后是如何安排一切的:
Linus对bootsect.s被载入的位置不太满意,事实上这的确不是个良好的位置.0x07C00是一个相当低的位置,Linus期望操作系统的真正内核部分可以从0x00000起始,并且占据整个内存区域的最低位置. boot的程序内容只会在机器启动的时候被运行一次,以后基本就没有用了. 而现在,bootsect.s位于0x07C00的位置上,显然已经"挡住"了操作系统的"路". 要知道,即使是0.11版本的linux,内核的长度(这里应该更准确的称之为system模块,而不是广义上的linux内核. 这个概念在下且跳转到那里执行.文中讲述.)也达到了0x3000, 而在2.6中,更是达到了0x7F00之多. 于是,很自然的,我们首先要做的工作就是把bootsect.s的位置挪开,挪到更高的地址上去,并跳转到那里执行.
做完迁移之后,bootsect.s需要做的第二件事情就是要把后续代码load进来. 这部分代码就是setup.s,它的二进制编码应该存放在启动设备的第二个扇区,长度为4个扇区. load这段程序并没有想象中的那么困难,程序通过int 0x13来完成的. setup.s将被放在紧接在bootsect.s的后面的内存区域中.
现在位置,bootsect.s和setup.s已经被放到了所期望的位置了,然后需要做的就是把操作系统的主要部分,真正的system模块load进来,这部分将被放在内存的最低位上,既0x0000起始的位置上.Linux使用了一种看似比较"绕"的方法:Linux首先将system模块放在0x10000的位置上.而在bootsect.s运行完之后,程序计数器会跳转到setup.s的范围中,此时系统又将system模块往低位处移动,存放到0x00000处.我也是刚接触Linux不久,对此不得其解.因为此时的bootsect已经被移动到了0x90000处了,既是将system模块放在0x00000处应该也不会影响到系统的运行,为什么不直接写到最低位呢?个人猜想时因为系统在BIOS初始话层面中将中断向量表放在了0x00000处,而现阶段此向量表还有可能需要使用.这只是猜测,如果有哪位知晓其中原理,麻烦请将其中真正原因告诉我.我的E-Mail:j.h_zhang@163.com,不甚感激.
到此位置,bootsect.s的任务基本算完成了,0.11版本中,bootsect.s最后还要确定根设备号. 然后就是跳转到SETUPSEG处,既0x9020地址处,运行紧接在bootsect.s二进制码之后的,先前被load进来的setup.s.

以下我们来看一看bootsect.s的源码,看看操作系统最初是怎样的形态.需要注意的是,现在机器还处于实模式之下.其中会有一些我的注释,对于希望观看赵炯博士的详细注释者,请参考"linux内核完全注释".另外,为了便于区分,我加的注释将以两个"!"开头,而程序中原本存在的注释以一个"!"开头:
!
! SYS_SIZE is the number of clicks (16 bytes) to be loaded.
! 0x3000 is 0x30000 bytes = 196kB, more than enough for current
! versions of linux
!
SYSSIZE = 0x3000
!
!bootsect.s(C) 1991 Linus Torvalds
!
! bootsect.s is loaded at 0x7c00 by the bios-startup routines, and moves
! iself out of the way to address 0x90000, and jumps there.
!
! It then loads 'setup' directly after itself (0x90200), and the system
! at 0x10000, using BIOS interrupts.
!
! NOTE! currently system is at most 8*65536 bytes long. This should be no
! problem, even in the future. I want to keep it simple. This 512 kB
! kernel size should be enough, especially as this doesn't contain the
! buffer cache as in minix
!
! The loader has been made as simple as possible, and continuos
! read errors will result in a unbreakable loop. Reboot by hand. It
! loads pretty fast by getting whole sectors at a time whenever possible.

.globl begtext, begdata, begbss, endtext, enddata, endbss
.text
begtext:
.data
begdata:
.bss
begbss:
.text

!!一下定义了一些符号,用来标记系统启动过程中的各种常数
!!比如:
!!BOOTSEG为系统启动时第一条运行的指令地址
!!INITSEG为Linux希望将bootsect.s移动到的地址
!!SETUPSEG为紧接再bootsect.s后存放setup.s的头地址
!!SYSSEG为在bootsect.s运行时,暂时存放system模块的头地址,在setup.s运行时,又会将system移动到0x00000处
!!一下地址是作为基地址存在的,也就是说在实模式下,当用一下地址寻址是,会首先将地址左移4位,然后加上偏移量.
!!如此, "BOOTSEG = 0x07c0"实际上是意味着0x07c00地址.
SETUPLEN = 4! nr of setup-sectors
BOOTSEG = 0x07c0! original address of boot-sector
INITSEG = 0x9000! we move boot here - out of the way
SETUPSEG = 0x9020! setup starts here
SYSSEG = 0x1000! system loaded at 0x10000 (65536).
ENDSEG = SYSSEG + SYSSIZE! where to stop loading

! ROOT_DEV:0x000 - same type of floppy as boot.
!0x301 - first partition on first drive etc
ROOT_DEV = 0x306

entry _start
!!程序的开始,万物的起源. ^_^
_start:
!!一下一段的目的是将bootse