Chip123 科技應用創新平台

標題: trace linux kernel source - ARM - 02 [打印本頁]

作者: gogojesse 時間: 2008-8-8 04:01 PM
標題: trace linux kernel source - ARM - 02
開始跳進去head.S之前
先來看看bootloader
當板子通電,最先被執行到的通常是bootloader
透過它才有機會去改變載入過程
例如更換這次使用的kernel image
或者是選擇要用tftp download image還是從flash上的某個image跑起來
kernel為了讓這個變數盡量單純
因此linux也有限制bootloader必須在進入到kernel之前必須設置好的狀態

1. r0 = 0
2. r1 = architecture ID
3. r2 = atag list
4. mmu off
5. I&D cache off

如此一來kernel就可以在已知的狀態去講好的暫存器拿資料，有了這個概念有助於看head.S。
我們首先來看一開始的程式碼進入點

114 start:
. H( }. f. l5 l1 S) W7 d
115 .type start,#function! i! @7 Z5 l! m) n! D% G4 G
116 .rept 8
/ f/ U9 T& m2 Z3 S
117 mov r0, r0
5 O, G) b- u8 p0 k, _
118 .endr _/ X$ K4 I2 c( J
119- ^, y1 p. x6 \
120 b 1f7 \! r; W# h2 J D
121 .word 0x016f2818 @ Magic numbers to help the loader% E) ^2 f# i) u$ F# r1 S3 @
122 .word start @ absolute load/run zImage address
/ ~$ K$ x2 K: _, A% U
123 .word _edata @ zImage end address% m5 X. i0 R6 Z' @9 O! a
124 1: mov r7, r1 @ save architecture ID3 X$ q9 Q4 w' g! [1 I
125 mov r8, r2 @ save atags pointer

複製代碼

line 116~118, rept = repeat, endr = end of repeat, 意思是將move r0, r0的程式碼
重複八次，也就是說build成kernel image的時候這邊一開始的code會有8個指令都在作
『move r0, r0』的事情，很怪!!還看不出是做什麼的。可能之後會看到如何被運用。
(有些文章寫說是作出中斷向量表的空間，我們這邊先不預先作猜測~)

line 120, branch到1的地方，f是指forward的方式找branch。

line 124, 125, 分別將r1, r2的資料丟到r7, r8存起來，回想兩件事情。
1. init.S執行的過程中，始終沒有用到r1, r2，那r1, r2的資料到底放著什麼東西。
2. 一開始我們提到，bootloader會預先設定好狀態才跳到kernel，原來!!
r1, r2就是bootloader準備好的。

這讓我想到一個問題，假設我們不想跑bootloader，是不是可以寫一小段程式碼，直接將
狀態設置好，就直接進入linux kernel呢??

line 121~123, 純粹將一些資訊記住，.start就是 kernel 起始位置，這邊看起來是
忽略掉init.S和initrd.S佔去的位置，直接將.start這個section當成kernel image的開始起點。

接著繼續往下看(我們預設arch已經超過v2，現在應該大多是v4以上)

133 mrs r2, cpsr @ get current mode7 \# F; y' I9 p4 w8 H/ E8 j
134 tst r2, #3 @ not user?
; W2 o$ s T& x! ]
135 bne not_angel/ m: W7 K: ]/ G7 ^& f" m6 m/ D
136 mov r0, #0x17 @ angel_SWIreason_EnterSVC3 ^1 n8 v, q3 B' L' m) {
137 swi 0x123456 @ angel_SWI_ARM
/ b9 U" g5 q4 A8 e/ P
138 not_angel:
5 ^' P) M7 |8 y* K9 A1 \& v7 q1 t
139 mrs r2, cpsr @ turn off interrupts to+ ]9 D* b/ W2 R2 Z0 ]: K
140 orr r2, r2, #0xc0 @ prevent angel from running
) e! z+ r3 V& N$ d8 }
141 msr cpsr_c, r2
/ n" N ~) \+ i5 n7 l& I4 P/ D

複製代碼

line 133, mrs 是特殊用來讀取cpsr和spsr暫存器裡頭紀錄processor模式值的指令，這兩個reg是
用來控制和表示processor目前狀態的。
1ine 134, tst = test, 看看r2是不是等於3。
line 135, r2不等於3的話就跳到 not_angel 這個地方開始執行，記得以前有個angelboot可以用
來boot armlinux，應該是angelboot會特別跑在3這個mode。
line 136, 137, 用來觸發angelboot裡頭的swi的function，作用應該是要切回去SVC mode。SVC mode
是一開始ARM processor預設執行模式。

line 139~141, 用來關掉interrupt，避免被中斷booting的過程。(因為複雜一點的bootloader通
常會已經support很多driver，中斷也很頻繁。

作者: jacky002 時間: 2008-8-9 07:40 AM
補充資料 - ARCH: ARM11 -> v5
可參考
http://tech.digitimes.com.tw/pri ... FE2482571DD006E9DC5

建議可在加上UBoot or Redboot的部分，應該可以造福更多初學者。

作者: gogojesse 時間: 2008-8-9 11:40 AM

原帖由 jacky002 於 2008-8-9 07:40 AM 發表
" z# W1 g6 q' X7 W- Y: d* q建議可在加上UBoot or Redboot的部分，應該可以造福更多初學者。

看完kernel應該會花上一些時間
看看有沒有哪位大大要認領
開一篇bootloader的文章

另外，有人要trace x86 or MIPS的架構應該也不錯
這樣主要的幾種processor都可以搞定
這樣要跨平台跳槽也容易許多

作者: gogojesse 時間: 2008-8-11 12:07 PM
程式繼續往下跑
這邊插點符號跳過文繞圖
.
.
.
.
.
.
.
.
.
.

157 adr r0, LC06 c4 e# { t( P. {& O1 g( j2 ?
158 ldmia r0, {r1, r2, r3, r4, r5, r6, ip, sp}
# H' x# |& e4 S2 g0 z- \
159 subs r0, r0, r1 @ calculate the delta offset
5 r$ Q/ e/ [6 w3 |$ `
1602 l5 _& Z8 H/ R; W
161 @ if delta is zero, we are+ G, l1 @$ c1 ^4 Q% Q2 t, [7 F
162 beq not_relocated @ running at the address we
+ G p- O+ Q( E( g* G8 M
163 @ were linked at.

複製代碼

288 .type LC0, #object
* { g- \* T' i, G) h" `: }. m
289 LC0: .word LC0 @ r14 D6 C* ]4 a2 \
290 .word __bss_start @ r28 C+ a8 ?' V+ c6 b
291 .word _end @ r30 ^6 i O, X! v
292 .word zreladdr @ r4! _7 h# @! i0 x$ _
293 .word _start @ r5) r$ M- _5 W/ y ^! B; x+ s0 @$ v0 E
294 .word _got_start @ r6$ N) A% J9 @! t8 |
295 .word _got_end @ ip
. N5 @9 d% B. w1 z
296 .word user_stack+4096 @ sp; T7 p& ?; m& h! Y4 S/ m
297 LC1: .word reloc_end - reloc_start; s) E! c/ a# Q3 m
298 .size LC0, . - LC0

複製代碼

line 157, 將LC0的位址當作值放到r0。
line 158, 從r0指到的位址開始，將值依序讀到r1, r2, r3, r4, r5, r6, ip, sp, 其中 ip=r12, sp=r13
line 159, 將r0-r1，這邊的意思是說r0是真正被載入到記憶體上的address,r1是被compile完就已經決定好的位
址(也就是line 289中LC0這個symbole的address)，兩個相減，剛好可以算出『compile好』跟『被load到位址』
之間的offset，這樣做有什麼意義? 繼續往下看。

line 162, 如果相減等於0，表示載入的位址和complie好的位址是一樣的，那程式碼就可以被直接執行，要是不為0
的話，表示compile本來以為這些執行碼會被放到 r1 的位址，可是卻被放到r0的位址去，這樣一來，有一些預先compile好的程式碼，可以會找不到一些symbol的所在位置，因為整個image被load到不對的offset的地方。那...
怎麼辦勒??

往下看

172 add r5, r5, r04 J, l) k/ X8 R, Q
173 add r6, r6, r0
/ I9 O( S5 V% o& D* {
174 add ip, ip, r0
. r" f: B$ y0 C8 u
; j% X( \* c2 v+ B1 X* l% Z/ R# x) I
202 1: ldr r1, [r6, #0] @ relocate entries in the GOT
, E" E6 l3 n# u! q* Y9 t9 m2 j/ v
203 cmp r1, r2 @ entry < bss_start ||# A0 T* j4 }+ m" H! O; W
204 cmphs r3, r1 @ _end < entry
% [* v: q( I4 @# A# I8 }+ @, w
205 addlo r1, r1, r0 @ table. This fixes up the
( L2 Z! d; Z, Z$ k$ s
206 str r1, [r6], #4 @ C references.
207 cmp r6, ip
; J* Y2 x$ |0 e3 ^
208 blo 1b

複製代碼

line 172~174, 將r0這個offset，加到r5, r6, ip,也就是r5=zImage base address, r6=GOT start, ip=GOT end. GOT全名是global offset table, 它是ELF format執行檔裡面用來放一些和位址無關的code的地方。詳細的東西可以參照http://www.itee.uq.edu.au/~emmerik/elf.html。總之，可以看得出來我們將一些位址加上
了offset，很明顯的是因為我們載入的位置跟原本執行碼所預期的位址不同，因此必須做一些relocate的動作，若是不
做的話，很可能程式碼會拿到不對的資料，我是jump到錯誤的地方執行。

line 202~208, r1指向GOT table start，在沒有寫錯到bss區塊的情況下，將GOT裡面的資料都作relocate的動作。
line 203, 204,應該是用來避免r1只到bss區塊。關於BSS也必須參考ELF format的東西, BSS是用來放置，未經初始
化的變數的地方。

以上，我們發現kernel意識到自己被載入到某個地方，並且查看被載入到的地方是不是和compile
time決定一樣，不一樣的話，自己手動修改一些需要做offset的資訊，等於是手動作relocate的事情。

作者: gogojesse 時間: 2008-8-14 07:02 PM
放了兩天假出去happy

接著繼續trace

211 not_relocated: mov r0, #0
" ^: h9 A/ L, t' O' R
212 1: str r0, [r2], #4 @ clear bss
, m, c- ] B5 b. o1 N# F# R
213 str r0, [r2], #42 S! j6 a9 R5 o
214 str r0, [r2], #4' @3 Z0 {3 `& l
215 str r0, [r2], #4
8 y* W. ]& _, {1 c5 ?6 ~
216 cmp r2, r3 @9 C8 r( `% U4 ~. W
217 blo 1b$ t! W3 i9 Q' s1 w* V
218
+ l7 }+ v" w0 l
224 bl cache_on

複製代碼

恢復記憶一下，上次trace到kernel做了一些判斷，如果被載入的位址和compile time決定的位址不同，就會
自己做relocate的動作，將一些ELF binary的特定pointer和value加上offset。那做完初步的relocate之後要做什麼?

line 212~215, 都是做store的動作，把r0存到r2所指到的位址，做完之後r2=r2+4。r2= bss start的位址.
換句話說，開始將bss裡頭的值都初始化成0。
lin3 216, 217, 確認一下是不是到了bss的底部,不到底部的話，jump到line 212繼續做搬移的動作。

line 224, 做完bss初始化，jump cache_on

328 cache_on: mov r3, #8 @ cache_on function
. m4 {" b% M! n% [) m" k
329 b call_cache_fn9 v% m% o+ S" ?3 Y$ F
$ ?' L8 a+ _2 `; r" B. T4 O
537 call_cache_fn: adr r12, proc_types8 g+ Y. @2 D% T, U
539 mrc p15, 0, r6, c0, c0 @ get processor ID
7 g: x( @$ M( W" O
3 n/ |3 Q2 G9 a1 O% l3 I
543 1: ldr r1, [r12, #0] @ get value" d) v1 j+ Y! p
544 ldr r2, [r12, #4] @ get mask
- U2 @) p! B1 s
545 eor r1, r1, r6 @ (real ^ match)
5 c7 D, I) P) D! Y
546 tst r1, r2 @ & mask) t) `* A- N1 e8 j- _1 E: _2 a: t
547 addeq pc, r12, r3 @ call cache function7 R7 L0 m" [. ~+ s2 F5 Q
548 add r12, r12, #4*5
3 \' S( F0 p1 A! {* z
549 b 1b

複製代碼

line 328, 將r3填入8, 不知道r3會拿做什麼用，繼續看。
line 329, jump到call_cache_fn。
line 537, 將proc_types的位址讀到r12。
line 539, 將coprocessor裡頭的CPU id讀出來放到r6
line 543, 544, 將r12所指到的第一個位址的資料放到r1, offset 4bytes的資料放到r2，我們可以先觀
察一下proc_types的長相(如下)，註解上面寫了很多arm的家族的名稱，例如arm 6, armv5te等等，而且不
難發現都是先兩個.word，然後跟著三個『b xxxx_cache_xxx』，感覺很像是一組一組的資料。
line 545, 546, 將r6裡頭的CPU ID和讀出來的r1做exclusive OR，並且取mask，看看是否相等，相等的
話，就將pc設定r12+r3。換句話說，就是用CPU ID去確認值是否相等，值相等的話，就jump到r12+r3的位址。
line 548, 549, 不相等的話，就把r12加上5x4byte的offset跳回去繼續找。
整理一下，這邊的程式碼就是去proc_types的地方，比對CPU ID，比對成功的話，就呼叫該筆資料裡面的
cache function，至於呼叫第幾個function，就由r3控制，那所有CPU對應到的data structure就
從proc_types開始。

以ARMv5TE來說，r3=8，就剛好是cache_on的function。所以我們知道如果我自己發明了一個新的ARM CPU，也弄了一個新的id，這邊就需要修改出相對應的CPU的infomation，不然可能會找不到CPU ID。

566 proc_types:
1 N3 n4 n# `# f- A* r/ Q
567 .word 0x41560600 @ ARM6/610% @7 k/ ^. a% L1 y: w" _
568 .word 0xffffffe0
( k$ m5 w' D2 z$ F
569 b __arm6_mmu_cache_off @ works, but slow% Z' i: V. y9 t4 _+ ~6 u
570 b __arm6_mmu_cache_off
) I& g- x$ }9 f; z1 C- {' w
571 mov pc, lr! m. N5 q! j6 s! {
......$ h. S8 U$ A! j ~% _, Y2 W0 L
640 .word 0x00050000 @ ARMv5TE7 l: h: S9 }) _' {, c* x0 w+ m8 U
641 .word 0x000f0000. `9 \5 q* {; E
642 b __armv4_mmu_cache_on) x. Y. J! q* o% f$ `5 Z) S
643 b __armv4_mmu_cache_off5 V/ c- g( \7 G/ r
644 b __armv4_mmu_cache_flush

複製代碼

到這邊我們，找到了CPU對應的cache on的function，必且要準備呼叫它。

作者: rogerho 時間: 2008-8-28 10:56 AM
很棒的分析....讓我能有機會可以瞭解bootloader的一些流程.............感謝

作者: gogojesse 時間: 2008-8-29 10:13 AM

很棒的分析....讓我能有機會可以瞭解bootloader的一些流程.............感謝

謝謝

最近突然忙起來
改天有空再繼續study....

另外，這篇是kernel booting的過程的程式碼，應該不能稱呼bootloader，不過
有些概念跟bootloader差不多，可以幫助閱讀bootloader的code就是。

作者: gogojesse 時間: 2008-10-7 12:43 PM
忙了好一陣子∼
之前trace到 ./arch/arm/boot/compressed/head.S的 line 224
呼叫了cache_on之後就沒寫了
現在接著開始

首先我們偷看一下code，
line 226, 將sp的值放到r1。
line 227 將sp的值加上0x10000放到sp。

為什麼kernel之前花了一些功夫將自己relocate到某個位置之後，要把cache打開，然後要開始對stack pointer(sp)做動作？目前還看不出來，所以接著trace下去。

line 238，比較r4和r2的值，r4的值從line 158載入之後就一直沒被用到過，這個值是從一些makefile或是被makefile include進來的，然後在linking time的時候會被帶入，每個平台不一定一樣，通常你可到./arch/arm/mach-xxx/Makefile.boot去設定，這個值是用來指定kernel應該要被load到哪個位址上面執行。以omap1來說，
zreladdr-y := 0x10008000
就是表示kernel會被載入到 0x10008000 的地方。這邊將r2和r4比較的用意是看看sp+0x10000之後會不會超過zreladdr的位置，應該是怕stack爆掉了會蓋到kernel的地方。(記住我們現在的kernel其實還在壓縮狀態，zreladdr是指解壓縮完要開始執行的狀態。）

line238~line243, 比較了r4和r2，假如不會蓋到，就會跳到wont_overwrite去執行，假如會蓋到，就看目前sp到之後解壓縮image位址之間的距離有沒有比image四倍的大小來得大，假如有，表示空間還夠用，還是可以跳去wont_overwrite去，假如不到四倍大，就跑到line 262去把kernel搬到遠一點的地方，試看看能不能正常boot起來，line262先不做解釋，一般來說位址設錯的話，這邊的correction失敗的機率還是很大，著眼在correction的意義不大。所以我們就直接跳去wont_overwrite吧！

226 mov r1, sp @ malloc space above stack5 M; _& C8 v/ Z9 j/ y1 z3 B( S
227 add r2, sp, #0x10000 @ 64k max
3 C& c9 n0 Q6 w1 Z/ m9 {
" L0 @! L) c6 J+ O' A- e
238 cmp r4, r2
6 Z2 J! _* T/ H7 k% x/ R% w4 s
239 bhs wont_overwrite
- M" H4 L5 l# U: T! N, {
240 sub r3, sp, r5 @ > compressed kernel size
- e2 a1 q$ J9 [
241 add r0, r4, r3, lsl #2 @ allow for 4x expansion
! @; B( ~6 W' A5 @
242 cmp r0, r5
3 ]. ` p7 R( H' J& \6 J) _
243 bls wont_overwrite# e% b5 _/ J- j
2445 {, @# p# O; B/ o- u
245 mov r5, r2 @ decompress after malloc space( Z- ?, N4 A. N
246 mov r0, r5
! R) @; t3 H* ]$ L
247 mov r3, r7
1 I' q# B- i7 D6 G) u+ K: y# b& K
248 bl decompress_kernel* ~; t" V* [) j5 O: ?! t
249" _4 R5 D# t3 F9 ^+ T" s
250 add r0, r0, #127 + 128 @ alignment + stack0 r q7 H- f9 r
251 bic r0, r0, #127 @ align the kernel length

複製代碼

跳到wont_overwrite之後，當然就是要開始把kernel解壓縮，
line 283,把r4搬到r0,r4就是我們剛剛說的kernel被解壓縮之後的位址。（也就是解完之後應該要執行的位置）
line 284,把r7搬到r3,r7從一開始讀進來之後，也沒用過，理論上是architecture ID。
line 285,是跳到decompress_kernel，這邊我們發現decompress_kernel是被定義在misc.c檔，所以這是第一次從assembly code跳到c code的地方。這樣一來我們就知道原來剛剛要把cache打開和設定好sp的用意，原來就是為了要執行c code，因為c的程式碼有固定的執行方式，會需要用到sp，這部份可以參考『procedure call standard for the ARM architecture』，這也是r4和r7被搬到r0, r3的原因，因為r0~r3是用來傳遞C function的參數用的，r0就是arg0, r1=arg1, etc.

283 wont_overwrite: mov r0, r4
) c' {8 x- q- m( G/ m3 N( S
284 mov r3, r7+ M+ B5 |3 u, ~* n4 V
285 bl decompress_kernel
( {6 Y4 _5 x' }. G8 H" X2 U2 e
286 b call_kernel

複製代碼

偷看misc.c

346 decompress_kernel(ulg output_start, ulg free_mem_ptr_p, ulg free_mem_ptr, int arch_id)

複製代碼

果然r0~r3就是的參數。

作者: gogojesse 時間: 2008-10-7 01:01 PM
由於解壓縮不是我們的重點
沒有trace
假設一切都順利
decompress_kernel結束後
我們就得到一個解壓縮完的kernel放在r4指向的位置
line 286,會jump到call_kernel，如下:
line 516, flush cache
line 517, 關掉 cache
line 518~520,將r0, r1, r2分別填值。
line 521,將program counter指到r4，也就是解壓縮的kernel的一開頭。

到這邊我們終於結束head.S的工作，解壓縮並且跳到另外一個object code的開始。跳到解壓縮的開始位置，究竟會進入哪一個function？

516 call_kernel: bl cache_clean_flush
9 T* q$ O3 v) C& E c( p6 D
517 bl cache_off
" ^) t x- A- x r3 H6 e2 R
518 mov r0, #0 @ must be zero
4 ]. X% u" }4 q
519 mov r1, r7 @ restore architecture number( b+ {% Y7 o9 Y3 V% q
520 mov r2, r8 @ restore atags pointer
9 s! K6 R9 t6 d& Y) l
521 mov pc, r4 @ call kernel

複製代碼

作者: kkbbs 時間: 2008-10-11 10:39 PM
很棒的分析....
非常據有參考價值
感謝大大分享感恩

作者: gogojesse 時間: 2008-10-13 10:15 AM

原帖由 kkbbs 於 2008-10-11 10:39 PM 發表
: I: w) ?! B6 R) }5 }, {- q很棒的分析....
! o3 v- N4 T$ E" [2 q. w非常據有參考價值
- g/ s: a( U/ C; H/ b( Z# U感謝大大分享感恩

謝謝

有哪邊寫錯或是有怪怪的地方
歡迎提出來一起想想...

歡迎光臨 Chip123 科技應用創新平台 (http://www.chip123.com/)