幾乎所有程序員的第一堂課都是學習helloworld程序,下面我們先來重溫一下經典的C語言helloworl
/* hello.c */
#include <stdio.h>
int main()
{
printf("hello world!/n");
return 0;
}
這是一個簡單得不能再單的程序,但它包含有一個程序最重要的部分,那就是我們在幾乎所有代碼中都能看到的main函數,我們編譯成可執行文件并查看符號表,過濾出里面的函數如下(為了方便查看我手動調整了grep的輸出的格式,所以和你的輸出格式是不一樣的)
$ gcc hello.c -o hello
$ readelf -s hello | grep FUNC
Num: Value Size Type Bind Vis Ndx Name
27: 000000000040040c 0 FUNC LOCAL DEFAULT 13 call_gmon_start
32: 0000000000400430 0 FUNC LOCAL DEFAULT 13 __do_global_dtors_aux
35: 00000000004004a0 0 FUNC LOCAL DEFAULT 13 frame_dummy
40: 0000000000400580 0 FUNC LOCAL DEFAULT 13 __do_global_ctors_aux
47: 00000000004004e0 2 FUNC GLOBAL DEFAULT 13 __libc_csu_fini
48: 00000000004003e0 0 FUNC GLOBAL DEFAULT 13 _start
51: 0000000000000000 0 FUNC GLOBAL DEFAULT UND puts@@GLIBC_2.2.5
52: 00000000004005b8 0 FUNC GLOBAL DEFAULT 14 _fini
53: 0000000000000000 0 FUNC GLOBAL DEFAULT UND __libc_start_main@@GLIBC_
58: 00000000004004f0 137 FUNC GLOBAL DEFAULT 13 __libc_csu_init
62: 00000000004004c4 21 FUNC GLOBAL DEFAULT 13 main
63: 0000000000400390 0 FUNC GLOBAL DEFAULT 11 _init
大家都知道用戶的代碼是從main函數開始執行的,雖然我們只寫了一個main函數,但從上面的函數表可以看到還有其它很多函數,比如_start函數。實際上程序真正的入口并不是main函數,我們以下面命令對hello.c代碼進行編譯
$ gcc hello.c -nostdlib
/usr/bin/ld: warning: cannot find entry symbol _start; defaulting to 0000000000400144
-nostdlib命令是指不鏈接標準庫,報錯說找不到entry symbol _start,這里是說找不到入口符號_start,也就是說程序的真正入口是_start函數實際上main函數只是用戶代碼的入口,它會由系統庫去調用,在main函數之前,系統庫會做一些初始化工作,比如分配全局變量的內存,初始化堆、線程等,當main函數執行完后,會通過exit()函數做一些清理工作,用戶可以自己實現_start函數
/* hello_start.c */
#include <stdio.h>
#include <stdlib.h>
_start(void)
{
printf("hello world!/n");
exit(0);
}
執行如下編譯命令并運行
$ gcc hello_start.c -nostartfiles -o hello_start
$ ./hello_start
hello world!
這里的-nostartfiles的功能是Do not use the standard system startup files when linking,也就是不使用標準的startup files,但是還是會鏈接系統庫,所以程序還是可以執行的。同樣我們查看符號表
$ readelf -s hello_start | grep FUNC
Num: Value Size Type Bind Vis Ndx Name
20: 0000000000400350 24 FUNC GLOBAL DEFAULT 10 _start
21: 0000000000000000 0 FUNC GLOBAL DEFAULT UND puts@@GLIBC_2.2.5
22: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@@GLIBC_2.2.5
現在就只剩下三個函數了,并且都是我們自己實現的,其中printf由于只有一個參數會被編譯器優化為puts函數,在編譯時加-fno-builtin選項可以關掉優化
如果我們在_start函數中去掉exit(0)語句,程序執行會出core,這是因為_start函數執行完程序就結束了,而我們自己實現的_start里面沒有調用exit()去清理內存
好不容易去掉了main函數,這時又發現必須得有一個_start函數,是不是讓人很煩,其實_start函數只是一個默認入口,我們是可以指定入口的
/* hello_nomain.c */
#include <stdio.h>
#include <stdlib.h>
int nomain()
{
printf("hello world!/n");
exit(0);
}
采用如下命令編譯
$ gcc hello_nomain.c -nostartfiles -e nomain -o hello_nomain
其中-e選項可以指定程序入口符號,查看符號表如下
$ readelf -s hello_nomain | grep FUNC
Num: Value Size Type Bind Vis Ndx Name
20: 0000000000000000 0 FUNC GLOBAL DEFAULT UND puts@@GLIBC_2.2.5
21: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@@GLIBC_2.2.5
22: 0000000000400350 24 FUNC GLOBAL DEFAULT 10 nomain
對比hello_start的符號表發現只是將_start換成了nomain到這里我們就很清楚了,程序默認的入口是標準庫里的_start函數,它會做一些初始化工作,調用用戶的main函數,最后再做一些清理工作,我們可以自己寫_start函數來覆蓋標準庫里的_start,甚至可以自己指定程序的入口