進程控制之fork函數

2024-06-28 13:28:36

字體：大中小

來源：轉載

供稿：網友

進程控制之fork函數

一個現有進程可以調用fork函數創建一個新進程。

#include <unistd.h>pid_t fork( void );返回值：子進程中返回0，父進程中返回子進程ID，出錯返回-1

由fork創建的新進程被稱為子進程（child PRocess）。fork函數被調用一次，但返回兩次。兩次返回的唯一區別是子進程的返回值是0，而父進程的返回值則是新子進程的進程ID。將子進程ID返回給父進程的理由是：因為一個進程的子進程可以有多個，并且沒有一個函數使一個進程可以獲得其所有子進程的進程ID。fork使子進程得到返回值0的理由是：一個進程只會有一個父進程，所以子進程總是可以調用getppid以獲得其父進程的進程ID（進程ID 0總是由內核交換進程使用，所以一個子進程的進程ID不可能為0）。

子進程和父進程繼續執行fork調用之后的指令。子進程是父進程的副本。例如，子進程獲得父進程的數據空間、堆和棧的副本。注意，這是子進程所擁有的副本。父、子進程并不共享這些存儲空間部分。父、子進程共享正文段（text，代碼段）。

由于在fork之后經常跟隨著exec，所以現在的很多實現并不執行一個父進程數據段、棧和堆的完全復制。作為替代，使用了寫時復制（Copy-On-Write，COW）技術。這些區域由父、子進程共享，而且內核將它們的訪問權限改變為只讀的。如果父、子進程中的任一個試圖修改這些區域，則內核只為修改區域的那塊內存制作一個副本，通常是虛擬存儲器系統中的一“頁”。

linux 2.4.22提供了另一種新進程創建函數——clone（2）系統調用。這是一種fork的泛型，它允許調用者控制哪些部分由父、子進程共享。

程序清單8-1中的程序演示了fork函數，從中可以看到子進程對變量所作的改變并不影響父進程中該變量的值。

程序清單8-1 fork函數示例

[root@localhost apue]# cat prog8-1.c#include "apue.h"int     glob = 6;       /* external variable in initialized data */char    buf[] = "a write to stdout/n";intmain(void){        int     var;    /* automatic variable on the stack */        pid_t   pid;        var = 88;        if(write(STDOUT_FILENO, buf, sizeof(buf) - 1) != sizeof(buf) -1)                err_sys("write error");        printf("before fork/n");        /* we don't flush stdout */        if((pid = fork()) < 0)        {                err_sys("fork error");        }        else if(pid == 0)       /* child */        {                glob++;         /* modify variables */                var++;        }        else        {                sleep(2);       /* parent */        }        printf("pid = %d, glob = %d, var = %d/n", getpid(), glob, var);        exit(0);}

如果執行此程序則得到：

[root@localhost apue]# ./prog8-1a write to stdoutbefore forkpid = 13367, glob = 7, var = 89    子進程的變量值改變了pid = 13366, glob = 6, var = 88    父進程的變量值沒有改變[root@localhost apue]# ./prog8-1 > tmp.out[root@localhost apue]# cat tmp.outa write to stdoutbefore forkpid = 13369, glob = 7, var = 89before forkpid = 13368, glob = 6, var = 88

一般來說，在fork之后是父進程先執行還是子進程先執行是不確定的。這取決于內核所使用的調度算法。如果要求父、子進程之間相互同步，則要求某種形式的進程間通信。

當寫到標準輸出時，我們將buf長度減去1作為輸出字節數，這是為了避免將終止null字節寫出。strlen計算不包括終止null字節的字符串長度，而sizeof則計算包括終止null字節的緩沖區長度。兩者之間的另一個差別是，使用strlen需進行一次函數調用，而對于sizeof而言，因為緩沖區已用已知字符串進行了初始化，其長度是固定的，所以sizeof在編譯時計算緩沖區長度。

注意程序清單8-1中fork與I/O函數之間的交互關系。write函數是不帶緩沖的。因為在fork之前調用write，所以其數據寫到標準輸出一次。但是標準I/O庫是帶緩沖的（這里用到了標準I/O庫的printf函數）。如果標準輸出連到終端設備，則它是行緩沖的，否則它是全緩沖的。當以交互方式運行該程序時（此時是行緩沖的），只得到該printf輸出的行一次，其原因是標準輸出緩沖區在fork之前已由換行符沖洗。但是當將標準輸出重定向到一個文件時（此時是全緩沖的），卻得到printf輸出行兩次。其原因是，在fork之前調用了printf一次，但當調用fork時，該行數據仍在緩沖區中（我們沒有用fflush沖洗緩沖區），然后在將父進程數據空間復制到子進程中時，該緩沖區也被復制到子進程中。于是那時父、子進程各自有了帶該行內容的標準I/O緩沖區。（子進程復制父進程緩沖區對程序的影響實例解析可參考：http://blog.csdn.net/lollipop_jin/article/details/8774057）在exit之前的第二個printf將其數據添加到現有的緩沖區中。當每個進程終止時，最終會沖洗其緩沖區中的副本。

文件共享

對程序清單8-1需注意的另一點是：在重定向父進程的標準輸出時，子進程的標準輸出也被重定向。實際上，fork的一個特性是父進程的所有打開文件描述符都被復制到子進程中。父、子進程的每個相同的打開描述符共享一個文件表項。

考慮下述情況，一個進程具有三個不同的打開文件，它們是標準輸入、標準輸出和標準出錯。在從fork返回時，我們有了如圖8-1所示的結構。

8-share-file