第3章 深入理解init
本章主要内容
· 深入分析init。
本章涉及的源代码文件名及位置
下面是本章分析的源码文件名及其位置。
· init.c
system/core/init/init.c
· parser.c
system/core/init/parser.c
· builtins.c
system/core/init/builtins.c
· keywords.h
system/core/init/keywords/h
· init.rc
system/core/rootdir/init.rc
· properties_service.c
system/core/init/properties_service.c
· libc_init_dynamic.c
bionic/libc/bionic/libc_init_common.c
· libc_init_common.c
bionic/libc/bionic/libc_init_common.c
· properties.c
system/core/libcutils/properties.c
3.1 概述
init是一个进程,确切地说,它是Linux系统中用户空间的第一个进程。由于Android是基于Linux内核的,所以init也是Android系统中用户空间的第一个进程,它的进程号是1。作为天字第一号的进程,init被赋予了很多极其重要的工作职责,本章将关注其中两个比较重要的职责:
· init进程负责创建系统中的几个关键进程,尤其是下一章要介绍的Zygote,它更是Java世界的开创者。那么,init进程是如何创建Zygote的呢?
· Android系统有很多属性,于是init就提供了一个property service(属性服务)来管理它们。那么这个属性服务是怎么工作的呢?
如上所述,本章将通过下面两方面内容来分析init:
· init如何创建zygote。
· init的属性服务是如何工作的。
3.2 init分析
init进程的入口函数是main,它的代码如下所示:
[-->init.c]
int main(int argc, char **argv)
{
intdevice_fd = -1;
intproperty_set_fd = -1;
intsignal_recv_fd = -1;
intkeychord_fd = -1;
int fd_count;
ints[2];
intfd;
structsigaction act;
chartmp[PROP_VALUE_MAX];
structpollfd ufds[4];
char*tmpdev;
char*debuggable;
//设置子进程退出的信号处理函数,该函数为sigchld_handler。
act.sa_handler = sigchld_handler;
act.sa_flags= SA_NOCLDSTOP;
act.sa_mask = 0;
act.sa_restorer = NULL;
sigaction(SIGCHLD, &act, 0);
......//创建一些文件夹,并挂载设备,这些是和Linux相关的,不拟做过多讨论。
mkdir("/dev/socket", 0755);
mount("devpts", "/dev/pts", "devpts", 0,NULL);
mount("proc", "/proc", "proc", 0, NULL);
mount("sysfs", "/sys", "sysfs", 0, NULL);
//重定向标准输入/输出/错误输出到/dev/_null_。
open_devnull_stdio();
/*
设置init的日志输出设备为/dev/__kmsg__,不过该文件打开后,会立即被unlink了,
这样,其他进程就无法打开这个文件读取日志信息了。
*/
log_init();
//上面涉及很多和Linux系统相关的知识,不熟悉的读者可自行研究,它们不影响我们的分析
//解析init.rc配置文件
parse_config_file("/init.rc");
......
//下面这个函数通过读取/proc/cpuinfo得到机器的Hardware名,我的HTCG7手机为bravo。
get_hardware_name();
snprintf(tmp,sizeof(tmp), "/init.%s.rc", hardware);
//解析这个和机器相关的配置文件,我的G7手机对应文件为init.bravo.rc。
parse_config_file(tmp);
/*
解析完上述两个配置文件后,会得到一系列的Action(动作),下面两句代码将执行那些处于
early-init阶段的Action。init将动作执行的时间划分为四个阶段:early-init、init、
early-boot、boot。由于有些动作必须在其他动作完成后才能执行,所以就有了先后之分。哪些
动作属于哪个阶段由配置文件决定。后面会介绍配置文件的相关知识。
*/
action_for_each_trigger("early-init", action_add_queue_tail);
drain_action_queue();
/*
创建利用Uevent和Linux内核交互的socket。关于Uevent的知识,第9章中对
Vold进行分析时会做介绍。
*/
device_fd = device_init();
//初始化和属性相关的资源
property_init();
//初始化/dev/keychord设备,这和调试有关,本书不讨论它的用法。读者可以自行研究,
//内容比较简单。
keychord_fd = open_keychord();
......
/*
INIT_IMAGE_FILE定义为”/initlogo.rle”,下面这个函数将加载这个文件作为系统的开机
画面,注意,它不是开机动画控制程序bootanimation加载的开机动画文件。
*/
if(load_565rle_image(INIT_IMAGE_FILE) ) {
/*
如果加载initlogo.rle文件失败(可能是没有这个文件),则会打开/dev/ty0设备,并
输出”ANDROID”的字样作为开机画面。在模拟器上看到的开机画面就是它。
*/
......
}
}
if(qemu[0])
import_kernel_cmdline(1);
......
//调用property_set函数设置属性项,一个属性项包括属性名和属性值。
property_set("ro.bootloader", bootloader[0] ? bootloader :"unknown");
......//执行位于init阶段的动作
action_for_each_trigger("init", action_add_queue_tail);
drain_action_queue();
//启动属性服务
property_set_fd = start_property_service();
/*
调用socketpair函数创建两个已经connect好的socket。socketpair是Linux的系统调用,
不熟悉的读者可以利用man socketpair查询相关信息。后面就会知道它们的用处了。
*/
if(socketpair(AF_UNIX, SOCK_STREAM, 0, s) == 0) {
signal_fd = s[0];
signal_recv_fd = s[1];
......
}
......
//执行配置文件中early-boot和boot阶段的动作。
action_for_each_trigger("early-boot", action_add_queue_tail);
action_for_each_trigger("boot", action_add_queue_tail);
drain_action_queue();
......
//init关注来自四个方面的事情。
ufds[0].fd= device_fd;//device_fd用于监听来自内核的Uevent事件
ufds[0].events = POLLIN;
ufds[1].fd = property_set_fd;//property_set_fd用于监听来自属性服务器的事件
ufds[1].events= POLLIN;
//signal_recv_fd由socketpair创建,它的事件来自另外一个socket。
ufds[2].fd = signal_recv_fd;
ufds[2].events = POLLIN;
fd_count = 3;
if(keychord_fd > 0) {
//如果keychord设备初始化成功,则init也会关注来自这个设备的事件。
ufds[3].fd = keychord_fd;
ufds[3].events = POLLIN;
fd_count++;
}
......
#if BOOTCHART
......//与Boot char相关,不做讨论了。
/*
Boot chart是一个小工具,它能对系统的性能进行分析,并生成系统启动过程的图表,
以提供一些有价值的信息,而这些信息最大的用处就是帮助提升系统的启动速度。
*/
#endif
for(;;) {
//从此init将进入一个无限循环。
int nr, i, timeout = -1;
for (i = 0; i < fd_count; i++)
ufds[i].revents = 0;
//在循环中执行动作
drain_action_queue();
restart_processes(); //重启那些已经死去的进程
......
#if BOOTCHART
...... // Boot Chart相关
#endif
//调用poll等待一些事情的发生
nr= poll(ufds, fd_count, timeout);
......
//ufds[2]保存的是signal_recv_fd,用于接收来自socket的消息。
if(ufds[2].revents == POLLIN) {
//有一个子进程去世,init要处理这个事情
read(signal_recv_fd, tmp, sizeof(tmp));
while (!wait_for_one_process(0))
;
continue;
}
if(ufds[0].revents == POLLIN)
handle_device_fd(device_fd);//处理Uevent事件
if(ufds[1].revents == POLLIN)
handle_property_set_fd(property_set_fd);//处理属性服务的事件。
if(ufds[3].revents == POLLIN)
handle_keychord(keychord_fd);//处理keychord事件。
}
return0;
}
从上面的代码中可知,init的工作任务还是很重的。上面的代码虽已省略了不少行,可结果还是很长,不过从本章要分析的两个知识点来看,可将init的工作流程精简为以下四点:
· 解析两个配置文件,其中,将分析对init.rc文件的解析。
· 执行各个阶段的动作,创建Zygote的工作就是在其中的某个阶段完成的。
· 调用property_init初始化属性相关的资源,并且通过property_start_service启动属性服务。
· init进入一个无限循环,并且等待一些事情的发生。重点关注init如何处理来自socket和来自属性服务器相关的事情。
精简工作流程,是以后分析代码时常用的方法。读者在分析代码的过程中,也可使用这种方法。
3.2.1 解析配置文件
根据上面的代码可知,在init中会解析两个配置文件,其中一个是系统配置文件init.rc,另外一个是和硬件平台相关的配置文件。以HTC G7手机为例,这个配置文件名为init.bravo.rc,其中bravo是硬件平台的名称。对这两个配置文件进行解析,调用的是同一个parse_config_file函数。下面就来看这个函数,在分析过程中以init.rc为主。
[-->parser.c]
int parse_config_file(const char *fn)
{
char *data;
data = read_file(fn, 0);//读取配置文件的内容,这个文件是init.rc。
if (!data) return -1;
parse_config(fn,data); //调用parse_config做真正的解析
return 0;
}
读取完文件的内容后,将调用parse_config进行解析,这个函数的代码如下所示:
[-->parser.c]
static void parse_config(const char *fn, char*s)
{
struct parse_state state;
char *args[SVC_MAXARGS];
int nargs;
nargs = 0;
state.filename = fn;
state.line = 1;
state.ptr = s;
state.nexttoken = 0;
state.parse_line = parse_line_no_op; //设置解析函数,不同的内容用不同的解析函数
for (;;) {
switch(next_token(&state)) {
case T_EOF:
state.parse_line(&state, 0, 0);
return;
caseT_NEWLINE:
if (nargs) {
//得到关键字的类型
int kw = lookup_keyword(args[0]);
if (kw_is(kw, SECTION)) { //判断关键字类型是不是SECTION。
state.parse_line(&state,0, 0);
parse_new_section(&state,kw, nargs, args);//解析这个SECTION。
} else {
state.parse_line(&state, nargs, args);
}
nargs = 0;
}
break;
case T_TEXT:
......
break;
}
}
}
上面就是parse_config函数,代码虽短,实际却比较复杂。从整体来说,parse_config首先会找到配置文件的一个section,然后针对不同的 section使用不同的解析函数来解析。那么,什么是section呢?这和init.rc文件的组织结构有关。先不必急着去看init.rc,还是先到代码中去寻找答案。
1. 关键字定义
keywords.h这个文件定义了init中使用的关键字,它的用法很有意思,先来看这个文件,代码如下所示:
[-->keywords.h]
#ifndef KEYWORD //如果没有定义KEYWORD宏,则走下面的分支
......//声明一些函数,这些函数就是前面所说Action的执行函数。
int do_class_start(int nargs, char **args);
int do_class_stop(int nargs, char **args);
......
int do_restart(int nargs, char **args);
......
#define __MAKE_KEYWORD_ENUM__ //定义一个宏
/*
定义KEYWORD宏,虽然有四个参数,不过这里只用第一个,其中K_##symbol中的##表示连接
的意思,即最后得到的值为K_symbol。symbol其实就是init.rc中的关键字
*/
#define KEYWORD(symbol, flags, nargs, func)K_##symbol,
enum { //定义一个枚举,这个枚举定义了各个关键字的枚举值。
K_UNKNOWN,
#endif
......
//根据上面KEYWORD的定义,这里将得到一个枚举值K_class,
KEYWORD(class, OPTION, 0, 0)
KEYWORD(class_start, COMMAND, 1, do_class_start)//K_class_start,
KEYWORD(class_stop, COMMAND, 1, do_class_stop)//K_class_stop,
KEYWORD(on, SECTION, 0, 0)//K_on,
KEYWORD(oneshot, OPTION, 0, 0)
KEYWORD(onrestart, OPTION, 0, 0)
KEYWORD(restart, COMMAND, 1,do_restart)
KEYWORD(service, SECTION, 0,0)
......
KEYWORD(socket, OPTION, 0, 0)
KEYWORD(start, COMMAND, 1,do_start)
KEYWORD(stop, COMMAND, 1,do_stop)
......
#ifdef __MAKE_KEYWORD_ENUM__
KEYWORD_COUNT,
};
#undef __MAKE_KEYWORD_ENUM__
#undef KEYWORD //取消KEYWORD宏定义
#endif
keywords.h好像没什么奇特,不过是个简单的头文件。为什么说它的用法很有意思呢?来看代码中是如何使用它的,如下所示:
[-->parser.c]
......//parser.c中将包含keywords.h头文件,而且还不只一次!!
//第一次包含keywords.h,根据keywords.h的代码,我们首先会得到一个枚举定义
#include "keywords.h"
/*
重新定义KEYWORD宏,这回四个参数全用上了,看起来好像是一个结构体。其中#symbol表示
一个字符串,其值为“symbol”。
*/
#define KEYWORD(symbol, flags, nargs, func) \
[K_##symbol ] = { #symbol, func, nargs + 1, flags, },
//定义一个结构体keyword_info数组,它用来描述关键字的一些属性,请注意里面的注释内容。
struct {
constchar *name; //关键字的名。
int(*func)(int nargs, char **args);//对应关键字的处理函数。
unsignedchar nargs;//参数个数,每个关键字的参数个数是固定的。
//关键字的属性,有三种属性,COMMAND、OPTION和SECTION。其中COMMAND有对应的处理函数
unsigned char flags;
} keyword_info[KEYWORD_COUNT] = {
[ K_UNKNOWN ] = { "unknown", 0, 0, 0},
/*
第二次包含keywords.h,由于已经重新定了KEYWORD宏,所以以前那些作为枚举值的关键字
现在变成keyword_info数组的索引了。
*/
#include "keywords.h"
};
#undef KEYWORD
//一些辅助宏,帮助我们快速操作keyword_info中的内容。
#define kw_is(kw, type) (keyword_info[kw].flags& (type))
#define kw_name(kw) (keyword_info[kw].name)
#define kw_func(kw) (keyword_info[kw].func)
#define kw_nargs(kw) (keyword_info[kw].nargs)
现在领略了keywords.h的神奇之处了吧?原来它干了两件事情:
· 第一次包含keyworks.h时,它声明了一些诸如do_classstart这样的函数,另外还定义了一个枚举,枚举值为K_class,K_mkdir等关键字。
· 第二次包含keywords.h后,得到了一个keyword_info结构体数组,这个keyword_info结构体数组以前面定义的枚举值为索引,存储对应的关键字信息,这些信息包括关键字名、处理函数、处理函数的参数个数,以及属性。
目前,关键字信息中最重要的就是symbol和flags了。什么样的关键字被认为是section呢?根据keywords.h的定义,symbol为下面两个的关键字表示section:
KEYWORD(on, SECTION, 0, 0)
KEYWORD(service, SECTION, 0, 0)
有了上面的知识,再来看配置文件init.rc的内容。
2. init.rc的解析
init.rc的内容如下所示:(我们截取了部分内容,注意,其中的注释符号是#。)
[-->init.rc]
on init #根据上面的分析,on关键字标示一个section,对应的名字是”init”
...... #下面所有的内容都属于这个section,直到下一个section开始时。
exportPATH /sbin:/system/sbin:/system/bin:/system/xbin
exportLD_LIBRARY_PATH /system/lib
exportANDROID_BOOTLOGO 1 #根据keywords.h的定义,export表示一个COMMAND
export ANDROID_ROOT /system
exportANDROID_ASSETS /system/app
...... #省略部分内容
on boot #这是一个新的section,名为”boot”
ifup lo#这是一个COMMAND
hostname localhost
domainname localdomain
......
#class_start也是一个COMMAND,对应函数为do_class_start,很重要,切记。
class_startdefault
......
#下面这个section的意思是:待属性persist.service.adb.enable的值变为1后,
#需要执行对应的COMMAND,这个COMMAND是start adbd
onproperty:persist.service.adb.enable=1
start adbd //start是一个COMMAND
on property:persist.service.adb.enable=0
stopadbd
......
#service也是section的标示,对应section的名为“zygote“
service zygote /system/bin/app_process -Xzygote/system/bin –zygote \
--start-system-server
socketzygote stream 666 #socket关键字表示OPTION
onrestart write /sys/android_power/request_state wake #onrestart也是OPTION
onrestart write /sys/power/state on
onrestart restart media
#一个section,名为”media”
service media /system/bin/mediaserver
usermedia
groupsystem audio camera graphics inet net_bt net_bt_admin net_raw
iopriort 4
从上面对init.rc的分析中可知:
· 一个section的内容从这个标示section的关键字开始,到下一个标示section的地方结束。
· init.rc中出现了名为boot和init的section,这里的boot和init,就是前面介绍的动作执行四个阶段中的boot和init。也就是说,在boot阶段执行的动作都是由boot这个section定义的。
另外还可发现,zygote被放在了一个servicesection中。下面以zygote这个section为例,介绍service是如何解析的。
3.2.2 解析service
zygote对应的service section内容是:
[-->init.rc::zygote]
service zygote /system/bin/app_process -Xzygote/system/bin –zygote \ --start-system-server
socketzygote stream 666 #socket是OPTION
#下面的onrestart是OPTION,而write和restart是COMMAND
onrestartwrite /sys/android_power/request_state wake
onrestart write /sys/power/state on
onrestartrestart media
解析section的入口函数是parse_new_section,它的代码如下所示:
[-->parser.c]
void parse_new_section(struct parse_state*state, int kw,
int nargs, char **args)
{
switch(kw) {
caseK_service: //解析service,用parse_service和parse_line_service
state->context = parse_service(state, nargs, args);
if(state->context) {
state->parse_line = parse_line_service;
return;
}
break;
caseK_on: //解析on section
......//读者可以自己研究
break;
}
state->parse_line = parse_line_no_op;
}
其中,service解析时,用到了parse_service和parse_line_service两个函数,在分别介绍它们之前,先看init是如何组织这个service的。
1. service结构体
init中使用了一个叫service的结构体来保存和service section相关的信息,不妨来看这个结构体,代码如下所示:
[-->init.h::service结构体定义]
struct service {
//listnode是一个特殊的结构体,在内核代码中用得非常多,主要用来将结构体链接成一个
//双向链表。init中有一个全局的service_list,专门用来保存解析配置文件后得到的service。
struct listnode slist;
constchar *name; //service的名字,对应我们这个例子就是”zygote”。
constchar *classname; //service所属class的名字,默认是”defult”
unsigned flags;//service的属性
pid_tpid; //进程号
time_ttime_started; //上一次启动的时间
time_ttime_crashed; //上一次死亡的时间
intnr_crashed; //死亡次数
uid_tuid; //uid,gid相关
gid_tgid;
gid_tsupp_gids[NR_SVC_SUPP_GIDS];
size_tnr_supp_gids;
/*
有些service需要使用socket,下面这个socketinfo用来描述socket的相关信息。
我们的zygote也使用了socket,配置文件中的内容是socket zygote stream 666。
它表示将创建一个AF_STREAM类型的socket(其实就是TCP socket),该socket的名为“zygote”,
读写权限是666。
*/
structsocketinfo *sockets;
//service一般运行在单独的一个进程中,envvars用来描述创建这个进程时所需的环境变量信息。
structsvcenvinfo *envvars;
/*
虽然关键字onrestart标示一个OPTION,可是这个OPTION后面一般跟着COMMAND,
下面这个action结构体可用来存储command信息,马上就会分析到它。
*/
structaction onrestart;
//和keychord相关的内容
int*keycodes;
intnkeycodes;
intkeychord_id;
//io优先级设置
intioprio_class;
intioprio_pri;
//参数个数
intnargs;
//用于存储参数
char*args[1];
};
我们现在已了解的service的结构体,相对来说还算是清晰易懂的。而zygote中的那三个onrestart该怎么表示呢?请看service中使用的这个action结构体:
[-->init.h::action结构体定义]
struct action {
/*
一个action结构体可存放在三个双向链表中,其中alist用于存储所有action,
qlist用于链接那些等待执行的action,tlist用于链接那些待某些条件满足后
就需要执行的action。
*/
structlistnode alist;
structlistnode qlist;
structlistnode tlist;
unsigned hash;
constchar *name;
//这个OPTION对应的COMMAND链表,以zygote为例,它有三个onrestart option,所以
//它对应会创建三个command结构体。
structlistnode commands;
structcommand *current;
};
了解了上面的知识后,你是否能猜到parse_service和parse_line_service的作用了呢?马上就来看它们。
2. parse_service
parse_service的代码如下所示:
[-->parser.c]
static void *parse_service(struct parse_state*state, int nargs, char **args)
{
structservice *svc; //声明一个service结构体
......
//init维护了一个全局的service链表,先判断是否已经有同名的service了。
svc =service_find_by_name(args[1]);
if(svc) {
...... //如果有同名的service,则不能继续后面的操作。
return 0;
}
nargs-= 2;
svc =calloc(1, sizeof(*svc) + sizeof(char*) * nargs);
......
svc->name = args[1];
svc->classname= "default";//设置classname为”default”,这个很关键!
memcpy(svc->args, args + 2, sizeof(char*) * nargs);
svc->args[nargs] = 0;
svc->nargs = nargs;
svc->onrestart.name= "onrestart";
list_init(&svc->onrestart.commands);
//把zygote这个service加到全局链表service_list中。
list_add_tail(&service_list, &svc->slist);
returnsvc;
}
parse_service函数只是搭建了一个service的架子,具体的内容尚需由后面的解析函数来填充。来看service的另外一个解析函数parse_line_service。
3. parse_line_service
parse_line_service的代码如下所示:
[-->parser.c]
static void parse_line_service(structparse_state *state, int nargs,
char **args)
{
structservice *svc = state->context;
structcommand *cmd;
int i,kw, kw_nargs;
......
svc->ioprio_class = IoSchedClass_NONE;
//其实还是根据关键字来做各种处理。
kw =lookup_keyword(args[0]);
switch(kw) {
caseK_capability:
break;
caseK_class:
if(nargs != 2) {
......
}else {
svc->classname = args[1];
}
break;
......
caseK_oneshot:
/*
这是service的属性,它一共有五个属性,分别为:
SVC_DISABLED:不随class自动启动。下面将会看到class的作用。
SVC_ONESHOT:退出后不需要重启,也就是这个service只启动一次就可以了。
SVC_RUNNING:正在运行,这是service的状态。
SVC_RESTARTING:等待重启,这也是service的状态。
SVC_CONSOLE:该service需要使用控制台 。
SVC_CRITICAL:如果在规定时间内该service不断重启,则系统会重启并进入恢复模式。
zygote没有使用任何属性,这表明它:会随着class的处理自动启动;
退出后会由init重启;不使用控制台;即使不断重启也不会导致系统进入恢复模式。
*/
svc->flags |= SVC_ONESHOT;
break;
caseK_onrestart: //根据onrestart的内容,填充action结构体的内容
nargs--;
args++;
kw= lookup_keyword(args[0]);
......
//创建command结构体
cmd = malloc(sizeof(*cmd) + sizeof(char*) * nargs);
cmd->func = kw_func(kw);
cmd->nargs = nargs;
memcpy(cmd->args, args, sizeof(char*) * nargs);
//把新建的command加入到双向链表中。
list_add_tail(&svc->onrestart.commands, &cmd->clist);
break;
......
caseK_socket: { //创建socket相关信息
struct socketinfo *si;
......
si= calloc(1, sizeof(*si));
if(!si) {
parse_error(state, "out of memory\n");
break;
}
si->name = args[1]; //socket的名字
si->type = args[2]; //socket的类型
si->perm = strtoul(args[3], 0, 8); //socket的读写权限
if(nargs > 4)
si->uid = decode_uid(args[4]);
if(nargs > 5)
si->gid = decode_uid(args[5]);
si->next = svc->sockets;
svc->sockets = si;
break;
}
......
default:
parse_error(state, "invalid option '%s'\n", args[0]);
}
}
parse_line_service将根据配置文件的内容填充service结构体,那么,zygote解析完后会得到什么呢?图3-1表示了zygote解析后的结果:
图3-1 zygote解析结果示意图
从上图中可知:
· service_list链表将解析后的service全部链接到了一起,并且是一个双向链表,前向节点用prev表示,后向节点用next表示。
· socketinfo也是一个双向链表,因为zygote只有一个socket,所以画了一个虚框socket做为链表的示范。
· onrestart通过commands指向一个commands链表,zygote有三个commands。
zygote这个service解析完了,现在就是“万事俱备,只欠东风”了。接下来要了解的是,init是如何控制service的。
3.2.3 init控制service
先看service是如何启动的。
1.启动zygote
init.rc中有这样一句话:
#class_start是一个COMMAND,对应的函数为do_class_start,很重要,切记。
class_startdefault
class_start标示一个COMMAND,对应的处理函数为do_class_start,它位于boot section的范围内。为什么说它很重要呢?
还记得init进程中的四个执行阶段吗?当init进程执行到下面几句话时,do_class_start就会被执行了。
//将bootsection节的command加入到执行队列
action_for_each_trigger("boot",action_add_queue_tail);
//执行队列里的命令,class可是一个COMMAND,所以它对应的do_class_start会被执行。
drain_action_queue();
下面来看do_class_start函数:
[-->builtins.c]
int do_class_start(int nargs, char **args)
{
/*
args为do_class_start的参数,init.rc中只有一个参数,就是default。
下面这个函数将从service_list中寻找classname为”default”的service,然后
调用service_start_if_not_disabled函数。现在读者明白了service结构体中
classname的作用了吗?
*/
service_for_each_class(args[1],service_start_if_not_disabled);
return 0;
}
我们已经知道,zygote这个service的classname的值就是“default”,所以会针对这个service调用service_start_if_not_disabled,这个函数的代码是:
[-->parser.c]
static void service_start_if_not_disabled(structservice *svc)
{
if (!(svc->flags & SVC_DISABLED)) {
service_start(svc,NULL); //zygote可没有设置SVC_DISABLED
}
}
service_start函数的代码如下所示:
[-->init.c]
void service_start(struct service *svc, constchar *dynamic_args)
{
structstat s;
pid_tpid;
intneeds_console;
int n;
svc->flags &= (~(SVC_DISABLED|SVC_RESTARTING));
svc->time_started = 0;
if(svc->flags & SVC_RUNNING) {
return;//如果这个service已在运行,则不用处理
}
/*
service一般运行于另外一个进程中,这个进程也是init的子进程,所以启动service前需要判断
对应的可执行文件是否存在,zygote对应的可执行文件是/system/bin/app_process
*/
if(stat(svc->args[0], &s) != 0) {
svc->flags |= SVC_DISABLED;
return;
}
......
pid =fork(); //调用fork创建子进程
if(pid == 0) {
//pid为零,我们在子进程中
struct socketinfo *si;
struct svcenvinfo *ei;
char tmp[32];
int fd, sz;
//得到属性存储空间的信息并加到环境变量中,后面在属性服务一节中会碰到使用它的地方。
get_property_workspace(&fd, &sz);
add_environment("ANDROID_PROPERTY_WORKSPACE", tmp);
//添加环境变量信息
for (ei = svc->envvars; ei; ei = ei->next)
add_environment(ei->name, ei->value);
//根据socketinfo创建socket
for (si = svc->sockets; si; si = si->next) {
int s = create_socket(si->name,
!strcmp(si->type,"dgram") ?
SOCK_DGRAM :SOCK_STREAM,
si->perm,si->uid, si->gid);
if (s >= 0) {
//在环境变量中添加socket信息。
publish_socket(si->name, s);
}
}
......//设置uid,gid等
setpgid(0, getpid());
if(!dynamic_args) {
/*
执行/system/bin/app_process,这样就进入到app_process的main函数中了。
fork、execve这两个函数都是Linux系统上常用的系统调用。
*/
if (execve(svc->args[0], (char**)svc->args, (char**) ENV) < 0) {
......
}
}else {
......
}
......//父进程init的处理,设置service的信息,如启动时间、进程号,以及状态等。
svc->time_started = gettime();
svc->pid = pid;
svc->flags |= SVC_RUNNING;
//每一个service都有一个属性,zygote的属性为init.svc.zygote,现在设置它的值为running
notify_service_state(svc->name, "running");
}
原来,zygote是通过fork和execv共同创建的!但service结构中的那个onrestart好像没有派上用场,原因何在?
2. 重启zygote
根据名字,就可猜到onrestart应该是在zygote重启时用的。下面先看在zygote死后,它的父进程init会有什么动作:
[-->init.c]
static void sigchld_handler(int s)
{ //当子进程退出时,init的这个信号处理函数会被调用
write(signal_fd, &s, 1); //往signal_fd write数据
}
signal_fd,就是在init中通过socketpair创建的两个socket中的一个,既然会往这个signal_fd中发送数据,那么另外一个socket就一定能接收到,这样就会导致init从poll函数中返回:
[-->init.rc::main函数代码片断]
nr =poll(ufds, fd_count, timeout);
......
if(ufds[2].revents == POLLIN) {
read(signal_recv_fd, tmp, sizeof(tmp));
while (!wait_for_one_process(0))//调用wait_for_one_process函数处理
;
continue;
}
......
//直接看这个wait_for_one_process函数:
static int wait_for_one_process(int block)
{
pid_tpid;
intstatus;
structservice *svc;
structsocketinfo *si;
time_tnow;
structlistnode *node;
structcommand *cmd;
while( (pid = waitpid(-1, &status, block ? 0 : WNOHANG)) == -1 &&
errno == EINTR );
if(pid <= 0) return -1;
//找到死掉的那个service,现在应该找到了代表zygote的那个service。
svc = service_find_by_pid(pid);
......
if(!(svc->flags & SVC_ONESHOT)) {
//杀掉zygote创建的所有子进程,这就是zygote死后,Java世界崩溃的原因。
kill(-pid, SIGKILL);
}
//清理socket信息,不清楚的读者可以通过命令man 7 AF_UNIX查询一下相关知识。
for(si = svc->sockets; si; si = si->next) {
char tmp[128];
snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s",si->name);
unlink(tmp);
}
svc->pid = 0;
svc->flags &= (~SVC_RUNNING);
if(svc->flags & SVC_ONESHOT) {
svc->flags |= SVC_DISABLED;
}
......
now= gettime();
/*
如果设置了SVC_CRITICAL标示,则4分钟内该服务重启次数不能超过4次,否则
机器会重启进入recovery模式。根据init.rc的配置,只有servicemanager进程
享有此种待遇。
*/
if(svc->flags & SVC_CRITICAL) {
if(svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) {
if (++svc->nr_crashed > CRITICAL_CRASH_THRESHOLD) {
......
sync();
__reboot(LINUX_REBOOT_MAGIC1,LINUX_REBOOT_MAGIC2,
LINUX_REBOOT_CMD_RESTART2, "recovery");
return 0;
}
}else {
svc->time_crashed = now;
svc->nr_crashed = 1;
}
}
svc->flags |= SVC_RESTARTING;
//设置标示为SVC_RESTARTING,然后执行该service onrestart中的COMMAND,这些内容就
//非常简单了,读者可以自行学习。
list_for_each(node, &svc->onrestart.commands) {
cmd = node_to_item(node, struct command, clist);
cmd->func(cmd->nargs, cmd->args);
}
//设置init.svc.zygote的值为restarting。
notify_service_state(svc->name, "restarting");
return0;
}
通过上面的代码,可知道onrestart的作用了,但zygote本身又在哪里重启的呢?答案就在下面的代码中:
[-->init.c::main函数代码片断]
for(;;) {
int nr, i, timeout = -1;
for (i = 0; i < fd_count; i++)
ufds[i].revents = 0;
drain_action_queue(); //poll函数返回后,会进入下一轮的循环
restart_processes(); //这里会重启所有flag标志为SVC_RESTARTING的service。
......
}
这样,zygote又回来了!
3.2.4 属性服务
我们知道,Windows平台上有一个叫注册表的东西。注册表可以存储一些类似key/value的键值对。一般而言,系统或某些应用程序会把自己的一些属性存储在注册表中,即使下次系统重启或应用程序重启,它还能够根据之前在注册表中设置的属性,进行相应的初始化工作。Android平台也提供了一个类型机制,可称之为属性服务(property service)。应用程序可通过这个属性机制,查询或设置属性。读者可以用adb shell登录到真机或模拟器上,然后用getprop命令查看当前系统中有哪些属性。即如我的HTC G7测试结果,如图3-2所示:(图中只显示了部分属性)
图3-2 HTC G7属性示意图
这个属性服务是怎么实现的呢?下面来看代码,其中与init.c和属性服务有关的代码有下面两行:
property_init();
property_set_fd = start_property_service();
分别来看看它们。
1. 属性服务初始化
(1)创建存储空间
先看property_init函数,代码如下所示:
[-->property_service.c]
void property_init(void)
{
init_property_area();//初始化属性存储区域
//加载default.prop文件
load_properties_from_file(PROP_PATH_RAMDISK_DEFAULT);
}
在properyty_init函数中,先调用init_property_area函数,创建一块用于存储属性的存储区域,然后加载default.prop文件中的内容。再看init_property_area是如何工作的,它的代码如下所示:
[-->property_service.c]
static int init_property_area(void)
{
prop_area *pa;
if(pa_info_array)
return -1;
/*
初始化存储空间,PA_SIZE是这块存储空间的总大小,为32768字节,pa_workspace
为workspace类型的结构体,下面是它的定义:
typedef struct {
void *data; //存储空间的起始地址
size_tsize; //存储空间的大小
int fd; //共享内存的文件描述符
} workspace;
init_workspace函数调用Android系统提供的ashmem_create_region函数创建一块
共享内存。关于共享内存的知识我们在第7章会接触,这里,只需把它当做一块普通的内存就
可以了。
*/
if(init_workspace(&pa_workspace, PA_SIZE))
return -1;
fcntl(pa_workspace.fd, F_SETFD, FD_CLOEXEC);
//在32768个字节的存储空间中,有PA_INFO_START(1024)个字节用来存储头部信息
pa_info_array = (void*) (((char*) pa_workspace.data) + PA_INFO_START);
pa =pa_workspace.data;
memset(pa, 0, PA_SIZE);
pa->magic = PROP_AREA_MAGIC;
pa->version = PROP_AREA_VERSION;
//__system_property_area__这个变量由bionic libc库输出,有什么用呢?
__system_property_area__ = pa;
return0;
}
上面的内容比较简单,不过最后的赋值语句可是大有来头。__system_property_area__是bionic libc库中输出的一个变量,为什么这里要给它赋值呢?
原来,虽然属性区域是由init进程创建,但Android系统希望其他进程也能读取这块内存里的东西。为做到这一点,它便做了以下两项工作:
· 把属性区域创建在共享内存上,而共享内存是可以跨进程的。这一点,已经在上面的代码中见到了,init_workspace函数内部将创建这个共享内存。
· 如何让其他进程知道这个共享内存呢?Android利用了gcc的constructor属性,这个属性指明了一个__libc_prenit函数,当bionic libc库被加载时,将自动调用这个__libc_prenit,这个函数内部就将完成共享内存到本地进程的映射工作。
(2)客户端进程获取存储空间
关于上面的内容,来看相关代码:
[-->libc_init_dynamic.c]
//constructor属性指示加载器加载该库后,首先调用__libc_prenit函数。这一点和Windows上
//动态库的DllMain函数类似
void __attribute__((constructor))__libc_prenit(void);
void __libc_prenit(void)
{
......
__libc_init_common(elfdata); //调用这个函数
......
}
__libc_init_common函数为:
[-->libc_init_common.c]
void __libc_init_common(uintptr_t *elfdata)
{
......
__system_properties_init();//初始化客户端的属性存储区域
}
[-->system_properties.c]
int __system_properties_init(void)
{
prop_area *pa;
int s,fd;
unsigned sz;
char*env;
.....
//还记得在启动zygote一节中提到的添加环境变量的地方吗?属性存储区域的相关信息
//就是在那儿添加的,这里需要取出来使用了。
env =getenv("ANDROID_PROPERTY_WORKSPACE");
//取出属性存储区域的文件描述符。关于共享内存的知识,第7章中将会进行介绍。
fd =atoi(env);
env =strchr(env, ',');
if(!env) {
return -1;
}
sz =atoi(env + 1);
//映射init创建的那块内存到本地进程空间,这样本地进程就可以使用这块共享内存了。
//注意,映射的时候指定了PROT_READ属性,所以客户端进程只能读属性,而不能设置属性。
pa =mmap(0, sz, PROT_READ, MAP_SHARED, fd, 0);
if(pa== MAP_FAILED) {
return -1;
}
if((pa->magic != PROP_AREA_MAGIC) || (pa->version !=PROP_AREA_VERSION)) {
munmap(pa, sz);
return -1;
}
__system_property_area__ = pa;
return0;
}
上面代码中很多地方和共享内存有关,在第7章中会对与共享内存有关问题进行介绍,读者也可先行学习有关共享内存的知识。
总之,通过这种方式,客户端进程可以直接读取属性空间,但没有权限设置属性。客户端进程又是如何设置属性呢?
2. 启动属性服务器
(1)启动属性服务器
init进程会启动一个属性服务器,而客户端只能通过和属性服务器交互才能设置属性。先来看属性服务器的内容,它由start_property_service函数启动,代码如下所示:
[-->Property_servie.c]
int start_property_service(void)
{
intfd;
/*
加载属性文件,其实就是解析这些文件中的属性,然后把它设置到属性空间中去。Android系统
一共提供了四个存储属性的文件,它们分别是:
#definePROP_PATH_RAMDISK_DEFAULT "/default.prop"
#define PROP_PATH_SYSTEM_BUILD "/system/build.prop"
#define PROP_PATH_SYSTEM_DEFAULT "/system/default.prop"
#define PROP_PATH_LOCAL_OVERRIDE "/data/local.prop"
*/
load_properties_from_file(PROP_PATH_SYSTEM_BUILD);
load_properties_from_file(PROP_PATH_SYSTEM_DEFAULT);
load_properties_from_file(PROP_PATH_LOCAL_OVERRIDE);
//有一些属性是需要保存到永久介质上的,这些属性文件则由下面这个函数加载,这些文件
//存储在/data/property目录下,并且这些文件的文件名必须以persist.开头。这个函数
//很简单,读者可自行研究。
load_persistent_properties();
//创建一个socket,用于IPC通信。
fd =create_socket(PROP_SERVICE_NAME, SOCK_STREAM, 0666, 0, 0);
if(fd< 0) return -1;
fcntl(fd, F_SETFD, FD_CLOEXEC);
fcntl(fd, F_SETFL, O_NONBLOCK);
listen(fd, 8);
returnfd;
}
属性服务创建了一个用来接收请求的socket,可这个请求在哪里被处理呢?事实上,在init中的for循环那里已经进行相关处理了。
(2)处理设置属性请求
接收请求的地方是在init进程中,代码如下所示:
[-->init.c::main函数片断]
if (ufds[1].revents == POLLIN)
handle_property_set_fd(property_set_fd);
当属性服务器收到客户端请求时,init会调用handle_property_set_fd进行处理。这个函数的代码如下所示:
[-->property_service.c]
void handle_property_set_fd(int fd)
{
prop_msg msg;
int s;
int r;
intres;
structucred cr;
structsockaddr_un addr;
socklen_t addr_size = sizeof(addr);
socklen_t cr_size = sizeof(cr);
//先接收TCP连接
if ((s= accept(fd, (struct sockaddr *) &addr, &addr_size)) < 0) {
return;
}
//取出客户端进程的权限等属性。
if(getsockopt(s, SOL_SOCKET, SO_PEERCRED, &cr, &cr_size) < 0) {
......
return;
}
//接收请求数据
r = recv(s,&msg, sizeof(msg), 0);
close(s);
......
switch(msg.cmd) {
casePROP_MSG_SETPROP:
msg.name[PROP_NAME_MAX-1] = 0;
msg.value[PROP_VALUE_MAX-1] = 0;
/*
如果是ctl开头的消息,则认为是控制消息,控制消息用来执行一些命令,例如用
adb shell登录后,输入setprop ctl.start bootanim就可以查看开机动画了,
关闭的话就输入setpropctl.stop bootanim,是不是很有意思呢?
*/
if(memcmp(msg.name,"ctl.",4) == 0) {
if (check_control_perms(msg.value, cr.uid, cr.gid)) {
handle_control_message((char*) msg.name + 4, (char*) msg.value);
}
......
}else {
//检查客户端进程是否有足够的权限
if (check_perms(msg.name, cr.uid, cr.gid)) {
//然后调用property_set设置。
property_set((char*) msg.name, (char*) msg.value);
}
......
}
break;
default:
break;
}
}
当客户端的权限满足要求时,init就调用property_set进行相关处理,这个函数比较简单,代码如下所示:
[-->property_service.c]
int property_set(const char *name, const char*value)
{
prop_area *pa;
prop_info *pi;
intnamelen = strlen(name);
intvaluelen = strlen(value);
......
//从属性存储空间中寻找是否已经存在该属性
pi =(prop_info*) __system_property_find(name);
if(pi!= 0) {
//如果属性名以ro.开头,则表示是只读的,不能设置,所以直接返回。
if(!strncmp(name, "ro.", 3)) return -1;
pa= __system_property_area__;
//更新该属性的值
update_prop_info(pi, value, valuelen);
pa->serial++;
__futex_wake(&pa->serial, INT32_MAX);
}else {
//如果没有找到对应的属性,则认为是增加属性,所以需要新创建一项。注意,Android支持
//最多247项属性,如果目前属性的存储空间中已经有247项,则直接返回。
pa= __system_property_area__;
if(pa->count == PA_COUNT_MAX) return -1;
pi= pa_info_array + pa->count;
pi->serial = (valuelen << 24);
memcpy(pi->name, name, namelen + 1);
memcpy(pi->value, value, valuelen +1);
pa->toc[pa->count] =
(namelen << 24) | (((unsigned) pi) - ((unsigned) pa));
pa->count++;
pa->serial++;
__futex_wake(&pa->serial, INT32_MAX);
}
//有一些特殊的属性需要特殊处理,这里,主要是以net.change开头的属性。
if(strncmp("net.", name, strlen("net.")) == 0) {
if(strcmp("net.change", name) == 0) {
return 0;
}
property_set("net.change", name);
} elseif (persistent_properties_loaded &&
strncmp("persist.", name,strlen("persist.")) == 0) {
//如果属性名以persist.开头,则需要把这些值写到对应文件中去。
write_persistent_property(name, value);
}
/*
还记得init.rc中的下面这句话吗?
on property:persist.service.adb.enable=1
startadbd
当persist.service.adb.enable属性置为1后,就会执行start adbd这个command,
这是通过property_changed函数来完成的,它非常简单,读者可以自己阅读。
*/
property_changed(name, value);
return0;
}
好,属性服务端的工作已经了解了,下面看客户端是如何设置属性的。
(3)客户端发送请求
客户端通过property_set发送请求,property_set由libcutils库提供,代码如下所示:
[-->properties.c]
int property_set(const char *key, const char*value)
{
prop_msg msg;
unsigned resp;
......
msg.cmd = PROP_MSG_SETPROP;//设置消息码为PROP_MSG_SETPROP。
strcpy((char*) msg.name, key);
strcpy((char*) msg.value, value);
//发送请求
returnsend_prop_msg(&msg);
}
static int send_prop_msg(prop_msg *msg)
{
int s;
int r;
//建立和属性服务器的socket连接
s =socket_local_client(PROP_SERVICE_NAME,
ANDROID_SOCKET_NAMESPACE_RESERVED,
SOCK_STREAM);
if(s< 0) return -1;
//通过socket发送出去
while((r = send(s, msg, sizeof(prop_msg), 0)) < 0) {
if((errno == EINTR) || (errno == EAGAIN)) continue;
break;
}
if(r== sizeof(prop_msg)) {
r= 0;
} else{
r= -1;
}
close(s);
returnr;
}
至此,属性服务器就介绍完了。总体来说,还算比较简单。
3.3 本章小结
本章讲解了init进程如何解析zygote,以及属性服务器的工作原理,旨在帮助读者认识这个天字号第一进程。从整体来说,init.rc的解析难度相对最大。相信读者通过以上实例分析,已经理解了init.rc的解析原理。另外,inti涉及很多和Linux系统相关的知识,有兴趣的读者可以自行研究。
版权声明:本文为博主原创文章,未经博主允许不得转载。