第5章深入理解常见类

本章主要内容

· 分析RefBase、sp，wp和LightRefBase类。

· 分析Native的Thread类和常用同步类。

· 分析Java层的Handler、Looper，以及HandlerThread类。

本章涉及的源代码文件名称及位置

下面是我们本章分析的源码文件名和它的位置。

· RefBase.h

framework/base/include/utils/RefBase.h

· RefBase.cpp

framework/base/libs/utils/RefBase.cpp

· Thread.cpp

framework/base/libs/utils/Thread.cpp

· Thread.h

framework/base/include/utils/Thread.h

· Atomic.h

system/core/include/cutils/Atomic.h

· AndroidRuntime.cpp

framework/base/core/jni/AndroidRuntime.cpp

· Looper.java

framework/base/core/Java/Android/os/Looper.java

· Handler.java

framework/base/core/Java/Android/os/Handler.java

· HandlerThread.java

framework/base/core/Java/Android/os/HandlerThread.java

5.1 综述

初次接触Android源码，最多见到的一定是sp和wp。如果你只是沉迷于Java世界，那么Looper和Handler也是避不开的。本章的目的，就是把经常碰见的这些内容中的“拦路虎”一网打尽，将它们彻底搞懂。至于弄明白它们有什么好处，就是仁者见仁，智者见智了。我个人觉得，可能Looper和Handler会相对更实用一些。

5.2 以“三板斧”揭秘RefBase、sp和wp

RefBase是Android中所有对象的始祖，类似MFC中的CObject及Java中的Object对象。在Android中，RefBase结合sp和wp，实现了一套通过引用计数的方法来控制对象生命周期的机制。就如我们想像的那样，这三者的关系非常暧昧。初次接触Android源码的人往往会被那个随处可见的sp和wp搞晕了头。

什么是sp和wp呢？其实，sp并不是我开始所想的smart pointer（C++语言中有这个东西），它真实的意思应该是strong pointer，而wp是weak pointer的意思。我认为，Android推出这一套机制可能是模仿Java，因为Java世界中有所谓weak reference之类的东西。sp和wp的目的，就是为了帮助健忘的程序员回收new出来的内存。

我还是喜欢赤裸裸地管理内存的分配和释放。不过，目前sp和wp的使用已经深入到Android系统的各个角落，想把它去掉真是不太可能了。

这三者的关系比较复杂，都说程咬金的“三板斧”很厉害，那么我们就借用这三板斧，揭密其相互间的暧昧关系。

5.2.1 第一板斧——初识影子对象

我们的“三板斧”，其实就是三个例子。相信这三板斧劈下去，你会很容易理解它们。

[-->例子1]

//类A从RefBase派生,RefBase是万物的始祖

class A：public RefBase

{

//A没有任何自己的功能

}

int main()

{

A* pA =new A;

{

//注意我们的sp，wp对象是在{}中创建的，下面的代码先创建sp，然后创建wp

sp<A>spA(A);

wp<A>wpA(spA);

//大括号结束前，先析构wp,再析构sp

}

例子够简单吧？但也需一步一步分析这斧子是怎么劈下去的。

1. RefBase和它的影子

类A从RefBase中派生。使用的是RefBase构造函数。代码如下所示：

[-->RefBase.cpp]

RefBase::RefBase()

:mRefs(new weakref_impl(this))//注意这句话

{

//mRefs是RefBase的成员变量，类型是weakref_impl，我们暂且叫它影子对象

//所以A有一个影子对象

}

mRefs是引用计数管理的关键类，需要进去观察。它是从RefBase的内部类weakref_type中派生出来的。

先看看它的声明：

class RefBase::weakref_impl : public RefBase::weakref_type

//从RefBase的内部类weakref_type派生

由于Android频繁使用C++内部类的方法，所以初次阅读Android代码时可能会有点不太习惯，C++的内部类和Java内部类相似，但不同的是，它需要一个显示的成员指向外部类对象，而Java内部类对象就有一个隐式的成员指向外部类对象。

说明：内部类在C++中的学名叫nested class（内嵌类）。

[-->RefBase.cpp::weakref_imple构造]

weakref_impl(RefBase* base)

:mStrong(INITIAL_STRONG_VALUE) //强引用计数，初始值为0x1000000

,mWeak(0) //弱引用计数，初始值为0

,mBase(base)//该影子对象所指向的实际对象

,mFlags(0)

,mStrongRefs(NULL)

,mWeakRefs(NULL)

,mTrackEnabled(!!DEBUG_REFS_ENABLED_BY_DEFAULT)

,mRetain(false)

{

}

如你所见，new了一个A对象后，其实还new了一个weakref_impl对象，这里称它为影子对象，另外我们称A为实际对象。

这里有一个问题：影子对象有什么用？

可以仔细想一下，是不是发现影子对象成员中有两个引用计数？一个强引用，一个弱引用。如果知道引用计数和对象生死有些许关联的话，就容易想到影子对象的作用了。

按上面的分析，在构造一个实际对象的同时，还会悄悄地构造一个影子对象，在嵌入式设备的内存不是很紧俏的今天，这个影子对象的内存占用已不成问题了。

2. sp上场

程序继续运行，现在到了

sp<A> spA(A);

请看sp的构造函数，它的代码如下所示：（注意，sp是一个模板类，对此不熟悉的读者可以去翻翻书，或者干脆把所有出现的T都换成A。）

[-->RefBase.h::sp(T*other)]

template<typename T>

sp<T>::sp(T* other) //这里的other就是刚才创建的pA

:m_ptr(other)// sp保存了pA的指针

{

if(other) other->incStrong(this);//调用pA的incStrong

}

OK，战场转到RefBase的incStrong中。它的代码如下所示：

[-->RefBase.cpp]

void RefBase::incStrong(const void* id) const

{

//mRefs就是刚才RefBase构造函数中new出来的影子对象

weakref_impl*const refs = mRefs;

//操作影子对象，先增加弱引用计数

refs->addWeakRef(id);

refs->incWeak(id);

......

先来看看影子对象的这两个weak函数都干了些什么。

（1）眼见而心不烦

先来看第一个函数addWeakRef，代码如下所示：

[-->RefBase.cpp]

void addWeakRef(const void* /*id*/) { }

呵呵，addWeakRef啥都没做，因为这是release版走的分支。调试版的代码我们就不讨论了，它是给创造RefBase、 sp，以及wp的人调试用的。

调试版分支的代码很多，看来创造它们的人，也为不理解它们之间的暧昧关系痛苦不已。

总之，一共有这么几个不用考虑的函数，我们都已列出来了。以后再碰见它们，干脆就直接跳过的是：

void addStrongRef(const void* /*id*/) { }

void removeStrongRef(const void* /*id*/) { }

void addWeakRef(const void* /*id*/) { }

void removeWeakRef(const void* /*id*/) { }

void printRefs() const { }

void trackMe(bool, bool) { }

继续我们的征程。再看incWeak函数，代码如下所示：

[-->RefBase.cpp]

void RefBase::weakref_type::incWeak(const void*id)

{

weakref_impl* const impl = static_cast<weakref_impl*>(this);

impl->addWeakRef(id); //上面说了，非调试版什么都不干

const int32_tc = android_atomic_inc(&impl->mWeak);

//原子操作，影子对象的弱引用计数加1

//千万记住影子对象的强弱引用计数的值，这是彻底理解sp和wp的关键

}

好，我们再回到incStrong，继续看代码：

[-->RefBase.cpp]

......

//刚才增加了弱引用计数

//再增加强引用计数

refs->addStrongRef(id);//非调试版这里什么都不干

//下面函数为原子加1操作，并返回旧值。所以c=0x1000000，而mStrong变为0x1000001

const int32_t c =android_atomic_inc(&refs->mStrong);

if (c!= INITIAL_STRONG_VALUE) {

//如果c不是初始值，则表明这个对象已经被强引用过一次了

return;

}

//下面这个是原子加操作，相当于执行refs->mStrong +（-0x1000000），最终mStrong=1

android_atomic_add(-INITIAL_STRONG_VALUE,&refs->mStrong);

如果是第一次引用，则调用onFirstRef，这个函数很重要，派生类可以重载这个函数，完成一些

初始化工作。

const_cast<RefBase*>(this)->onFirstRef();

}

说明：android_atomic_xxx是Android平台提供的原子操作函数，原子操作函数是多线程编程中的常见函数，读者可以学习原子操作函数知识，本章后面将对其做介绍。

（2）sp构造的影响

sp构造完后，它给这个世界带来了什么？

· 那就是RefBase中影子对象的强引用计数变为1，弱引用计数也变为1。

更准确的说法是，sp的出生导致影子对象的强引用计数加1，弱引用计数加1。

（3）wp构造的影响

继续看wp，例子中的调用方式如下：

wp<A> wpA(spA)

wp有好几个构造函数，原理都一样。来看这个最常见的：

[-->RefBase.h::wp(constsp<T>& other)]

template<typename T>

wp<T>::wp(const sp<T>& other)

:m_ptr(other.m_ptr) //wp的成员变量m_ptr指向实际对象

{

if(m_ptr) {

//调用pA的createWeak,并且保存返回值到成员变量m_refs中

m_refs = m_ptr->createWeak(this);

}

[-->RefBase.cpp]

RefBase::weakref_type* RefBase::createWeak(constvoid* id) const

{

//调用影子对象的incWeak，这个我们刚才讲过了，将导致影子对象的弱引用计数增加1

mRefs->incWeak(id);

returnmRefs; //返回影子对象本身

}

我们可以看到，wp化后，影子对象的弱引用计数将增加1，所以现在弱引用计数为2，而强引用计数仍为1。另外，wp中有两个成员变量，一个保存实际对象，另一个保存影子对象。sp只有一个成员变量用来保存实际对象，但这个实际对象内部已包含了对应的影子对象。

OK，wp创建完了，现在开始进入wp的析构。

（4）wp析构的影响

wp进入析构函数，这表明它快要离世了。

[-->RefBase.h]

template<typename T>

wp<T>::~wp()

{

if(m_ptr) m_refs->decWeak(this); //调用影子对象的decWeak，由影子对象的基类实现

}

[-->RefBase.cpp]

void RefBase::weakref_type::decWeak(const void*id)

{

//把基类指针转换成子类（影子对象）的类型，这种做法有些违背面向对象编程的思想

weakref_impl*const impl = static_cast<weakref_impl*>(this);

impl->removeWeakRef(id);//非调试版不做任何事情

//原子减1，返回旧值，c=2，而弱引用计数从2变为1

constint32_t c = android_atomic_dec(&impl->mWeak);

if (c !=1) return; //c=2，直接返回

//如果c为1，则弱引用计数为0，这说明没用弱引用指向实际对象，需要考虑是否释放内存

// OBJECT_LIFETIME_XXX和生命周期有关系，我们后面再说。

if((impl->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK) {

if(impl->mStrong == INITIAL_STRONG_VALUE)

delete impl->mBase;

else {

delete impl;

}

} else{

impl->mBase->onLastWeakRef(id);

if((impl->mFlags&OBJECT_LIFETIME_FOREVER) != OBJECT_LIFETIME_FOREVER) {

delete impl->mBase;

}

OK，在例1中，wp析构后，弱引用计数减1。但由于此时强引用计数和弱引用计数仍为1，所以没有对象被干掉，即没有释放实际对象和影子对象占据的内存。

（5）sp析构的影响

下面进入sp的析构。

[-->RefBase.h]

template<typename T>

sp<T>::~sp()

{

if(m_ptr) m_ptr->decStrong(this); //调用实际对象的decStrong。由RefBase实现

}

[-->RefBase.cpp]

void RefBase::decStrong(const void* id) const

{

weakref_impl* const refs = mRefs;

refs->removeStrongRef(id);//调用影子对象的removeStrongRef，啥都不干

//注意，此时强弱引用计数都是1，下面函数调用的结果是c=1，强引用计数为0

constint32_t c = android_atomic_dec(&refs->mStrong);

if (c== 1) { //对于我们的例子， c为1

//调用onLastStrongRef，表明强引用计数减为0，对象有可能被delete

const_cast<RefBase*>(this)->onLastStrongRef(id);

//mFlags为0，所以会通过delete this把自己干掉

//注意，此时弱引用计数仍为1

if((refs->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK) {

delete this;

}

......

}

先看delete this的处理，它会导致A的析构函数被调用；再看A的析构函数，代码如下所示：

[-->例子1::~A()]

//A的析构直接导致进入RefBase的析构。

RefBase::~RefBase()

{

if(mRefs->mWeak == 0) { //弱引用计数不为0，而是1

delete mRefs;

}

RefBase的delete this自杀行为没有把影子对象干掉，但我们还在decStrong中，可接着从delete this往下看：

[-->RefBase.cpp]

....//接前面的delete this

if ((refs->mFlags&OBJECT_LIFETIME_WEAK)!= OBJECT_LIFETIME_WEAK) {

delete this;

}

//注意，实际数据对象已经被干掉了，所以mRefs也没有用了，但是decStrong刚进来

//的时候就保存mRefs到refs了，所以这里的refs指向影子对象

refs->removeWeakRef(id);

refs->decWeak(id);//调用影子对象decWeak

}

[-->RefBase.cpp]

void RefBase::weakref_type::decWeak(const void*id)

{

weakref_impl*const impl = static_cast<weakref_impl*>(this);

impl->removeWeakRef(id);//非调试版不做任何事情

//调用前影子对象的弱引用计数为1，强引用计数为0，调用结束后c=1，弱引用计数为0

constint32_t c = android_atomic_dec(&impl->mWeak);

if (c!= 1) return;

//这次弱引用计数终于变为0，并且mFlags为0， mStrong也为0。

if((impl->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK) {

if(impl->mStrong == INITIAL_STRONG_VALUE)

delete impl->mBase;

else {

delete impl; //impl就是this，把影子对象自己干掉

}

} else{

impl->mBase->onLastWeakRef(id);

if((impl->mFlags&OBJECT_LIFETIME_FOREVER) != OBJECT_LIFETIME_FOREVER) {

delete impl->mBase;

}

好，第一板斧劈下去了！来看看它的结果是什么。

3. 第一板斧的结果

第一板斧过后，来总结一下刚才所学的知识：

· RefBase中有一个隐含的影子对象，该影子对象内部有强弱引用计数。

· sp化后，强弱引用计数各增加1，sp析构后，强弱引用计数各减1。

· wp化后，弱引用计数增加1，wp析构后，弱引用计数减1。

完全彻底地消灭RefBase对象，包括让实际对象和影子对象灭亡，这些都是由强弱引用计数控制的，另外还要考虑flag的取值情况。当flag为0时，可得出如下结论：

· 强引用为0将导致实际对象被delete。

· 弱引用为0将导致影子对象被delete。

5.2.2 第二板斧——由弱生强

再看第二个例子，代码如下所示：

[-->例子2]

int main()

{

A *pA =new A();

wp<A> wpA(A);

sp<A> spA = wpA.promote();//通过promote函数，得到一个sp。

}

对A的wp化，不再做分析了。按照前面所学的知识，wp化后仅会使弱引用计数加1，所以此处wp化的结果是：

· 影子对象的弱引用计数为1，强引用计数仍然是初始值0x1000000。

wpA的promote函数是从一个弱对象产生一个强对象的重要函数，试看：

1. 由弱生强的方法

代码如下所示：

[-->RefBase.h]

template<typename T>

sp<T> wp<T>::promote() const

{

returnsp<T>(m_ptr, m_refs); //调用sp的构造函数。

}

[-->RefBase.h]

template<typename T>

sp<T>::sp(T* p, weakref_type* refs)

:m_ptr((p && refs->attemptIncStrong(this)) ? p : 0)//有点看不清楚

{

//上面那行代码够简洁，但是不方便阅读，我们写成下面这样：

T* pTemp= NULL;

//关键函数attemptIncStrong

if(p !=NULL && refs->attemptIncStrong(this) == true)

pTemp = p;

m_ptr =pTemp;

}

2. 成败在此一举

由弱生强的关键函数是attemptIncStrong，它的代码如下所示：

[-->RefBase.cpp]

boolRefBase::weakref_type::attemptIncStrong(const void* id)

{

incWeak(id);//增加弱引用计数，此时弱引用计数变为2

weakref_impl* const impl = static_cast<weakref_impl*>(this);

int32_t curCount = impl->mStrong; //这个仍是初始值

//下面这个循环，在多线程操作同一个对象时可能会循环多次。这里可以不去管它，

//它的目的就是使强引用计数增加1

while(curCount > 0 && curCount != INITIAL_STRONG_VALUE) {

if(android_atomic_cmpxchg(curCount, curCount+1, &impl->mStrong) == 0) {

break;

}

curCount = impl->mStrong;

}

if(curCount <= 0 || curCount == INITIAL_STRONG_VALUE) {

bool allow;

下面这个allow的判断极为精妙。impl的mBase对象就是实际对象，有可能已经被delete了。

curCount为0，表示强引用计数肯定经历了INITIAL_STRONG_VALUE->1->...->0的过程。

mFlags就是根据标志来决定是否继续进行||或&&后的判断，因为这些判断都使用了mBase，

如不做这些判断，一旦mBase指向已经回收的地址，你就等着segment fault吧！

其实，咱们大可不必理会这些东西，因为它不影响我们的分析和理解。

if(curCount == INITIAL_STRONG_VALUE) {

allow =(impl->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK

|| impl->mBase->onIncStrongAttempted(FIRST_INC_STRONG, id);

}else {

allow = (impl->mFlags&OBJECT_LIFETIME_WEAK) ==OBJECT_LIFETIME_WEAK

&& impl->mBase->onIncStrongAttempted(FIRST_INC_STRONG,id);

}

if(!allow) {

//allow为false，表示不允许由弱生强，弱引用计数要减去1，这是因为咱们进来时加过一次

decWeak(id);

return false; //由弱生强失败

}

//允许由弱生强，则强引用计数要增加1，而弱引用计数已经增加过了

curCount = android_atomic_inc(&impl->mStrong);

if(curCount > 0 && curCount < INITIAL_STRONG_VALUE) {

impl->mBase->onLastStrongRef(id);

}

impl->addWeakRef(id);

impl->addStrongRef(id);//两个函数调用没有作用

if(curCount == INITIAL_STRONG_VALUE) {

//强引用计数变为1

android_atomic_add(-INITIAL_STRONG_VALUE, &impl->mStrong);

//调用onFirstRef，通知该对象第一次被强引用

impl->mBase->onFirstRef();

}

returntrue; //由弱生强成功

}

3. 第二板斧的结果

promote完成后，相当于增加了一个强引用。根据上面所学的知识可知：

· 由弱生强成功后，强弱引用计数均增加1。所以现在影子对象的强引用计数为1，弱引用计数为2。

5.2.3 第三板斧——破解生死魔咒

1. 延长生命的魔咒

RefBase为我们提供了一个这样的函数：

extendObjectLifetime(int32_t mode)

另外还定义了一个枚举：

enum {

OBJECT_LIFETIME_WEAK = 0x0001,

OBJECT_LIFETIME_FOREVER = 0x0003

};

注意：FOREVER的值是3，二进制表示是B11，而WEAK的二进制是B01，也就是说FOREVER包括了WEAK的情况。

上面这两个枚举值，是破除强弱引用计数作用的魔咒。先观察flags为OBJECT_LIFETIME_WEAK的情况，见下面的例子。

[-->例子3]

class A：public RefBase

{

publicA()

{

extendObjectLifetime(OBJECT_LIFETIME_WEAK);//在构造函数中调用

}

int main()

{

A *pA =new A();

wp<A> wpA(A);//弱引用计数加1

{

sp<A>spA(pA) //sp后，结果是强引用计数为1，弱引用计数为2

}

....

}

sp的析构将直接调用RefBase的decStrong，它的代码如下所示：

[-->RefBase.cpp]

void RefBase::decStrong(const void* id) const

{

weakref_impl* const refs = mRefs;

refs->removeStrongRef(id);

constint32_t c = android_atomic_dec(&refs->mStrong);

if (c== 1) { //上面原子操作后，强引用计数为0

const_cast<RefBase*>(this)->onLastStrongRef(id);、

//注意这句话。如果flags不是WEAK或FOREVER的话，将delete数据对象

//现在我们的flags是WEAK，所以不会delete 它

if((refs->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK) {

delete this;

}

refs->removeWeakRef(id);

refs->decWeak(id);//调用前弱引用计数是2。

}

然后调用影子对象的decWeak。再来看它的处理，代码如下所示：

[-->RefBase.cpp::weakref_type的decWeak()函数]

void RefBase::weakref_type::decWeak(const void*id)

{

weakref_impl* const impl = static_cast<weakref_impl*>(this);

impl->removeWeakRef(id);

constint32_t c = android_atomic_dec(&impl->mWeak);

if (c!= 1) return; //c为2，弱引用计数为1，直接返回。

假设我们现在到了例子中的wp析构之处，这时也会调用decWeak，调用上边的原子减操作后

c=1，弱引用计数变为0，此时会继续往下运行。由于mFlags为WEAK ，所以不满足if的条件

if((impl->mFlags&OBJECT_LIFETIME_WEAK) != OBJECT_LIFETIME_WEAK) {

if(impl->mStrong == INITIAL_STRONG_VALUE)

delete impl->mBase;

else {

delete impl;

}

} else{//flag为WEAK,满足else分支的条件

impl->mBase->onLastWeakRef(id);

由于flags值满足下面这个条件，所以实际对象会被delete，根据前面的分析，实际对象的delete会检查影子对象的弱引用计数，如果它为0，则会把影子对象也delete掉。

由于影子对象的弱引用计数此时已经为0，所以影子对象也会被delete。

if((impl->mFlags&OBJECT_LIFETIME_FOREVER) != OBJECT_LIFETIME_FOREVER) {

delete impl->mBase;

}

2. LIFETIME_WEAK的魔力

看完上面的例子，我们发现什么了？

· 在LIFETIME_WEAK的魔法下，强引用计数为0，而弱引用计数不为0的时候，实际对象没有被delete！只有当强引用计数和弱引用计数同时为0时，实际对象和影子对象才会被delete。

3. 魔咒大揭秘

至于LIFETIME_FOREVER的破解，就不用再来一斧子了，我直接的答案是：

· flags为0，强引用计数控制实际对象的生命周期，弱引用计数控制影子对象的生命周期。强引用计数为0后，实际对象被delete。所以对于这种情况，应记住的是，使用wp时要由弱生强，以免收到segment fault信号。

· flags为LIFETIME_WEAK，强引用计数为0，弱引用计数不为0时，实际对象不会被delete。当弱引用计数减为0时，实际对象和影子对象会同时被delete。这是功德圆满的情况。

· flags为LIFETIME_FOREVER，对象将长生不老，彻底摆脱强弱引用计数的控制。所以你要在适当的时候杀死这些老妖精，免得她祸害“人间”。

5.2.4 轻量级的引用计数控制LightRefBase

上面介绍的RefBase，是一个重量级的引用计数控制类。那么，究竟有没有一个简单些的引用计数控制类呢？Android为我们提供了一个轻量级的LightRefBase。这个类非常简单，我们不妨一起来看看。

[-->RefBase.h]

template <class T>

class LightRefBase

{

public:

inlineLightRefBase() : mCount(0) { }

inline void incStrong(const void* id) const {

//LightRefBase只有一个引用计数控制量mCount。incStrong的时候使它增加1

android_atomic_inc(&mCount);

}

inline void decStrong(const void* id) const {

//decStrong的时候减1，当引用计数变为零的时候，delete掉自己

if(android_atomic_dec(&mCount) == 1) {

delete static_cast<const T*>(this);

}

inlineint32_t getStrongCount() const {

return mCount;

}

protected:

inline~LightRefBase() { }

private:

mutable volatile int32_t mCount;//引用计数控制变量

};

LightRefBase类够简单吧？不过它是一个模板类，我们该怎么用它呢？下面给出一个例子，其中类A是从LightRefBase派生的，写法如下：

class A:public LightRefBase<A> //注意派生的时候要指明是LightRefBase<A>

{

public:

A(){};

~A(){};

};

另外，我们从LightRefBase的定义中可以知道，它支持sp的控制，因为它只有incStrong和decStrong函数。

5.2.5 题外话——三板斧的来历

从代码量上看，RefBase、sp和wp的代码量并不多，但里边的关系，尤其是flags的引入，曾一度让我眼花缭乱。当时，我确实很希望能自己调试一下这些例子，但在设备上调试native代码，需要花费很大的精力，即使是通过输出log的方式也需要很多时间。该怎么解决这一难题？

既然它的代码不多而且简单，那何不把它移植到台式机的开发环境下，整一个类似的RefBase呢？由于有了这样的构想，我便用上了Visual Studio。至于那些原子操作，Windows平台上有很直接的InterlockedExchangeXXX与之对应，真的是踏破铁鞋无觅处，得来全不费功夫！（在Linux平台上，不考虑多线程的话，将原子操作换成普通的非原子操作不是也可以吗？如果更细心更负责任的话，你可以自己用汇编来实现常用的原子操作，内核代码中有现成的函数，一看就会明白。）

如果把破解代码看成是攻城略地的话，我们必须学会灵活多变，而且应力求破解方法日臻极致！

5.3 Thread类以及常用同步类的分析

Thread类是Android为线程操作而做的一个封装。代码在Thread.cpp中，其中还封装了一些与线程同步相关（既然是封装，要掌握它，最重要的当然是与Pthread相关的知识）的类。我们拟先行分析Threa类，进而再介绍与常用同步类相关的知识。

5.3.1 一个变量引发的思考

Thread类虽说挺简单，但它构造函数中的那个canCallJava却一度使我感到费解。因为我一直使用的是自己封装的Pthread类。当发现Thread构造函数中竟然存在这样一个东西时，很担心自己封装的Pthread类会不会有什么重大问题，因为当时我还从来没考虑过Java方面的问题。

// canCallJava表示这个线程是否会使用JNI函数。为什么需要一个这样的参数呢？

Thread(bool canCallJava = true)。

我们必须得了解它实际创建的线程函数是什么。Thread类真实的线程是创建在run函数中的。

1. 一个变量，两种处理

先来看一段代码：

[-->Thread.cpp]

status_t Thread::run(const char* name, int32_tpriority, size_t stack)

{

Mutex::Autolock_l(mLock);

....

//如果mCanCallJava为真，则调用createThreadEtc函数，线程函数是_threadLoop。

//_threadLoop是Thread.cpp中定义的一个函数。

if(mCanCallJava) {

res = createThreadEtc(_threadLoop,this, name, priority,

stack,&mThread);

} else{

res = androidCreateRawThreadEtc(_threadLoop, this, name, priority,

stack,&mThread);

}

上面的mCanCallJava将线程创建函数的逻辑分为两个分支，虽传入的参数都有_threadLoop，但调用的函数却不同。先直接看mCanCallJava为true的这个分支，代码如下所示：

[-->Thread.h::createThreadEtc()函数]

inline bool createThreadEtc(thread_func_tentryFunction,

void *userData,

const char*threadName = "android:unnamed_thread",

int32_tthreadPriority = PRIORITY_DEFAULT,

size_tthreadStackSize = 0,

thread_id_t*threadId = 0)

{

returnandroidCreateThreadEtc(entryFunction, userData, threadName,

threadPriority, threadStackSize,threadId) ? true : false;

}

它调用的是androidCreateThreadEtc函数，相关代码如下所示：

// gCreateThreadFn是函数指针，初始化时和mCanCallJava为false时使用的是同一个

//线程创建函数。那么有地方会修改它吗？

static android_create_thread_fn gCreateThreadFn= androidCreateRawThreadEtc;

int androidCreateThreadEtc(android_thread_func_tentryFunction,

void*userData,const char* threadName,

int32_tthreadPriority,size_t threadStackSize,

android_thread_id_t*threadId)

{

returngCreateThreadFn(entryFunction, userData, threadName,

threadPriority,threadStackSize, threadId);

}

如果没有人修改这个函数指针，那么mCanCallJava就是虚晃一枪，并无什么作用，很可惜，代码中有的地方是会修改这个函数指针的指向的，请看：

2. zygote偷梁换柱

在第四章4.2.1的第2小节AndroidRuntime调用startReg的地方，就有可能修改这个函数指针，其代码如下所示：

[-->AndroidRuntime.cpp]

/*static*/ int AndroidRuntime::startReg(JNIEnv*env)

{

//这里会修改函数指针为javaCreateThreadEtc

androidSetCreateThreadFunc((android_create_thread_fn)javaCreateThreadEtc);

return0;

}

所以，如果mCanCallJava为true，则将调用javaCreateThreadEtc。那么，这个函数有什么特殊之处呢？来看其代码，如下所示：

[-->AndroidRuntime.cpp]

int AndroidRuntime::javaCreateThreadEtc(

android_thread_func_tentryFunction,

void* userData,

const char*threadName,

int32_tthreadPriority,

size_t threadStackSize,

android_thread_id_t* threadId)

{

void**args = (void**) malloc(3 * sizeof(void*));

intresult;

args[0] = (void*) entryFunction;

args[1] = userData;

args[2] = (void*) strdup(threadName);

//调用的还是androidCreateRawThreadEtc，但线程函数却换成了javaThreadShell。

result= androidCreateRawThreadEtc(AndroidRuntime::javaThreadShell, args,

threadName, threadPriority,threadStackSize, threadId);

returnresult;

}

[-->AndroidRuntime.cpp]

int AndroidRuntime::javaThreadShell(void* args){

......

intresult;

//把这个线程attach到JNI环境中，这样这个线程就可以调用JNI的函数了

if(javaAttachThread(name, &env) != JNI_OK)

return -1;

//调用实际的线程函数干活

result = (*(android_thread_func_t)start)(userData);

//从JNI环境中detach出来。

javaDetachThread();

free(name);

returnresult;

}

3. 费力而讨好

你明白mCanCallJava为true的目的了吗？它创建的新线程将：

· 在调用你的线程函数之前会attach到 JNI环境中，这样，你的线程函数就可以无忧无虑地使用JNI函数了。

· 线程函数退出后，它会从JNI环境中detach，释放一些资源。

第二点尤其重要，因为进程退出前，dalvik虚拟机会检查是否有attach了，但是最后未detach的线程如果有，则会直接abort（这不是一件好事）。如果你关闭JNI check选项，就不会做这个检查，但我觉得，这个检查和资源释放有关系。建议还是重视JNIcheck。如果直接使用POSIX的线程创建函数，那么凡是使用过attach的，最后就都需要detach！

Android为了dalvik的健康真是费尽心机呀。

4. 线程函数_threadLoop介绍

不论一分为二是如何处理的，最终的线程函数_threadLoop都会被调用，为什么不直接调用用户传入的线程函数呢？莫非_threadLoop会有什么暗箱操作吗？下面，我们来看：

[-->Thread.cpp]

int Thread::_threadLoop(void* user)

{

Thread* const self = static_cast<Thread*>(user);

sp<Thread> strong(self->mHoldSelf);

wp<Thread> weak(strong);

self->mHoldSelf.clear();

#if HAVE_ANDROID_OS

self->mTid = gettid();

#endif

boolfirst = true;

do {

bool result;

if(first) {

first = false;

//self代表继承Thread类的对象，第一次进来将调用readyToRun，看看是否准备好

self->mStatus = self->readyToRun();

result = (self->mStatus == NO_ERROR);

if (result && !self->mExitPending) {

result = self->threadLoop();

}

}else {

调用子类实现的threadLoop函数，注意这段代码运行在一个do-while循环中。

这表示即使我们的threadLoop返回了，线程也不一定会退出。

result = self->threadLoop();

}

线程退出的条件：

1）result 为false。这表明，如果子类在threadLoop中返回false，线程就可以

退出。这属于主动退出的情况，是threadLoop自己不想继续干活了，所以返回false。

读者在自己的代码中千万别写错threadLoop的返回值。

2）mExitPending为true，这个变量可由Thread类的requestExit函数设置，这种

情况属于被动退出，因为由外界强制设置了退出条件。

if(result == false || self->mExitPending) {

self->mExitPending = true;

self->mLock.lock();

self->mRunning = false;

self->mThreadExitedCondition.broadcast();

self->mLock.unlock();

break;

}

strong.clear();

strong = weak.promote();

}while(strong != 0);

return0;

}

关于_threadLoop，我们就介绍到这里。请读者务必注意下面一点：

· threadLoop运行在一个循环中，它的返回值可以决定是否退出线程。

5.3.2 常用同步类

同步，是多线程编程中不可回避的话题，同时也是一个非常复杂的问题。这里，只简单介绍一下Android提供的同步类。这些类，只对系统提供的多线程同步函数（这种函数我们也称之为Raw API）进行了面向对象的封装，读者必须先理解Raw API，然后才能真正掌握其具体用法。

了解Windows下的多线程编程，有很多参考资料，但我以为，现在先学习MSDN就可以了。有关Linux下完整系统阐述多线程编程的书籍目前较少，这里推荐一本含金量较高的著作《Programmingwith POSIX Thread》（本书只有英文版的，由Addison-Wesley出版）。

Android提供了两个封装好的同步类，它们是Mutex和Condition。这是重量级的同步技术，一般内核会有对应的支持。另外，OS还提供了简单的原子操作，这些也算是同步技术的一种。下面分别来介绍这三种东西。

1. 互斥类——Mutex

Mutex是互斥类，用于多线程访问同一个资源的时候，保证一次只能有一个线程能访问该资源。在《Windows核心编程》①一书中，对于这种互斥访问有一个很形象的比喻：想象你在飞机上如厕，这时卫生间的信息牌上显示“有人”，你必须等里边的人出来后才可进去。这就是互斥的含义。

下面来看Mutex的实现方式，它们都很简单。

（1）Mutex介绍

其代码如下所示：

[-->Thread.h::Mutex的声明和实现]

inline Mutex::Mutex(int type, const char* name){

if(type == SHARED) {

//type如果是SHARED，则表明这个Mutex支持跨进程的线程同步

//以后我们在Audio系统和Surface系统中会经常见到这种用法

pthread_mutexattr_t attr;

pthread_mutexattr_init(&attr);

pthread_mutexattr_setpshared(&attr, PTHREAD_PROCESS_SHARED);

pthread_mutex_init(&mMutex, &attr);

pthread_mutexattr_destroy(&attr);

} else {

pthread_mutex_init(&mMutex, NULL);

}

inline Mutex::~Mutex() {

pthread_mutex_destroy(&mMutex);

}

inline status_t Mutex::lock() {

return-pthread_mutex_lock(&mMutex);

}

inline void Mutex::unlock() {

pthread_mutex_unlock(&mMutex);

}

inline status_t Mutex::tryLock() {

return-pthread_mutex_trylock(&mMutex);

}

关于Mutex的使用，除了初始化外，最重要的是lock和unlock函数的使用，它们的用法如下：

· 要想独占卫生间，必须先调用Mutex的lock函数。这样，这个区域就被锁住了。如果这块区域之前已被别人锁住，lock函数则会等待，直到可以进入这块区域为止。系统保证一次只有一个线程能lock成功。

· 当你“方便”完毕，记得调用Mutex的unlock以释放互斥区域。这样，其他人的lock才可以成功返回。

· 另外，Mutex还提供了一个trylock函数，该函数只是尝试去锁住该区域，使用者需要根据trylock的返回值判断是否成功锁住了该区域。

注意，以上这些内容都和Raw API有关，不了解它的读者可自行学习与它相关的知识。在Android系统中，多线程也是常见和重要的编程手段，务请大家重视。

Mutex类确实比Raw API方便好用，不过还是稍显麻烦。来看下一节。

（2）AutoLock介绍

AutoLock类是定义在Mutex内部的一个类，它其实是一帮“懒人”搞出来的，为什么这么说呢？先来看看使用Mutex够多麻烦：

· 显示调用Mutex的lock。

· 在某个时候要记住调用该Mutex的unlock。

以上这些操作都必须一一对应，否则会出现“死锁”！有些代码中，在判断分支特别多的情况下，unlock这句代码被写得比比皆是，如稍有不慎，在某处就会忘写了它。有什么好办法能解决这个问题吗？终于有人想出来一个好办法，就是充分利用了C++的构造和析构函数，只需一看AutoLock的定义就会明白。代码如下所示：

[-->Thread.h Mutex::Autolock声明和实现]

classAutolock {

public:

//构造的时候调用lock

inline Autolock(Mutex& mutex) : mLock(mutex) { mLock.lock(); }

inline Autolock(Mutex* mutex) : mLock(*mutex) { mLock.lock(); }

//析构的时候调用unlock

inline ~Autolock() { mLock.unlock(); }

private:

Mutex& mLock;

};

AutoLock的用法很简单：

· 先定义一个Mutex，如 Mutex xlock；

· 在使用xlock的地方，定义一个AutoLock，如 AutoLock autoLock（xlock）。

由于C++对象的构造和析构函数都是自动被调用的，所以在AutoLock的生命周期内，xlock的lock和unlock也就自动被调用了，这样就省去了重复书写unlock的麻烦，而且lock和unlock的调用肯定是一一对应的，这样就绝对不会出错。

2. 条件类——Condition

多线程同步中的条件类对应的是下面一种使用场景：

· 线程A做初始化工作，而其他线程比如线程B、C必须等到初始化工作完后才能工作，即线程B、C在等待一个条件，我们称B、C为等待者。

· 当线程A完成初始化工作时，会触发这个条件，那么等待者B、C就会被唤醒。触发这个条件的A就是触发者。

上面的使用场景非常形象，而且条件类提供的函数也非常形象，它的代码如下所示：

[-->Thread.h::Condition的声明和实现]

class Condition {

public:

enum {

PRIVATE = 0,

SHARED = 1

};

Condition();

Condition(int type);//如果type是SHARED，表示支持跨进程的条件同步

~Condition();

//线程B和C等待事件，wait这个名字是不是很形象呢？

status_t wait(Mutex& mutex);

//线程B和C的超时等待，B和C可以指定等待时间，当超过这个时间，条件却还不满足，则退出等待

status_t waitRelative(Mutex& mutex, nsecs_t reltime);

//触发者A用来通知条件已经满足，但是B和C只有一个会被唤醒

voidsignal();

//触发者A用来通知条件已经满足，所有等待者都会被唤醒

voidbroadcast();

private:

#if defined(HAVE_PTHREADS)

pthread_cond_t mCond;

#else

void* mState;

#endif

}

声明很简单，定义也很简单，代码如下所示：

inline Condition::Condition() {

pthread_cond_init(&mCond, NULL);

}

inline Condition::Condition(int type) {

if(type == SHARED) {//设置跨进程的同步支持

pthread_condattr_t attr;

pthread_condattr_init(&attr);

pthread_condattr_setpshared(&attr, PTHREAD_PROCESS_SHARED);

pthread_cond_init(&mCond, &attr);

pthread_condattr_destroy(&attr);

} else{

pthread_cond_init(&mCond, NULL);

}

inline Condition::~Condition() {

pthread_cond_destroy(&mCond);

}

inline status_t Condition::wait(Mutex&mutex) {

return-pthread_cond_wait(&mCond, &mutex.mMutex);

}

inline status_tCondition::waitRelative(Mutex& mutex, nsecs_t reltime) {

#if defined(HAVE_PTHREAD_COND_TIMEDWAIT_RELATIVE)

structtimespec ts;

ts.tv_sec = reltime/1000000000;

ts.tv_nsec = reltime%1000000000;

return-pthread_cond_timedwait_relative_np(&mCond, &mutex.mMutex, &ts);

...... //有些系统没有实现POSIX的相关函数，所以不同系统需要调用不同的函数

#endif

}

inline void Condition::signal() {

pthread_cond_signal(&mCond);

}

inline void Condition::broadcast() {

pthread_cond_broadcast(&mCond);

}

可以看出，Condition的实现全是凭借调用了Raw API的pthread_cond_xxx函数。这里要重点说明的是，Condition类必须配合Mutex来使用。什么意思？

· 上面代码中，不论是wait、waitRelative、signal还是broadcast的调用，都放在一个Mutex的lock和unlock范围中，尤其是wait和waitRelative函数的调用，这是强制性的。

来看一个实际的例子，加深一下对Condition类和Mutex类使用的印象。这个例子是Thread类的requestExitAndWait，目的是等待工作线程退出，代码如下所示：

[-->Thread.cpp]

status_t Thread::requestExitAndWait()

{

......

requestExit();//设置退出变量mExitPending为true

Mutex::Autolock_l(mLock);//使用Autolock，mLock被锁住

while(mRunning == true) {

条件变量的等待，这里为什么要通过while循环来反复检测mRunning？

因为某些时候即使条件类没有被触发，wait也会返回。关于这个问题，强烈建议读者阅读

前边推荐的《Programming with POSIX Thread》一书。

mThreadExitedCondition.wait(mLock);

}

mExitPending = false;

//退出前，局部变量Mutex::Autolock _l的析构会被调用，unlock也就会被自动调用。

returnmStatus;

}

那么，什么地方会触发这个条件呢？是在工作线程退出前。其代码如下所示：

[-->Thread.cpp]

int Thread::_threadLoop(void* user)

{

Thread* const self =static_cast<Thread*>(user);

sp<Thread> strong(self->mHoldSelf);

wp<Thread> weak(strong);

self->mHoldSelf.clear();

do {

......

result= self->threadLoop();//调用子类的threadLoop函数

......

//如果mExitPending为true，则退出

if(result == false || self->mExitPending) {

self->mExitPending = true;

//退出前触发条件变量，唤醒等待者

self->mLock.lock();//lock锁住

//mRunning的修改位于锁的保护中。如果你阅读了前面推荐的书，这里也就不难理解了

self->mRunning = false;

self->mThreadExitedCondition.broadcast();

self->mLock.unlock();//释放锁

break;//退出循环，此后该线程函数会退出

}

......

}while(strong != 0);

return0;

}

关于Android多线程的同步类，暂时介绍到此吧。当然，这些类背后所隐含的知识及技术是读者需要倍加重视的。

希望我们能养成一种由点及面的学习方法。以我们的同步类为例，假设你是第一次接触多线程编程，也学会了如何使用Mutex和Condition这两个类，不妨以这两个类代码中所传递的知识做为切入点，把和多线程相关的所有知识（这个知识不仅仅是函数的使用，还包括多线程的原理，多线程的编程模型，甚至是现在很热门的并行多核编程）普遍了解一下。只有深刻理解并掌握了原理等基础和框架性的知识，才能以不变应万变，才能做到游刃有余。

3. 原子操作函数介绍

什么是原子操作？所谓原子操作，就是该操作绝不会在执行完毕前被任何其他任务或事件打断，也就说，原子操作是最小的执行单位。

上面这句话放到代码中是什么意思？请看一个例子：

[-->例子]

static int g_flag = 0; //全局变量g_flag

static Mutex lock ;//全局的锁

//线程1执行thread1

void thread1()

{

//g_flag递减,每次操作前锁住

lock.lock();

g_flag--;

lock.unlock();

}

//线程2中执行thread2函数

void thread2()

{

lock.lock();

g_flag++; //线程2对g_flag进行递增操作，每次操作前要取得锁

lock.unlock();

}

为什么需要Mutex来帮忙呢？因为g_flags++或者g_flags—操作都不是原子操作。从汇编指令的角度看，C/C++中的一条语句对应了数条汇编指令。以g_flags++操作为例，它生成的汇编指令可能就是以下三条：

· 从内存中取数据到寄存器。

· 对寄存器中的数据进行递增操作，结果还在寄存器中。

· 寄存器的结果写回内存。

这三条汇编指令，如果按正常的顺序连续执行，是没有问题的，但在多线程时就不能保证了。例如，线程1在执行第一条指令后，线程2由于调度的原因，抢先在线程1之前连续执行完了三条指令。这样，线程1继续执行指令时，它所使用的值就不是线程2更新后的值，而是之前的旧值。再对这个值进行操作便没有意义了。

在一般情况下，处理这种问题可以使用Mutex来加锁保护，但Mutex的使用比它所要保护的内容还复杂，例如，锁的使用将导致从用户态转入内核态，有较大的浪费。那么，有没有简便些的办法让这些加、减等操作不被中断呢？

答案是肯定的，但这需要CPU的支持。在X86平台上，一个递增操作可以用下面的内嵌汇编语句实现：

#define LOCK "lock;"

INT32 InterlockedIncrement(INT32* lpAddend)

{

这是我们在Linux平台上实现Windows API时使用的方法。

其中在SMP系统上，LOCK定义成”lock;”表示锁总线，这样同一时刻只能有一个CPU访问总线。

非SMP系统，LOCK定义成空。由于InterlockedIncrement要返回递增前的旧值，所以我们

使用了xaddl指令，它先交换源和目的的操作数，再进行递增操作。

INT32i = 1;

__asm____volatile__(

LOCK"xaddl %0, %1"

:"+r"(i), "+m" (*lpAddend)

:: "memory");

return*lpAddend;

}

Android提供了相关的原子操作函数。这里，有必要介绍一下各个函数的作用。

[-->Atomic.h]，注意该文件位置在system/core/include/cutils目录中。

//原子赋值操作，结果是*addr=value

void android_atomic_write(int32_t value,volatile int32_t* addr);

//下面所有函数的返回值都是操作前的旧值

//原子加1和原子减1

int32_t android_atomic_inc(volatile int32_t*addr);

int32_t android_atomic_dec(volatile int32_t*addr);

//原子加法操作，value为被加数

int32_t android_atomic_add(int32_t value,volatile int32_t* addr);

//原子“与”和“或”操作

int32_t android_atomic_and(int32_t value,volatile int32_t* addr);

int32_t android_atomic_or(int32_t value,volatile int32_t* addr);

条件交换的原子操作。只有在oldValue等于*addr时，才会把newValue赋值给*addr

这个函数的返回值须特别注意。返回值非零，表示没有进行赋值操作。返回值为零，表示

进行了原子操作。

int android_atomic_cmpxchg(int32_t oldvalue,int32_t newvalue,

volatile int32_t*addr);

有兴趣的话，读者可以对上述函数的实现进行深入研究，其中，

· X86平台的实现在system/core/libcutils/Atomic.c中，注意其代码在#elif defined(__i386__) || defined(__x86_64__)所包括的代码段内。

· ARM平台的实现在system/core/libcutils/atomic-android-arm.S汇编文件中。

原子操作的最大好处在于避免了锁的使用，这对整个程序运行效率的提高有很大帮助。目前，在多核并行编程中，最高境界就是完全不使用锁。当然，它的难度可想而知是巨大的。

5.4 Looper和Handler类分析

就应用程序而言，Android系统中Java的和其他系统上的相同，是靠消息驱动来工作的，它们大致的工作原理如下：

· 有一个消息队列，可以往这个消息队列中投递消息。

· 有一个消息循环，不断从消息队列中取出消息，然后处理。

我们用图5-1来展示这个工作过程：

图5-1 线程和消息处理原理图

从图中可以看出：

· 事件源把待处理的消息加入到消息队列，一般是加至队列尾，一些优先级高的消息也可以加至队列头。事件源提交的消息可以是按键、触摸屏等物理事件产生的消息，也可以是来自系统或应用程序本身发出的请求消息。

· 处理线程不断从消息队列头中取出消息并处理，事件源可以把优先级高的消息放到队列头，这样，优先级高的消息就会首先被处理。

在Android系统中，这些工作主要由Looper和Handler来实现：

· Looper类，用于封装消息循环，并且有一个消息队列。

· Handler类，有点像辅助类，它封装了消息投递，消息处理等接口。

Looper类是其中的关键。先来看看它是怎么做的。

5.4.1 Looper类的分析

我们以Looper使用的一个常见例子来分析Looper类。

[-->例子1]

//定义一个LooperThread

class LooperThread extends Thread {

publicHandler mHandler;

public void run() {

//① 调用prepare

Looper.prepare();

......

//② 进入消息循环

Looper.loop();

}

//应用程序使用LooperThread

{

......

newLooperThread().start();//启动新线程，线程函数是run

}

上面的代码一共有两个关键调用，我们对其逐一进行分析。

1. 准备好了吗？

第一个调用函数是Looper的prepare函数。它会做什么工作呢？其代码如下所示：

[-->Looper.java]

publicstatic final void prepare() {

//一个Looper只能调用一次prepare

if(sThreadLocal.get() != null) {

thrownew RuntimeException("Only one Looper may be created per thread");

}

//构造一个Looper对象，设置到调用线程的局部变量中

sThreadLocal.set(newLooper());

}

//sThreadLocal定义

private static final ThreadLocal sThreadLocal =new ThreadLocal();

ThreadLocal是Java中的线程局部变量类，全名应该是Thread Local Variable。我觉得，它的实现和操作系统提供的线程本地存储（TLS）有关系。总之，该类有两个关键函数：

· set：设置调用线程的局部变量。

· get：获取调用线程的局部变量。

注意，set/get的结果都和调用这个函数的线程有关。ThreadLocal类可参考JDK API文档或Android API文档。

根据上面的分析可知，prepare会在调用线程的局部变量中设置一个Looper对象。这个调用线程就是LooperThread的run线程。先看看Looper对象的构造，其代码如下所示：

[-->Looper.java]

private Looper(){

//构造一个消息队列

mQueue =new MessageQueue();

mRun =true;

//得到当前线程的Thread对象

mThread =Thread.currentThread();

}

prepare函数很简单，它主要干了一件事：

· 在调用prepare的线程中，设置了一个Looper对象，这个Looper对象就保存在这个调用线程的TLV中。而Looper对象内部封装了一个消息队列。

也就是说，prepare函数通过ThreadLocal机制，巧妙地把Looper和调用线程关联在一起了。要了解这样做的目的是什么，需要再看第二个重要函数。

2. Looper循环

代码如下所示：

[-->Looper.java]

public static final void loop() {

Looper me = myLooper();//myLooper返回保存在调用线程TLV中的Looper对象

//取出这个Looper的消息队列

MessageQueue queue = me.mQueue;

while (true) {

Message msg = queue.next();

//处理消息，Message对象中有一个target，它是Handler类型

//如果target为空，则表示需要退出消息循环

if (msg != null) {

if (msg.target == null) {

return;

}

//调用该消息的Handler，交给它的dispatchMessage函数处理

msg.target.dispatchMessage(msg);

msg.recycle();

}

//myLooper函数返回调用线程的线程局部变量，也就是存储在其中的Looper对象

public static final Looper myLooper() {

return (Looper)sThreadLocal.get();

}

通过上面的分析会发现，Looper的作用是：

· Looper封装了一个消息队列。

· Looper的prepare函数把这个Looper和调用prepare的线程（也就是最终的处理线程）绑定在一起了。

· 处理线程调用loop函数，处理来自该消息队列的消息。

当事件源向这个Looper发送消息的时候，其实是把消息加到这个Looper的消息队列里了。那么，该消息就将由和Looper绑定的处理线程来处理。那么，事件源又是怎么向Looper消息队列添加消息的呢？来看下一节。

3. Looper、Message和Handler的关系

Looper、Message和Handler之间也存在暧昧关系，不过要比RefBase那三个简单得多，用两句话就可以说清楚：

· Looper中有一个Message队列，里边存储的是一个个待处理的Message。

· Message中有一个Handler，这个Handler是用来处理Message的。

其中，Handler类封装了很多琐碎的工作。先来认识一下这个Handler。

5.4.2 Handler分析

1. 初识Handler

Handler中所包括的成员：

[-->Handler.java]

final MessageQueue mQueue;//Handler中也有一个消息队列

final Looper mLooper;//也有一个Looper

final Callback mCallback;//有一个回调用的类

这几个成员变量是怎么使用的呢？这首先得分析Handler的构造函数。Handler一共有四个构造函数，它们主要的区别，是在对上面三个重要成员变量的初始化上。我们试对其进行逐一分析。

[-->Handler.java]

//构造函数1

public Handler() {

//获得调用线程的Looper

mLooper = Looper.myLooper();

if(mLooper == null) {

throw new RuntimeException(......);

}

//得到Looper的消息队列

mQueue = mLooper.mQueue;

//无callback设置

mCallback = null;

}

//构造函数2

publicHandler(Callback callback) {

mLooper = Looper.myLooper();

if(mLooper == null) {

throw new RuntimeException(......);

}

//和构造函数1类似，只不过多了一个设置callback

mQueue = mLooper.mQueue;

mCallback = callback;

}

//构造函数3

publicHandler(Looper looper) {

mLooper = looper; //looper由外部传入，是哪个线程的Looper不确定

mQueue = looper.mQueue;

mCallback = null;

}

//构造函数4，和构造函数3类似，只不过多了callback设置

publicHandler(Looper looper, Callback callback) {

mLooper= looper;

mQueue = looper.mQueue;

mCallback = callback;

}

在上述构造函数中，Handler中的消息队列变量最终都会指向了Looper的消息队列，Handler为何要如此做？

2. Handler的真面目

根据前面的分析可知，Handler中的消息队列实际就是某个Looper的消息队列，那么，Handler做如此安排的目的何在？

在回答这个问题之前，我先来问一个问题：

· 怎么往Looper的消息队列插入消息？

如果不知道Handler，这里有一个很原始的方法：

· 调用Looper的myQueue，它将返回消息队列对象MessageQueue。

· 构造一个Message，填充它的成员，尤其是target变量。

· 调用MessageQueue的enqueueMessage，将消息插入消息队列。

这种原始方法的确很麻烦，且极容易出错。但有了Handler后，我们的工作就变得异常简单了。Handler更像一个辅助类，帮助我们简化编程的工作。

2.1 Handler和Message

Handle提供了一系列函数，帮助我们完成创建消息和插入消息队列的工作。这里只列举其中一二。要掌握详细的API，则需要查看相关文档。

//查看消息队列中是否有消息码是what的消息

final boolean hasMessages(int what)

//从Handler中创建一个消息码是what的消息

final Message obtainMessage(int what)

//从消息队列中移除消息码是what的消息

final void removeMessages(int what)

//发送一个只填充了消息码的消息

final boolean sendEmptyMessage(int what)

//发送一个消息,该消息添加到队列尾

final boolean sendMessage(Message msg)

//发送一个消息，该消息添加到队列头，所以优先级很高

final boolean sendMessageAtFrontOfQueue(Message msg)

只需对上面这些函数稍作分析，就能明白其他的函数。现以sendMessage为例，其代码如下所示：

[-->Handler.java]

public final boolean sendMessage(Message msg)

{

return sendMessageDelayed(msg, 0); //调用sendMessageDelayed

}

[-->Handler.java]

// delayMillis是以当前调用时间为基础的相对时间

public final boolean sendMessageDelayed(Message msg, long delayMillis)

{

if (delayMillis < 0) {

delayMillis = 0;

}

//调用sendMessageAtTime，把当前时间算上

return sendMessageAtTime(msg,SystemClock.uptimeMillis() + delayMillis);

}

[-->Handler.java]

//uptimeMillis 是绝对时间，即sendMessageAtTime函数处理的是绝对时间

public boolean sendMessageAtTime(Message msg, long uptimeMillis){

boolean sent = false;

MessageQueue queue = mQueue;

if (queue != null) {

//把Message的target设置为自己，然后加入到消息队列中

msg.target = this;

sent = queue.enqueueMessage(msg, uptimeMillis);

}

return sent;

}

看到上面这些函数可以想见，如果没有Handler的辅助，当我们自己操作MessageQueue的enqueueMessage时，得花费多大功夫！

Handler把Message的target设为自己，是因为Handler除了封装消息添加等功能外还封装了消息处理的接口。

2.2 Handler的消息处理

刚才，我们往Looper的消息队列中加入了一个消息，按照Looper的处理规则，它在获取消息后，会调用target的dispatchMessage函数，再把这个消息派发给Handler处理。Handler在这块是如何处理消息的呢？

[-->Handler.java]

public void dispatchMessage(Message msg) {

//如果Message本身有callback，则直接交给Message的callback处理

if(msg.callback != null) {

handleCallback(msg);

}else {

//如果本Handler设置了mCallback，则交给mCallback处理

if (mCallback != null) {

if (mCallback.handleMessage(msg)) {

return;

}

//最后才是交给子类处理

handleMessage(msg);

}

dispatchMessage定义了一套消息处理的优先级，它们分别是：

· Message如果自带了callback处理，则交给callback处理。

· Handler如果设置了全局的mCallback，则交给mCallback处理。

· 如果上述都没有，该消息则会被交给Handler子类实现的handleMessage来处理。当然，这需要从Handler派生并重载handleMessage函数。

在通常情况下，我们一般都是采用第三种方法，即在子类中通过重载handleMessage来完成处理工作的。

至此，Handler知识基本上讲解完了，可是在实际编码过程中还有一个重要问题需要警惕。下一节内容就将谈及此问题。

5.4.3 Looper和Handler的同步关系

Looper和Handler会有什么同步关系呢？它们之间确实有同步关系，而且如果不注意此关系，定要铸成大错！

同步关系肯定和多线程有关，看下面的一个例子：

[-->例子2]

//先定义一个LooperThread类

class LooperThread extends Thread {

publicLooper myLooper = null;//定义一个public的成员myLooper，初值为空。

public void run() { //假设run在线程2中执行

Looper.prepare();

// myLooper必须在这个线程中赋值

myLooper = Looper.myLooper();

Looper.loop();

}

//下面这段代码在线程1中执行，并且会创建线程2

{

LooperThreadlpThread= new LooperThread;

lpThread.start();//start后会创建线程2

Looper looper = lpThread.myLooper;//<======注意

// thread2Handler和线程2的Looper挂上钩

Handler thread2Handler = new Handler(looper);

//sendMessage发送的消息将由线程2处理

threadHandler.sendMessage(...)

}

上面这段代码的目的很简单：

· 线程1中创建线程2，并且线程2通过Looper处理消息。

· 线程1中得到线程2的Looper，并且根据这个Looper创建一个Handler，这样发送给该Handler的消息将由线程2处理。

但很可惜，上面的代码是有问题的。如果我们熟悉多线程，就会发现标有“注意”的那行代码存在着严重问题。myLooper的创建是在线程2中，而looper的赋值则在线程1，很有可能此时线程2的run函数还没来得及给myLooper赋值，这样线程1中的looper将取到myLooper的初值，也就是looper等于null。另外，

Handler thread2Handler = new Handler(looper) 不能替换成

Handler thread2Handler = new Handler(Looper.myLooper())

这是因为，myLooper返回的是调用线程的Looper，即Thread1的Looper，而不是我们想要的Thread2的Looper。

对这个问题，可以采用同步的方式进行处理。你是不是有点迫不及待地想完善这个例子了？其实Android早就替我们想好了，它提供了一个HandlerThread来解决这个问题。

5.4.4 HandlerThread介绍

HandlerThread完美地解决了myLooper可能为空的问题。来看看它是怎么做的。代码如下所示：

[-->HandlerThread]

public class HandlerThread extends Thread{

//线程1调用getLooper来获得新线程的Looper

publicLooper getLooper() {

......

synchronized (this) {

while (isAlive() && mLooper == null) {

try {

wait();//如果新线程还未创建Looper，则等待

} catch (InterruptedException e) {

}

return mLooper;

}

//线程2运行它的run函数，looper就是在run线程里创建的。

publicvoid run() {

mTid = Process.myTid();

Looper.prepare(); //创建这个线程上的Looper

synchronized (this) {

mLooper = Looper.myLooper();

notifyAll();//通知取Looper的线程1，此时Looper已经创建好了。

}

Process.setThreadPriority(mPriority);

onLooperPrepared();

Looper.loop();

mTid = -1;

}

HandlerThread很简单，小小的wait/ notifyAll就解决了我们的难题。为了避免重复发明轮子，我们还是多用HandlerThread类吧！

5.5 本章小结

本章主要分析了Android代码中最常见的几个类：其中在Native层包括与对象生命周期相关的RefBase、sp、wp、LightRefBase类，以及Android为多线程编程提供的Thread类和相关的同步类；Java层则包括使用最为广泛的Handler类和Looper类。另外，还分析了方类HandlerThread，它降低了创建和使用带有消息队列的线程的难度。

① 本书中文版由机械工业出版社出版，原书作者Jeffrey Richter。

第5章 深入理解常见类

5.1 综述

5.2 以“三板斧”揭秘RefBase、sp和wp

5.2.1 第一板斧——初识影子对象

1. RefBase和它的影子

2. sp上场

（1）眼见而心不烦

（2）sp构造的影响

（3）wp构造的影响

（4）wp析构的影响

（5）sp析构的影响

3. 第一板斧的结果

5.2.2 第二板斧——由弱生强

1. 由弱生强的方法

2. 成败在此一举

3. 第二板斧的结果

5.2.3 第三板斧——破解生死魔咒

1. 延长生命的魔咒

2. LIFETIME_WEAK的魔力

3. 魔咒大揭秘

5.2.4 轻量级的引用计数控制LightRefBase

5.2.5 题外话——三板斧的来历

5.3 Thread类以及常用同步类的分析

5.3.1 一个变量引发的思考

1. 一个变量，两种处理

2. zygote偷梁换柱

3. 费力而讨好

4. 线程函数_threadLoop介绍

5.3.2 常用同步类

1. 互斥类——Mutex

（1）Mutex介绍

（2）AutoLock介绍

2. 条件类——Condition

3. 原子操作函数介绍

5.4 Looper和Handler类分析

5.4.1 Looper类的分析

1. 准备好了吗？

2. Looper循环

3. Looper、Message和Handler的关系

5.4.2 Handler分析

1. 初识Handler

2. Handler的真面目

2.1 Handler和Message

2.2 Handler的消息处理

5.4.3 Looper和Handler的同步关系

5.4.4 HandlerThread介绍

5.5 本章小结

第5章深入理解常见类