TestBird 移动互联测试专家

APP黑屏和卡死,高并发兼容性问题开发者应该如何应对?

APP黑屏和卡死,高并发兼容性问题开发者应该如何应对?

开发者总是在同各种各样的BUG作斗争,据TestBird发布的《2014年中国手游兼容性测试白皮书》数据显示,黑屏和卡死在各类BUG类型中占据20%以上的比例。针对这类问题开发者应该如何应对呢?小编为大家整理了以下解决黑屏和卡死的方法。

一:什么是ANR
ANR:Application Not Responding,即应用无响应

二:ANR的类型

ANR一般有三种类型:
1. KeyDispatchTimeout(5 seconds) –主要类型按键或触摸事件在特定时间内无响应
2. BroadcastTimeout(10 seconds) –BroadcastReceiver在特定时间内无法处理完成
3. ServiceTimeout(20 seconds) –小概率类型 Service在特定的时间内无法处理完成

三:KeyDispatchTimeout

Akey or touch event was not dispatched within the specified time(按键或触摸事件在特定时间内无响应)
具体的超时时间的定义在framework下的ActivityManagerService.java
//How long we wait until we timeout on key dispatching.
staticfinal int KEY_DISPATCHING_TIMEOUT = 5*1000

四:为什么会超时呢?

超时时间的计数一般是从按键分发给app开始。超时的原因一般有两种:
(1)当前的事件没有机会得到处理(即UI线程正在处理前一个事件,没有及时的完成或者looper被某种原因阻塞住了)
(2)当前的事件正在处理,但没有及时完成

五:如何避免KeyDispatchTimeout

1. UI线程尽量只做跟UI相关的工作
2. 耗时的工作(比如数据库操作,I/O,连接网络或者别的有可能阻碍UI线程的操作)把它放入单独的线程处理
3. 尽量用Handler来处理UIthread和别的thread之间的交互

六:UI线程

说了那么多的UI线程,那么哪些属于UI线程呢?
UI线程主要包括如下:
1. Activity:onCreate(), onResume(), onDestroy(), onKeyDown(), onClick(),etc
2. AsyncTask: onPreExecute(), onProgressUpdate(), onPostExecute(), onCancel,etc
3. Mainthread handler: handleMessage(), post*(runnable r), etc
4. other

七:如何去分析ANR
先看个LOG:

从LOG可以看出ANR的类型,CPU的使用情况,如果CPU使用量接近100%,说明当前设备很忙,有可能是CPU饥饿导致了ANR
如果CPU使用量很少,说明主线程被BLOCK了
如果IOwait很高,说明ANR有可能是主线程在进行I/O操作造成的
除了看LOG,解决ANR还得需要trace.txt文件,
如何获取呢?可以用如下命令获取
$chmod 777 /data/anr
$rm /data/anr/traces.txt
$ps
$kill -3 PID
adbpull data/anr/traces.txt ./mytraces.txt

从trace.txt文件,看到最多的是如下的信息:

说明主线程在等待下条消息进入消息队列

八:Thread状态

ThreadState (defined at “dalvik/vm/thread.h “)
THREAD_UNDEFINED = -1, /* makes enum compatible with int32_t */
THREAD_ZOMBIE = 0, /* TERMINATED */
THREAD_RUNNING = 1, /* RUNNABLE or running now */
THREAD_TIMED_WAIT = 2, /* TIMED_WAITING in Object.wait() */
THREAD_MONITOR = 3, /* BLOCKED on a monitor */
THREAD_WAIT = 4, /* WAITING in Object.wait() */
THREAD_INITIALIZING= 5, /* allocated, not yet running */
THREAD_STARTING = 6, /* started, not yet on thread list */
THREAD_NATIVE = 7, /* off in a JNI native method */
THREAD_VMWAIT = 8, /* waiting on a VM resource */
THREAD_SUSPENDED = 9, /* suspended, usually by GC or debugger */

九:如何调查并解决ANR

1. 首先分析log
2. 从trace.txt文件查看调用stack.
3. 看代码
4. 仔细查看ANR的成因(iowait?block?memoryleak?)

十:案例

案例1:关键词:ContentResolver in AsyncTask onPostExecute, high iowait
原因:IOWait很高,说明当前系统在忙于I/O,因此数据库操作被阻塞
原来:

解决后:

案例2:关键词:在UI线程进行网络数据的读写

关于网络连接,在设计的时候可以设置个timeout的时间或者放入独立的线程来处理。

案例3:关键词:Memoryleak/Thread leak


分析:
atdalvik.system.VMRuntime.trackExternalAllocation(NativeMethod)内存不足导致block在创建bitmap上
**MEMINFO in pid 1360 [android.process.acore] **
native dalvik other total
size: 17036 23111 N/A 40147
allocated: 16484 20675 N/A 37159
free: 296 2436 N/A 2732

TestBird