为代表性的 crackme 总结相关知识点。一緒に頑張りましょう!
[TOC]
来自福建海峡两岸CTF 2015。
相关函数:
signed int __fastcall JNI_OnLoad(_JavaVM *a1)
((int (__fastcall *)(_JavaVM *, _JNIEnv **, signed int))v1->functions->GetEnv)(v1, &v8, 65540)
/* v1:JavaVM v8:JniEnv 65540:jni version */
((int (__fastcall *)(_JNIEnv *, char *))v3->functions->FindClass)(v3, v4)
/* v3:JNIEnv v4:类名 */
((int (__fastcall *)(_JNIEnv *, int, char **, signed int))v3->functions->RegisterNatives)(v3, v5, off_400C, 2)
/* v3:JniEnv v5:FindClass得到的jclass对象 off_400C:要注册的methods 2:注册的methods个数
method的格式为:函数名 函数描述(smali格式) 函数指针
例如(in ida):
DCD aHello ; "hello"
DCD aLjavaLangStr_1 ; "()Ljava/lang/String;"
DCD native_hello+1
*/
根据 linker 源码, section 的执行顺序为 .preinit_array
-> .init
-> .init_array
。但 so 是不会执行 .preinit_array
的, 可以忽略。
.init_array
是一个函数指针数组。编写代码时在函数声明时加上 __attribute__((constructor))
使之成为共享构造函数,即可使该函数出现在 .init_array
section 中。
IDA 动态调试时 'ctrl+s' 查看 section 信息即可定位这两个 setction,特别的,对于 .init_array
,可通过搜索 Calling %s @ %p for '%s'
定位。
部分源码:
void soinfo::CallConstructors() {
...
// DT_INIT should be called before DT_INIT_ARRAY if both are present.
CallFunction("DT_INIT", init_func);
CallArray("DT_INIT_ARRAY", init_array, init_array_count, false); // CallArray 中也会调用 CallFunction 函数
}
void soinfo::CallFunction(const char* function_name UNUSED, linker_function_t function) {
if (function == NULL || reinterpret_cast<uintptr_t>(function) == static_cast<uintptr_t>(-1)) {
return;
}
TRACE("[ Calling %s @ %p for '%s' ]", function_name, function, name);
function();
TRACE("[ Done calling %s @ %p for '%s' ]", function_name, function, name);
// The function may have called dlopen(3) or dlclose(3), so we need to ensure our data structures
// are still writable. This happens with our debug malloc (see http://b/7941716).
set_soinfo_pool_protection(PROT_READ | PROT_WRITE);
}
来自 RCTF 2015。
快速简记:
结构 | 单位结构体占字节 | 共计字节 |
---|---|---|
DexHeader | - | 0x70h |
String Table | 4 | - |
Type Table | 4 | - |
Proto Table | 12 | - |
Field Table | 8 | - |
Method Table | 8 | - |
Class Def Table | 32 | - |
Data Section(含Map Section) | - | - |
来自 0CTF 2015。
常规方法静态分析
搜索:strings easyre.sjl.gossip.easyre.hprof | grep 0ctf
gdb 附加进程后直接执行 gcore
dump,搜索:strings core.7967 | grep 0ctf
来自 AliCTF 2016。
指令参考这里👉dalvik bytecode
来自 AliCTF 2016。
R0、R1、R2、R3, 在调用函数时,用来存放前4个函数参数;如果函数的参数多于 4 个,则多余参数存放在堆栈当中; 低于32位的函数返回值存于 R0。
寄存器 | 作用 |
---|---|
R0 ~ R3 | 调用函数时,用来存放前4个函数参数 |
R0 | 函数返回时,存放低于32位的函数返回值 |
R4 ~ R11 | 保存局部变量。进入函数时必须保存所用到的局部变量寄存器的值,在返回前必须恢复这些寄存器的值;对于函数中没有用到的寄存器则不必进行这些操作。 在Thumb中,通常只能使用寄存器 R4~R7来保存局部变量, 所以函数内部通用的入栈出栈代码可以为: STMFD sp!,{r4-r11,lr} // body of ASM code LDMFD sp!,{r4-r11,pc} |
R12 | 用作 IP,内部调用暂时寄存器 |
R13 | 用作 SP,栈指针,sp 中存放的值在退出被调用函数时必须与进入时的值相同。 |
R14 | 用作 LR,链接寄存器,保存函数的返回地址;如果在函数中保存了返回地址,寄存器R14 则可以用作其他用途 |
R15 | 用作 PC,程序计数器 |
R16 | CPSR,状态寄存器 |
来自 看雪CTF 2017。
SHA1 值。
- 读取 /proc/pid/status 的 State 是否为 t
- 读取 /proc/pid/status 的 TracerPid 是否不为0
- 读取 /proc/pid/wchan 是否有 ptrace_stop
对称性加密,典型的 DES 以64 位二进制为分组
对数据加密。
如果明文不是 64 位(16个16进制位)的整数倍,则加密前,这段文本必须在尾部补充一些额外的字节
。
在运算时需要根据特定的表格
以 64 位为单位对明文和秘钥分别进行置换操作
。
对称性加密。主要操作是异或和循环左移
。
// Encryption/Decryption with RC6-w/r/b
//
// Input: Plaintext stored in four w-bit input registers A, B, C & D
// r is the number of rounds
// w-bit round keys S[0, ... , 2r + 3]
//
// Output: Ciphertext stored in A, B, C, D
//
// '''Encryption Procedure:'''
B = B + S[0]
D = D + S[1]
for i = 1 to r do
{
t = (B*(2B + 1)) <<< lg w
u = (D*(2D + 1)) <<< lg w
A = ((A ⊕ t) <<< u) + S[2i]
C = ((C ⊕ u) <<< t) + S[2i + 1]
(A, B, C, D) = (B, C, D, A)
}
A = A + S[2r + 2]
C = C + S[2r + 3]
来自 看雪CTF 2017。
本例中的花指令有以下几种:
B loc_XXXX
PUSH {R0,R4,R5,R7,LR}
SUB SP, SP, #8
MOV R2, R2
ADD SP, SP, #8
ADD.W R0, R0, #1
SUB.W R0, R0, #1
MOV R3, R3
POP.W {R0,R4,R5,R7,LR}
ADD.W R1, R1, #1
SUB.W R1, R1, #1
PUSH.W {R4-R10,LR}
POP.W {R4-R10,LR}
去花即将规律的花指令 nop 掉并修复跳转,ida 中的去花脚本编写可参考 IDA 的 idc 或 idapython API。
为了使 IDA 识别某个函数X,需要在 Functions Window 统统删除之前函数X中误将 junk code 识别为函数的垃圾函数,手动设置函数X的结尾(Edit - Functions - set function end)。
函数尾部特征:
BLX __stack_chk_fail
-> 堆栈保护POP {R4-R7,PC} (与函数头 PUSH {R4-R7,LR} 对应)
-> 堆栈平衡
本例去花可参考:1( HideArea 方便分析)、2( NOP并修改跳转 )
对称性加密。由伪随机数生成器和异或运算
组成。密钥长度范围是[1,255]。
RC4一个字节一个字节地加解密。给定一个密钥,伪随机数生成器接受密钥并产生一个S盒。S盒用来加密数据,而且在加密过程中S盒会变化。
伪代码:
for i from 0 to 255
S[i] := i
endfor
j := 0
for( i=0 ; i<256 ; i++)
j := (j + S[i] + key[i mod keylength]) % 256
swap values of S[i] and S[j]
endfor
i := 0
j := 0
while GeneratingOutput:
i := (i + 1) mod 256 //a
j := (j + S[i]) mod 256 //b
swap values of S[i] and S[j] //c
k := inputByte ^ S[(S[i] + S[j]) % 256]
output K
endwhile
来自 LCTF 2016.
在自身应用中,Java 代码在被执行时权限为只读,SMC 只会发生在 NDK 层。一般步骤如下:
- 通过搜索 DEX 特征码来找到 DEX 的起始地址;
- 解析 dex 格式定位到具体的类以及方法,找到要修改的 dalvik 字节码;
- 重新映射内存段,修改内存。
对于本例:(只对 dalvik 有效)
读取 self maps 文件找到 odex 的内存地址 -> 解析dex -> 遍历 classDefs 找到两个函数地址 -> mprotect 修改内存属性 -> 函数替换 -> 将内存属性改回。
论文参考:《基于 SMC 的 Android 软件保护研究与实现》
来自 NJCTF 2017.
NativeActivity 是 android SDK 自带的一个 activity,本例将其作为主 activity,使得 dex 中没有 Java 代码。
NativeActivity 所在的 so 在 manifest 中有注册,固定格式:
<meta-data android:name="android.app.lib_name" android:value="SONAME" />
入口函数是 android_main()
。可以这样找到它:
- 函数
ANativeActivity_onCreate
j_j_pthread_create((pthread_t *)v4 + 20, &attr, (void *(*)(void *))sub_XXX, v4);
- 进入 sub_XXX ,即可看到
android_main(v1);
关于 NativeActivity 原理,参考这里。