云栈社区»论坛 › 开源实战「 OpenSource 」 › 逆向分析实战：用奥卡姆剃刀原理修复Android Native中的OLLVM间 ...

发回帖发新帖

1956 积分	0 好友	254 主题

发消息

[C/C++] 逆向分析实战：用奥卡姆剃刀原理修复Android Native中的OLLVM间接跳转混淆

发表于 2026-1-20 04:10:10 | 查看: 75| 回复: 0

本篇聚焦于去除Native代码中的间接跳转（indirect jump）和间接函数调用（indirect call）混淆。这类混淆经常被大型厂商的APP采用，其目的是显著增加静态分析的难度和时间成本。

间接跳转与间接调用的本质是隐藏静态控制流：在静态分析时，你无法直接得知某条跳转或调用指令最终会执行哪个目标地址。最直接的解决思路是让程序实际运行一次，记录运行时真实的跳转/调用目标，然后将这些目标地址“修补”回二进制文件中，从而恢复出可读的控制流。

本文将介绍两种简单、高效且在实践中可行的“暴力”修复思路。它们无需搭建完整的模拟环境，也无需进行复杂的符号化执行：

方法一：暴力NOP替换（速度极快，但会丢失分支信息）
方法二：利用Frida批量Hook（结果更精确，但依赖程序的实际执行路径）

如果你对间接跳转与间接调用的具体实现原理感兴趣，可以参考以下几个OLLVM混淆相关的开源项目：
https://github.com/KomiMoe/Arkari
https://github.com/amimo/goron
https://github.com/DreamSoule/ollvm17

方法一：暴力NOP替换

思路概述

对于那些只需要还原“大体执行逻辑”，而不关心精确条件分支行为的场景，我们可以采取一种最直接的方式：将函数内部所有的 BR/BLR（或类似的间接跳转/调用指令）直接替换为 NOP（空操作）指令，然后合并相邻的基本块。

这样一来，静态反编译器（如IDA）会把原本被混淆打散的控制流重新线性化，从而生成一份便于快速阅读的伪代码，帮助分析师理解大致的函数调用关系与整体数据流。

适用场景

需要快速定位关键的函数调用或数据访问点，对分支还原的精确度要求不高。
分析时间紧迫，希望先获得一份可读的伪代码框架，以便指导后续的深入调查。

优缺点

优点：操作极其快捷，无需运行环境或动态跟踪。
缺点：彻底破坏了原始的控制流结构，所有条件分支（如if/while）信息都将丢失，导致反编译器无法恢复任何分支语义。

具体操作流程

在IDA中，将光标移动到目标函数的入口地址。
运行IDC脚本 fix_blr_2_nop.py。该脚本会执行以下操作：
- 从函数入口开始向后扫描，直到遇到 RET 指令或函数结束。
- 列出该扫描区间内所有 BR 指令的地址。
- 将这些指令批量 Patch 为 NOP，并尝试触发IDA合并基本块。
按下 F5 刷新反编译视图，观察线性化后的伪代码，并继续人工分析。

操作示例

下图展示了一个被混淆函数在IDA反汇编视图中的样子，其中包含了大量的间接跳转指令（如 BR X8）。

IDA反汇编视图展示被混淆函数中的间接跳转指令

运行上述脚本并合并基本块后，原本破碎的控制流被线性连接。此时再查看反编译伪代码，虽然分支逻辑已丢失，但函数的主要调用链和数据流变得清晰可见，便于快速把握函数骨架。下图展示了修复后的效果，可以看到其中仍然存在一些受保护的间接函数调用，这些可以留给后续方法处理。

修复后反编译伪代码显示线性化的调用链

方法二：使用Frida批量Hook（更精确）

思路概述

这种方法分为静态准备和动态收集两步。首先通过静态分析，定位目标函数或模块中所有可能的间接跳转/调用指令（BR、BLR等）。然后，自动生成一个 Frida Hook脚本，在目标程序运行时拦截这些指令，并捕获它们实际执行时的目标地址（通常记录为相对于模块基址的偏移）。

将运行时采集到的目标地址日志导出后，我们再使用IDA Python脚本解析日志，并将二进制文件中原来的间接跳转/调用指令，Patch 为指向具体目标地址的直接跳转/调用指令，从而尽可能精确地恢复出原始控制流。

优缺点

优点：能够恢复程序实际执行过的绝大多数跳转和调用，得到的控制流图更加准确。
缺点：无法覆盖未被执行到的代码路径；如果某个条件分支在本次运行中未被触发，其对应的跳转也无法修复；该方法需要目标程序能够在特定环境中运行并加载待分析的SO库。

具体操作流程

静态定位目标指令：在IDA中使用脚本扫描待修复的函数或模块，记录所有 BR/BLR 指令的地址。
自动生成Frida脚本：按 Alt+F7 运行脚本 toolchain_trace_indirect_jumps.py，它会根据上一步的扫描结果，生成一个包含了所有待Hook地址的Frida JavaScript脚本。
调整脚本：将生成的脚本中的模块名称修改为你实际要分析的SO名称，并确认日志输出格式（建议包含模块偏移、指令地址、寄存器值等关键信息）。
启动与注入：以spawn模式启动被测应用并注入Frida脚本（spawn模式有助于在进程早期就捕获到初始化流程）。
- 使用 frida -U -f com.example.app -l script.js 命令来启动并注入。
- 操作应用，确保执行流程经过那些被混淆的间接跳转/调用位置。
保存日志：将Frida控制台输出的地址信息保存为文本文件。
应用补丁：在IDA中运行补丁脚本 fix_indirect_jump.py（或自行编写的脚本），该脚本会解析日志文件，并将对应的间接指令替换为直接指令。
验证结果：刷新反编译视图（F5），查看修复后的控制流，并进行人工验证。