云栈社区»论坛 › 技术文档「 Note & Doc 」 › 攻防演练目标资产名称自动化纠正：Python脚本实现与实战 ...

发回帖发新帖

5872 积分	0 好友	727 主题

发消息

攻防演练目标资产名称自动化纠正：Python脚本实现与实战

发表于 2026-3-5 08:25:07 | 查看: 245| 回复: 0

在攻防演练中，经常会遇到目标单位名称出错的情况，导致在搜集资产时发现查无此家。比如浙江某医院第六院，直接给出简称“浙江中医六院”，或者某单位改了公司名但备案信息未更新等。手动纠错费时费力，在拼手速的攻防演练前期阶段非常吃亏，因此我决定编写一个脚本来实现大规模的目标名称自动化纠正。

我的大致思路是找一个类似于爱企查的网站，抓包后进行参数替换实现批量请求。尝试发现，爱企查、天眼查等网站参数校验极为严格，很难实现这个功能。最终在 https://riskbird.com/ 这个网站上找到了可行的办法。

首先，我编写了一个函数 req_riskbird 来调用风鸟网站的搜索 API：

def req_riskbird(company_name, token):
    url = "https://riskbird.com/riskbird-api/newSearch"
    headers = {
        "Host": "riskbird.com",
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36",
        "Accept": "application/json",
        "App-Device": "WEB",
        "Content-Type": "application/json",
        "Origin": "https://riskbird.com",
        "Referer": "https://riskbird.com/search/company",
        "Accept-Language": "zh-CN,zh;q=0.9",
        "Cookie": f"token={token}; app-device=WEB;"
    }
    payload = {
        "queryType": "1",
        "searchKey": company_name,
        "pageNo": 1,
        "range": 10,
        "selectConditionData": "{\"status\":\"\",\"sort_field\":\"\"}"
    }
    try:
        response = requests.post(url, headers=headers, json=payload)
        response.raise_for_status()  # Raise an exception for HTTP errors
        data = response.json()
        if data.get("code") == 20000 and data.get("success"):
            # Extract company names from the response
            company_names = []
            for company in data.get("data", {}).get("list", []):
                if "entName" in company:
                    company_names.append(company["entName"])
            return company_names
        else:
            print(f"Error: {data.get('msg', 'Unknown error')}")
            return []
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return []
    except json.JSONDecodeError:
        print("Failed to parse response as JSON")
        return []

指定关键词“美的”进行测试，功能正常。接下来要实现自动化纠错，我设计了两种模式：num 参数为 1 时代表默认选择名字匹配率最高的公司，2 代表手动选择公司。

def compare_company(company_name, num, token):
    # 调用 req_riskbird 函数获取公司名称列表
    company_names = req_riskbird(company_name, token)
    if not company_names:
        # 如果没有返回任何公司名，则返回空列表
        print("未找到相关公司:", company_name)
        return []
    if num == 1:
        # 如果选择 1，返回第一个结果
        return [company_names[0]]
    elif num == 2:
        # 如果选择 2，返回所有结果并允许用户手动选择
        print("以下是搜索到的所有公司名称：")
        for i, name in enumerate(company_names, 1):
            print(f"{i}. {name}")
        # 用户选择公司
        try:
            print("搜索单位:", company_name)
            selected = int(input("请输入选择的公司编号："))
            if 1 <= selected <= len(company_names):
                return [company_names[selected - 1]]
            else:
                print("无效的选择")
                return []
        except ValueError:
            print("无效的输入")
            return []
    else:
        print("无效的 num 参数")
        return []

直接指定参数 2 进行输入，功能正常。但我们的目标是从文件中批量读取公司名称进行纠错。

def read_file():
    """
    读取同目录下的 tar.txt 文件，将每行内容（公司名称）存入列表并返回
    参数：
        无
    返回值：
        list: 包含所有公司名称的列表
    异常：
        如果文件读取失败，将抛出相应的异常
    """
    company_list = []
    try:
        with open('tar.txt', 'r', encoding='utf-8') as file:
            for line in file:
                # 去除每行的空格和换行符
                company_name = line.strip()
                if company_name:  # 确保不添加空行
                    company_list.append(company_name)
        return company_list
    except FileNotFoundError:
        raise FileNotFoundError("错误：tar.txt 文件不存在")
    except IOError:
        raise IOError("错误：无法读取 tar.txt 文件")
    except Exception as e:
        raise Exception(f"读取文件时发生错误: {str(e)}")

比如这次这家单位使用了简称，在工具的帮助下成功纠错，使得能够正常搜集信息，实现突破。另一个例子是“浙江省中山医院”，其全称为“浙江中医药大学附属第三医院（浙江省中山医院）”，脚本也能准确识别。

最终，我将所有功能整合成一个完整的Python脚本：

import requests
import json
import argparse

def read_file():
    """
    读取同目录下的 tar.txt 文件，将每行内容（公司名称）存入列表并返回
    参数：
        无
    返回值：
        list: 包含所有公司名称的列表
    异常：
        如果文件读取失败，将抛出相应的异常
    """
    company_list = []
    try:
        with open('tar.txt', 'r', encoding='utf-8') as file:
            for line in file:
                # 去除每行的空格和换行符
                company_name = line.strip()
                if company_name:  # 确保不添加空行
                    company_list.append(company_name)
        return company_list
    except FileNotFoundError:
        raise FileNotFoundError("错误：tar.txt 文件不存在")
    except IOError:
        raise IOError("错误：无法读取 tar.txt 文件")
    except Exception as e:
        raise Exception(f"读取文件时发生错误: {str(e)}")

def req_riskbird(company_name, token):
    url = "https://riskbird.com/riskbird-api/newSearch"
    headers = {
        "Host": "riskbird.com",
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36",
        "Accept": "application/json",
        "App-Device": "WEB",
        "Content-Type": "application/json",
        "Origin": "https://riskbird.com",
        "Referer": "https://riskbird.com/search/company",
        "Accept-Language": "zh-CN,zh;q=0.9",
        "Cookie": f"token={token}; app-device=WEB;"
    }
    payload = {
        "queryType": "1",
        "searchKey": company_name,
        "pageNo": 1,
        "range": 10,
        "selectConditionData": "{\"status\":\"\",\"sort_field\":\"\"}"
    }
    try:
        response = requests.post(url, headers=headers, json=payload)
        response.raise_for_status()  # Raise an exception for HTTP errors
        data = response.json()
        if data.get("code") == 20000 and data.get("success"):
            # Extract company names from the response
            company_names = []
            for company in data.get("data", {}).get("list", []):
                if "entName" in company:
                    company_names.append(company["entName"])
            return company_names
        else:
            print(f"Error: {data.get('msg', 'Unknown error')}")
            return []
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return []
    except json.JSONDecodeError:
        print("Failed to parse response as JSON")
        return []

def compare_company(company_name, num, token):
    """
    该函数通过调用 req_riskbird 函数，获取与公司名称相关的搜索结果，
    根据 num 的值来返回用户选择的企业名称。
    参数：
        company_name (str): 需要查询的目标公司名称
        num (int): 选择显示结果的方式，1表示选择第一个结果，2表示输出所有结果并手动选择
        token (str): 用户登录后获取的授权令牌，用于 API 鉴权
    返回值：
        list: 包含用户选择的公司名称的列表，若查询失败或没有结果，则返回空列表。
    异常：
        若调用 req_riskbird 发生异常，将返回空列表。
    """
    # 调用 req_riskbird 函数获取公司名称列表
    company_names = req_riskbird(company_name, token)
    if not company_names:
        # 如果没有返回任何公司名，则返回空列表
        print("未找到相关公司:", company_name)
        return []
    if num == 1:
        # 如果选择 1，返回第一个结果
        return [company_names[0]]
    elif num == 2:
        # 如果选择 2，返回所有结果并允许用户手动选择
        print("以下是搜索到的所有公司名称：")
        for i, name in enumerate(company_names, 1):
            print(f"{i}. {name}")
        # 用户选择公司
        try:
            print("搜索单位:", company_name)
            selected = int(input("请输入选择的公司编号："))
            if 1 <= selected <= len(company_names):
                return [company_names[selected - 1]]
            else:
                print("无效的选择")
                return []
        except ValueError:
            print("无效的输入")
            return []
    else:
        print("无效的 num 参数")
        return []

# Example usage
if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="主程序功能：根据输入查询公司信息。")
    parser.add_argument("-n", "--num", type=int, choices=[1, 2], default=1,
                        help="选择查询方式：1 - 默认选择匹配度最高的公司；2 - 手动选择公司")
    parser.add_argument("-f", "--file", type=str, default="tar.txt",
                        help="存放公司名称的文件路径，默认为当前目录下的 'tar.txt'")
    parser.add_argument("-t", "--token", type=str, required=True,
                        help="风鸟网站的认证令牌，用于 API 鉴权")
    args = parser.parse_args()
    company_list = read_file()
    res = []
    for i in company_list:
        res.extend(compare_company(i, args.num, args.token))
    for j in res:
        print(j)
    print(f"\n输入{len(company_list)}家公司,输出{len(res)}家公司")

这个脚本通过简单的命令行参数调用，可以快速纠正目标资产名称，提升攻防演练中的效率。如果你对这类自动化工具有更多想法或需要讨论，欢迎在云栈社区分享和交流。

上一篇：OpenClaw编排Claude Code与Codex Agent：实战分层AI开发架构指南
下一篇：UpSnap：开源网络唤醒工具，实现远程一键开机与管理

Python, 攻防演练, 网络安全, 自动化, 资产管理

攻防演练目标资产名称自动化纠正：Python脚本实现与实战

相关帖子