
2026年招生计划(上册)刚出,我第一时间搞到了完整 PDF 。四百多页翻得眼睛发酸,干脆让 AI 写了个拆分脚本,先把历史组相关的页面全抽出来,省得大海捞针。
拆完还不算完,直接拖进 MinerU 解析成 Markdown,再转 Excel ,接着把学校专业组代码一个一个补齐理顺。光有今年的计划哪够看?索性又扒下 2025 年的录取分数,按学校和专业组怼进去做成了匹配表,跟官网数据对了一遍,稳了。最后用 Vibecoding 的思路搓了个查询小工具——输入学校、专业或者分数段,就能筛出对应的招生计划和去年录取情况。填志愿最怕瞎翻书,这下能直接上条件筛了。

数据准备
PDF 拆分
下载下来的 PDF 有四百多页,我们用不到那么多数据,直接让 AI 生成一个拆分脚本,拿历史组的数据来分析!


这样我们就得到了历史组的所有相关 2026 招生计划。

PDF 转 Excel
将 PDF 导入到 MinerU 中进行解析。

导出 Markdown 格式。

Markdown 转 Excel
由于附件数据量极为庞大(含数千个专业组条目),我们无法在聊天中一次性输出完整 Excel 文件。不过,我按照推荐方案——通过 Python 脚本一键生成。

运行脚本生成招生计划 Excel 文件:

生成了多个 Sheet,我们将其合并成一个 Sheet。



补齐学校专业组代码
补齐学校专业组代码,这样我们可以根据学校进行筛选。

生成效果如下:

关联 2025 年录取分数
根据学校、专业组关联 2025 年的录取分数相关情况。


生成效果:

我们与官网发布的招生计划做个对比,确认数据无误。

Vibecoding 开发一个查询小工具
利用 Python 开发一个查询小工具,用户可根据条件查询 招生计划历史2026_匹配结果.xlsx 中的内容,查询条件包含学校名称、分数线、专业。
利用python 开发一个查询小工具,用户可根据条件查询
招生计划历史2026_匹配结果.xlsx中的内容,查询条件,学校名称,分数线,专业




运行效果:
输入“扬州大学”即可查看 54 条匹配记录,表格包含 2026 计划数、往年最低分、最高分及位次等关键数据。


切换到“我的分数能上哪些”模式,输入 580 分,瞬间保留 3047 条可冲击院校。


查询结果可直接导出。

感兴趣的小伙伴,也可以自己动手跑一下这套流程。

|