找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3959

积分

0

好友

519

主题
发表于 1 小时前 | 查看: 4| 回复: 0

一条水平的灰色渐变条,中间为深灰色,两端逐渐变浅至白色背景,整体呈模糊的虚化效果

2026年招生计划(上册)刚出,我第一时间搞到了完整 PDF 。四百多页翻得眼睛发酸,干脆让 AI 写了个拆分脚本,先把历史组相关的页面全抽出来,省得大海捞针。
拆完还不算完,直接拖进 MinerU 解析成 Markdown,再转 Excel ,接着把学校专业组代码一个一个补齐理顺。光有今年的计划哪够看?索性又扒下 2025 年的录取分数,按学校和专业组怼进去做成了匹配表,跟官网数据对了一遍,稳了。最后用 Vibecoding 的思路搓了个查询小工具——输入学校、专业或者分数段,就能筛出对应的招生计划和去年录取情况。填志愿最怕瞎翻书,这下能直接上条件筛了。

2026年招生计划历史组查询工具宣传图。图中展示了‘2026年招生计划 上册’与‘历史组查询工具’两大模块,右侧为笔记本电脑屏幕上的查询界面,左侧蓝色竖条列出PDF拆分提取、AI解析转Excel、补齐学校专业组代码、匹配2025录取分数、条件查询结果导出五大功能,底部黄色横幅强调‘数据全·匹配准·查询快’

数据准备

PDF 拆分

下载下来的 PDF 有四百多页,我们用不到那么多数据,直接让 AI 生成一个拆分脚本,拿历史组的数据来分析!

WPS表格打开含有“2026年普通高等学校在江苏招生计划”的PDF文件,约78/448页

PDF拆分工具界面。左侧文件路径已选中,输出目录高亮,拆分模式设为“指定页码范围拆分”,页码范围输入框中填写39-100

这样我们就得到了历史组的所有相关 2026 招生计划。

PDF文档左侧预览“2026年普通高等学校在江苏招生计划”中提前录取本科院校的军队院校部分,右侧显示对应的Markdown/JSON结构预览

PDF 转 Excel

将 PDF 导入到 MinerU 中进行解析。

MinerU软件界面,显示已打开“2026年江苏招生计划-历史.pdf”,右侧自适应为Markdown/JSON预览

导出 Markdown 格式。

导出格式选择下拉菜单,红色箭头指向选中的“Markdown”选项

Markdown 转 Excel

由于附件数据量极为庞大(含数千个专业组条目),我们无法在聊天中一次性输出完整 Excel 文件。不过,我按照推荐方案——通过 Python 脚本一键生成。

AI助手对话界面。用户提问“根据附件的内容,输出完整的excel格式文件”,下方推荐使用Python脚本将Markdown保存为data.md后自动生成Excel

运行脚本生成招生计划 Excel 文件:

终端运行Python脚本时出现pandas FutureWarning,提示应使用StringIO对象。最终输出“Excel 已生成:招生计划.xlsx”

生成了多个 Sheet,我们将其合并成一个 Sheet。

电子表格截图,显示了多个工作表中的“Table_1”,其中包含代号、院校、专业计划数、学制、学费等条目

终端执行“python hbzsjh.py”后输出“合并完成,共7770行,保存至招生计划_合并.xlsx”

合并后的完整表格片段,包含国防科技大学、陆军步兵学院、武警警官学院、中国人民公安大学等的专业计划详情与备注

补齐学校专业组代码

补齐学校专业组代码,这样我们可以根据学校进行筛选。

DeepSeek对话中显示“补全当前excel,添加学校代码,专业代码”的Python脚本方案,通过识别层级结构自动补全

生成效果如下:

补齐代码后的表格片段,新增“学校代码”和“专业代码”两列,每条招生记录都有了对应标记

关联 2025 年录取分数

根据学校、专业组关联 2025 年的录取分数相关情况。

2020-2025年部分院校历史类本科录取分数原始数据示例

DeepSeek对话中通过Python脚本将“2025分数”工作表中的min_score、max_score、min_rank匹配到“2026招生计划”中

生成效果:

最终整合后的表格效果,匹配上了最低分、最高分、排名以及往年计划数,如常州大学各专业已带有2025年录取数据

我们与官网发布的招生计划做个对比,确认数据无误。

官网对照样本,常州大学本科批(历史等科目类)各专业组及2026年计划数、2025年最低分/位次等核心信息

Vibecoding 开发一个查询小工具

利用 Python 开发一个查询小工具,用户可根据条件查询 招生计划历史2026_匹配结果.xlsx 中的内容,查询条件包含学校名称、分数线、专业。

利用python 开发一个查询小工具,用户可根据条件查询
招生计划历史2026_匹配结果.xlsx中的内容,查询条件,学校名称,分数线,专业

Claude Code规划阶段探索Excel文件结构并设计查询工具架构

规划确认页面,决定了使用‘图形界面(GUI)’、‘组合筛选’以及‘两种分数查询模式都要’

项目的核心功能规划、文件结构、依赖环境及验证方式的总结

查询工具启动与使用说明:包含命令行启动、模糊搜索、分数筛选三种模式以及其他功能

运行效果
输入“扬州大学”即可查看 54 条匹配记录,表格包含 2026 计划数、往年最低分、最高分及位次等关键数据。

查询结果界面,筛选条件为‘扬州大学’,分数不限,显示54条记录。表格详细列出了各专业组的计划人数、学制、学费及分数

筛选南京大学的查询结果,展示13条相关专业数据

切换到“我的分数能上哪些”模式,输入 580 分,瞬间保留 3047 条可冲击院校。

分数筛选模式切换为‘我的分数能上哪些’,输入580分后结果筛选至3047条记录

扬州大学某专业组详细查询与筛选视图,展示了更精细的专业信息

查询结果可直接导出。

查询结果导出成功,系统提示成功导出54条记录至导出Excel文件

感兴趣的小伙伴,也可以自己动手跑一下这套流程。

一个灰白色简笔画小人悬挂在黑色背景中央,从第一帧下垂姿态变为第二帧举手欢呼的姿态




上一篇:H5渗透实战:水电卡系统负数金额漏洞与签名绕过分析
下一篇:LLVM 200万行C++代码,为何全面禁用dynamic_cast?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-25 03:15 , Processed in 0.785439 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表