你现在就可以开工。
别先啃一整套模型课,先做一个能跑起来的小项目:输入问题,系统从你的资料里找答案,回答时带引用。
这个东西不大,但它会逼你碰到 AI 应用里最重要的几件事:接口、检索、评估、部署。
先给自己定位。

如果你会写后端,别从 Python 基础课重来。你要补的是模型怎么接进系统,输出怎么评估,日志和成本怎么记录。
如果你做数据分析,别把时间全花在手写 SQL 上。你要练的是把业务问题说清楚,让 AI 生成查询和脚本,然后检查它有没有把口径算错。
如果你有行业经验,别急着变成工程师。你要做的是把行业流程拆出来,告诉工程师哪里可以自动化,哪里必须人工复核。
如果你现在没有明确底子,也别从“学模型原理”开始。先建立最薄的一层能力:看懂代码控制流、数据过滤、接口调用。能看懂 AI 写的代码在干什么,就能开始做项目。
第一条路线,做 LLM 应用。
不用一开始上复杂框架。拿一份你熟悉的资料,切成小块,存到向量库里。用户提问时,先检索相关片段,再把片段和问题一起丢给模型,让它回答,并且带上引用来源。
第一周只做 50 行脚本也可以。重点是跑通这条链路:文本切块、检索、回答、引用。
第二周加评估。自己写 20 个问题,答案你提前知道。跑完之后看两件事:有没有找对资料,回答有没有乱说。失败案例要记录下来,别删。

一个月后,这个项目至少要有网页、日志、成本统计、评估报告。只有聊天框不算项目。
第二条路线,做 AI 辅助数据分析。
找一个公开数据集,别挑太花的。你只问三个业务问题:哪类用户变化最大?哪个环节流失异常?价格和销量有没有明显关系?
让 AI 写 SQL 和 pandas 代码。你要做的是读代码。看它过滤了什么,按什么字段分组,缺失值怎么处理,图表是不是在误导。

最后别交 notebook。写一封给业务负责人的分析邮件:问题是什么,你查了什么,数据支持什么,不支持什么,下周该做哪个动作。
这条路线练的不是炫技,是判断。
第三条路线,做一个 ML 微服务。
用 scikit-learn 训练一个简单分类模型。模型不需要很强。然后用 FastAPI 包一个 /predict 接口,用 Docker 跑起来,再写一个测试脚本验证输出。
接着补监控。至少记录请求数、延迟、预测分布。模型上线之后,问题通常不在“代码能不能跑”,而在数据变了之后你有没有发现。

软件工程师转 AI,最容易忽略评估。单元测试只能证明接口没坏,不能证明模型判断靠谱。数据切分、错误样本、分布变化,这些都得练。
别踩几个坑。
- 第一个坑,复刻教程。照着 LangChain 教程搭个聊天页面,招聘方一眼就能看出来。
- 第二个坑,证书堆满,项目没有。证书不能替你解释失败案例。
- 第三个坑,一开始就冲大模型训练。大多数人第一年更该学会把简单模型稳定送上生产。
- 第四个坑,不写局限。AI 项目没有局限说明,反而显得不可信。
下周的交付物很具体:一个仓库,一个能访问的演示页面,一份 README,一张成本表,一个评估文件。
你先把这些做出来,再决定要不要补模型课。路线会清楚很多。如果你对更多 AI 转行项目感兴趣,也可以来云栈社区和同行交流实战经验。
|