最近在技术社区里琢磨了一件事:如何把过去沉淀的线上交流内容,拆解成一个个小知识点,以课堂的形式重新组织,既能按需点播,也方便精准检索。
于是把社区分享做过一轮剪辑整理,最终形成了 老刘课堂三部曲,覆盖 知识图谱(含本体论)、RAG(GraphRAG 及文档解析)、大模型(DeepSeek‑R1、领域大模型) 几个方向,希望能帮到更多同行。
一、RAG 及文档解析课堂
Stage 1:从朴素 RAG 说起
课堂:RAG 落地的知识库建设、实现流程、优化策略及最佳实践

收益:
- 掌握 RAG 的核心问题、场景、基本流程与常见坑点
- 理解从 LangChain 视角实现行业问答系统的整体范式
- 洞悉 LangChain 中的 RAG 优化思路:问题改写、多查询、HyDE、路由、索引和检索策略
- 掌握最佳实践:分块、嵌入、向量化、查询分类、检索、重排、重打包、摘要、微调
- 了解 RAG 落地过程中的文档处理优化策略
Stage 2:KG 增强 RAG 的火花 —— GraphRAG
课堂:知识图谱增强 RAG(GraphRAG 等)实现范式与代表案例

收益:
- 搞懂 KG‑RAG 的背景、实现思路及常见 demo
- 理解从 prompt 角度出发的 KG‑RAG 策略,即 KG‑enhanced prompt
- 熟悉代表性项目:HIQA、LinkedIn KG‑RAG、Uni‑QA、HippoRAG、微软 GraphRAG
- 了解老刘的医疗大模型问答实现与开源实践思路
Stage 3:RAG 流程中的文档解析
课堂:文档解析的落地实现范式、多模态大模型关键技术与代表模型

收益:
- 掌握 RAG 核心问题、场景、流程与坑点
- 理解 LangChain 行业问答的实现流程
- 洞悉 RAG 优化思路(问题改写、多查询、HyDE、路由、索引、检索)
- 掌握分块、嵌入、向量化、查询分类、检索、重排、重打包、摘要、微调等最佳实践
- 了解 RAG 落地的文档处理优化策略
二、知识图谱及本体论课堂
Stage 1:科学入门 —— 如何正确地学习
课堂:NLP 与知识图谱如何入门 & 如何高效搜索 & 如何高效学习 & 简历面试要点

收益:
- 了解 NLP 及知识图谱的入门路径
- 掌握必备基础、开放数据、开源工具
- 碎片化时代如何高效搜索以提升信息获取能力
- 学会高效学习方法
- 把握简历与面试中的关键点
Stage 2:理解处理对象 —— 知识图谱与事件图谱
课程:知识图谱与事件图谱基础理论、关键技术、应用场景及代表案例

收益:
- 熟悉领域知识/事件图谱的构建流程
- 掌握关键抽取技术:实体识别、关系识别、事件识别等
- 了解 2B 和 2C 领域的应用场景
- 认识数据标注工具及标注案例
- 积累开源数据集和开源工具
Stage 3:动态高阶对象 —— 事理图谱与情报分析应用
课堂:领域事理图谱的构建范式、关键技术及情报分析系统代表案例

收益:
- 了解事件图谱类图谱的分类与代表项目
- 熟悉事理图谱构建流程及关键技术(因果抽取、事件标准化等)
- 掌握金融风险监控等应用范式
- 知晓事件驱动情报分析的形态与事件体系
- 深度了解 EventRegistry、学迹、storyforest 等典型情报分析系统
Stage 4:与时俱进 —— 知识图谱与大模型的碰撞
课程:知识图谱与大模型的对比、结合范式及代表案例

收益:
- 理解 知识图谱 与大模型的对比及结合思路
- 掌握大模型增强知识图谱的方法(增强表示、补全、构建、问答、信息抽取模型等)
- 看清知识图谱增强大模型研发的不同阶段及思路
- 以本体课程为例探索两者的融合范式
Stage 5:当下热点 —— Palantir 本体落地范式
课程:从 Web 语义本体、知识图谱本体再到 Palantir Ontology

收益:
- 明白本体论受关注的缘由,吃透数据认知的常见局限
- 分清语义网本体、知识图谱架构的基础概念
- 熟悉 Palantir 本体的架构组成与核心要素
- 通过实际案例了解本体搭建的实操思路
- 知晓国内本体在数据治理、智能 Agent 上的应用方式
- 积累可借鉴到日常业务的本体知识
三、大模型及 DeepSeek 技术解析
Stage 1:领域大模型微调、MoE 与长文本基础
课堂:领域大模型微调范式及代表项目、长文本及 MoE 技术

收益:
- 了解领域大模型的实现范式(技术基座选型对比)
- 重点解读金融、法律、医疗、教育等行业的代表开源微调模型及数据集
- 理解大模型长文本技术的实现思路和主流评估方式
- 认识嫁接模型及 MoE 模型的技术要点和代表项目
Stage 2:面向应用 —— Agent、Prompt 技巧与 AI 搜索
课堂:大模型 Agent 入门、大模型 Prompt 技巧、AI 搜索及 Open‑Sora 技术

收益:
- 掌握大模型 Agent 的构建与基本原理
- 了解当前 Agent 市场情况(主流框架与行业应用)
- 学会冷静客观地认知 Agent
- 掌握通过 Prompt 优化大模型性能的策略
- 了解 AI 搜索的实现思路与代表案例
- 理解 OpenAI‑Sora 技术原理猜想
Stage 3:DeepSeek‑R1 类推理大模型三部曲
课堂:DeepSeek‑R1 类推理大模型解析及 DeepResearch

收益:
- 抓住 DeepSeek R1 热点背景与核心原理
- 避开推理大模型的常见认知误区,找准应用场景
- 掌握模型部署优化、个人知识库搭建的实操方法
- 理解模型复刻、微调蒸馏及强化学习的核心思路
- 看懂相关开源项目,理清 DeepResearch 技术逻辑
Stage 4:DeepSeek‑V4 模型解析及历史回顾
课程:DeepSeek‑V4 系列深度解析及多模态版本?

收益:
- 梳理 DeepSeek‑V3 到 DeepSeek‑V4 的模型迭代变化
- 搞懂 DeepSeek‑V4 整体架构设计逻辑
- 掌握模型的部署与实际使用方法
- 了解推理运行过程中的注意要点
- 避免认知误区,知晓多模态版本相关情况
如果你对 RAG、知识图谱或大模型等技术有更多见解,欢迎来 云栈社区 与开发者们一同交流切磋。
|