4月17日至18日,由CSDN与奇点智能研究院联合主办的「2026奇点智能技术大会」将在上海拉开帷幕。
如果要用一个问题来衡量这场大会的价值,那会是:一线技术决策者或开发者,亲临现场的两天,究竟能带走什么?是几张合影?还是几页PPT?不,我们希望你能带走的,是在这个技术迭代速度快十倍的时代里,能让你在未来半年内“活得更好”的生存指南。
今天,我们首次揭晓部分核心议题。整个议题体系将覆盖AI技术的全生命周期,从感知层、控制层、决策层,到应用层、基建层、研发层、架构层,无一遗漏。每一场分享,都源自技术专家们正在攻坚的一线研发难题,是应对未来挑战的实战底牌。

大会官网:https://ml-summit.org/
具身智能突围:超越“视觉”的感知革命
痛点: 如果说“看清世界”是具身智能的第一步,那么在暗光、遮挡环境中,或者高危、高负载的重工业场景下,智能体往往会瞬间变得“束手无策”。
解法: 多模态超视感知与数据驱动的规控闭环。
北京大学博雅长聘副教授许辰人将带来《破解“视觉盲区”:多模态超视感知如何重塑下一代具身智能》的重磅分享。本报告将揭秘“超视智能感知”这一前沿范式。许教授将系统复盘如何利用电、声、磁、射频等可穿透物理场模态,为AI开启“第六感”,实现对环境的极致泛化理解。
网易伏羲机器人规划控制算法负责人陈广大则将分享《数据驱动算法在无人装载机全流程作业中的应用》。这并非实验室里的Demo,而是来自工程机械一线的硬核实战。他将揭秘网易灵动如何利用“世界模型+强化学习”攻克铲料堆料难题,实现7x24小时无人化、人效提升120%的“黑灯作业”。
商业AI进化:从“预测未来”到“左右战局”
痛点: 传统的商业AI往往止步于“预测销量”,而企业真正需要的是:反事实推演(例如,如果我调整价格,对手会怎么做?)。
解法: Agentic Commerce与商业世界模型。
京东定价算法负责人邓金秋将带来《Agentic Commerce:商业世界模型中的因果建模实践》主题分享。作为运筹学界“奥斯卡”INFORMS Prize设立34年来首个获奖的亚洲团队核心成员,邓金秋将分享京东如何利用大模型提供的语义先验,结合时序动态建模与因果方法,构建能够刻画“决策—环境—结果”关系的商业世界模型。
现场听众将深入理解:
- 范式转移: 深度解析商业AI如何从传统的预测驱动,进化为基于Agentic AI的决策驱动。
- 博弈视角: 在Buy-side/Sell-side/Platform Agent共同参与的多智能体市场中,如何通过博弈论与仿真推演最优策略。
- 硬核实战: 揭秘如何利用LLM + 因果推断,从Traditional Forecasting迈向Counterfactual Modeling,精准估计价格变化带来的市场响应,掌握定价权。
迈向数字生命:看AI如何像人一样自主接管操作系统
痛点: 如果Agent只在聊天框里“指点江山”,就无法胜任复杂的跨应用任务。当前的数据与反馈瓶颈,正阻碍其成为真正的“数字员工”。
解法: EvoCUA架构与可验证数据合成。
美团Staff Engineer、OSWorld榜首项目EvoCUA作者薛涛锋,将带来《迈向数字生命:Computer Use Agent的核心技术与自进化实践》。作为以56.7%成功率登顶全球权威榜单的开源项目主导者,他将深度拆解如何构建“生成即验证”的Agentic引擎,以及如何通过RFT动态去噪与反思,让Agent真正学会从失败中进化,在分钟级拉起的万级沙盒中完成自我迭代。
现场听众将收获:
- 揭秘HuggingFace Daily Paper榜首项目背后的算法范式与Infra经验。
- 掌握让Agent从“对话者”进化为“操作者”的关键技术路径。
生产力与创造力的重塑:多模态Agent的应用深水区
痛点: 通用大模型在面对专业办公文档(复杂版式、多语种)和非线性创作流程(如视频剪辑)时,往往显得“力不从心”。
解法: 端到端版式理解与状态驱动的非线性工作流。
三位来自金山办公、商汤科技、小红书的技术专家,将为您拆解垂直场景下的工程化突围:
- 金山办公资深算法工程师孙亚博将分享《办公领域多模态的探索与实践》。他将复盘Monkey系列模型如何实现对复杂文档的像素级精准解析,以及从0到1打造端到端版式理解与多语种翻译链路的实战经验。
- 小红书算法工程师许思杰带来的议题是《如何构建下一代智能剪辑系统》。剪辑不是线性的流水线。他将拆解如何设计“可跳过”的节点架构与状态驱动(State-Driven)的调度机制,在OpenStoryline中实现真正可控、可工程化的智能视频创作闭环。
- 商汤科技技术总监马林带来《从生成到可编辑:AI PPT在线编辑系统的工程化实践》。拒绝“一锤子买卖”的静态生成。他将揭秘办公小浣熊如何通过HTML结构化输出与自研渲染引擎,实现从“大模型生成”到“可编辑系统”的跨越,确保多轮交互下的视觉与结构一致性。
算力与成本的博弈:为AI打造“极致引擎”
痛点: 大模型虽好,但推理成本和延迟是企业落地的现实难题。如何既要效果好,又要跑得快,还要省钱?
解法: Inference-Free、AI反哺AI与可重构计算。
亚马逊云科技OpenSearch中国区AI研发经理杨扬将深入探讨《GenAI中搜索的极致性价比之路》,分享如何通过Inference-Free的稀疏搜索、Graph RAG等技术,在效果、速度与成本间寻找最佳平衡。更为独特的是,他将揭秘如何基于Claude Code对性能场景进行自动化优化,用GenAI工具反哺GenAI系统自身。
趋境科技技术专家、Mooncake核心贡献者杨珂将带来《从单体到解耦:Mooncake如何支撑下一代大模型推理架构》。作为清华系开源项目,Mooncake提出了以KVCache为中心的分离式架构。他将解析如何通过P/D分离(Prefill/Decode)、全局KVCache复用与弹性专家并行,打破单体瓶颈,支撑Token量的爆发式增长。
清微智能技术专家楼群芳的分享议题是《可重构计算超节点的理论探索和实践》。她将解析如何通过“芯片-系统-软件”三层级的可重构设计,构建能动态适应AI需求的算力基础设施,并分享国内首个4K超节点方案的实战数据,这正是应对算力与成本挑战的一种前沿思路。
重塑软件研发的“新基建”
痛点: 当编码Agent逐渐普及,企业更焦虑的是:如何打破“单点辅助”的天花板?如何建立从L2(辅助)跨越到L3(协同)的标准?在万人规模的研发团队中,代码还是核心资产吗?
解法: AI原生研发范式。
三位来自互联网巨头的技术领袖,将为您拼出AI研发的完整版图:
- 模型底座: Qoder & 通义灵码模型负责人李永彬,将探讨大模型如何从“辅助工具”进化为软件开发的“基础设施”,以及Agent如何重塑编程的未来。
- L3协同标准: 快手CodeFlicker产品负责人华剑侃围绕《软件研发协同时代:L3 AI Coding的探索与实践》展开分享。他将独家揭秘快手如何在万人规模的研发组织中,建立L1-L5智能研发能力分层,实现体系化效率跃迁。
- 工具实践: 腾讯云开发者AI产品负责人汪晟杰,将从产品与工程实践角度,通过CodeBuddy等工具案例,分享AI如何在实际业务中重塑团队协作。
Agent时代的架构设计哲学
痛点: 很多开发者构建Agent的方式,依然停留在“Prompt拼接”的作坊阶段。这种缺乏架构思维的方式,导致Agent就像无头的苍蝇——没有记忆、容易产生幻觉、无法协作。
解法: 六维认知架构与Agent设计模式。
新加坡科研机构AI研究员、《Agent设计模式》作者黄佳将围绕《Agent设计模式:从认知架构到工程落地》展开分享。作为Claude Code和OpenClaw的源码级剖析者,他将跳出具体的代码实现,从架构师的视角,提出一套覆盖感知、记忆、推理、行动、反思、协作的六维设计模式体系。让你从此告别“万能Prompt”,学会用架构去约束模型,掌握构建可靠Agent的核心原则。
不止于此:一份通往“奇点”的认知地图
以上只是2026奇点智能技术大会议题的冰山一角。届时,我们将汇聚50+位站在变革最前沿的技术专家,围绕大语言模型、多模态世界模型、AI Infra、AI原生应用等十二大专题展开深度分享。
他们是:
- 奇点智能研究院院长,CSDN高级副总裁 李建忠
- 腾讯微信搜索AI算法研究方向负责人、专家研究员 王炳宁
- 新浪微博首席科学家及AI研发部负责人 张俊林
- 小红书 AI搜索生成算法负责人 陆承镪
- 微软亚洲研究院人工智能推理组负责人 宫叶云
- 京东探索研究院研究总监,多模态理解大模型研发团队负责人 王佳琦
- Qoder资深技术专家 谢吉宝(唐三)
- 京东集团多模态基础模型团队负责人 黄浩洋
- 微软亚洲研究院香港首席研究员 刘树杰
- 百度Comate架构师 张立理
- 无问芯穹技术副总裁 吴保东
- Macaron AI首席科学家 马骁腾
- vLLM社区贡献者、红帽大中华区CTO 张家驹
- 北京智源人工智能研究院AI框架研发负责人 敖玉龙
- ……
如果你不满足于表面的概念炒作,如果你希望深入技术的肌理,看清未来半年的风向。这里没有空泛的预测,只有扎实的复盘、当下的解法与前沿的探索。
与此同时,2026奇点智能技术大会同步开放多种合作形式:技术生态合作伙伴、企业专场共建、行业解决方案联合展示等。我们期待与更多长期主义者一起,为AI时代留下可被验证、可被复用的工程经验。对这类深度技术话题感兴趣的朋友,也欢迎来云栈社区交流探讨。