本文旨在系统性地梳理当前人工智能领域的核心架构层次,并汇总整理了国内外主流厂商的大语言模型与生成式AI(AIGC)产品线,为开发者与技术选型者提供一份清晰的速查参考。

上图清晰地展示了一个典型的AI系统分层架构。从下至上,它涵盖了从底层基础模型到上层具体应用与增强补丁的完整技术栈,理解这个结构有助于我们更好地定位下文将介绍的各类模型。
一、LLM大语言模型
1、OpenAI
官网:https://openai.com/zh-Hans-CN
| 系列 |
代表型号 |
上下文 |
核心能力 |
定位 |
| GPT‑5.3 |
Pro / Instant / Thinking |
256K |
全模态、深度推理、科学计算 |
旗舰全能 |
| GPT‑4o |
GPT‑4o / Mini |
128K |
实时多模态、稳定 |
企业主力 |
| o‑系列 |
o3 / o4‑mini |
— |
强推理、数学 / 代码 |
技术 / 科研 |
| 代码 |
GPT‑5.3‑Codex |
— |
代理编程、大型项目 |
开发专用 |
| 视频 |
Sora |
— |
文生高清视频 |
创意视频 |
| 开源 |
gpt‑oss‑120b / 20b |
— |
开放权重、私有化 |
科研 / 定制 |
2、Anthropic
官网:https://claude.com/product/claude-code
| 梯队 |
最新型号 |
上下文 |
核心定位 |
典型用途 |
| 旗舰 |
Opus 4.6 |
1M |
顶级推理 / 超长文本 |
大型重构、架构设计、科学计算 |
| 均衡 |
Sonnet 4.6 |
200K |
智能体 / 编码主力 |
复杂代理、全栈开发、项目迭代 |
| 均衡 |
Sonnet 4.5 |
200K |
性价比首选 |
日常开发、Claude Code 默认 |
| 轻量 |
Haiku 4.5 |
200K |
高速低成本 |
实时补全、脚本、快速原型 |
3、DeepSeek
官网:https://www.deepseek.com
| 系列 |
代表型号 |
核心架构 |
上下文 |
主打能力 |
| 通用基座 |
V3 |
671B MoE |
128K |
全能通用、长文本 |
| 推理专用 |
R1 |
MoE |
128K |
数学 / 代码 / 逻辑推理 |
| 代码专用 |
Coder V2 |
MoE |
128K |
多语言代码生成 |
| 多模态 |
VL2 |
MoE |
- |
图文 / 视频理解生成 |
4、谷歌 Google DeepMind
| 模型 |
核心定位 |
典型场景 |
| Ultra 3.0 |
顶级推理 / 多模态 |
尖端科研、复杂系统、专业级创作 |
| 3.1 Pro |
全场景主力 / 强推理 |
企业级开发、AI Agent、长文档 / 视频分析 |
| 3 Flash |
极速 / 高吞吐 |
实时交互、批量任务、快速原型 |
| Nano |
端侧 / 离线 |
手机应用、本地隐私计算 |
5、智谱AI
官网:https://www.zhipuai.cn/zh
| 系列 |
代表型号 |
上下文 |
核心能力 |
定位 |
| 通用基座 |
GLM‑5 |
200K |
智能体、复杂编程、长程决策 |
旗舰全能 |
| 通用基座 |
GLM‑4‑Plus |
16K |
语言理解、长文本 |
企业主力 |
| 视觉 |
GLM‑4.6V |
— |
图像理解、视觉推理 |
多模态 SOTA |
| 代码 |
CodeGeeX‑4 |
— |
多语言代码生成 / 调试 |
开发专用 |
| 视频 |
CogVideoX |
— |
文生高清视频 |
创意视频 |
| 思考 |
GLM‑Z1‑Rumination |
— |
深度推理、数学 / 逻辑 |
技术 / 科研 |
6、阿里巴巴
| 系列 |
代表型号 |
核心能力 |
定位 |
| 通用旗舰 |
Qwen3.5-Plus |
原生多模态、高效推理 |
开源标杆,企业首选 |
| 通用推理 |
Qwen3-Max-Thinking |
万亿参、长文本、深度推理 |
复杂决策、科研 |
| 多模态 |
Qwen3-Omni |
文图音视频全栈 |
全能助理、实时交互 |
| 视觉 |
Qwen3-VL-Plus |
图像理解、视频分析 |
视觉编程、内容审核 |
| 代码 |
通义灵码 |
全栈开发、多平台适配 |
研发提效、智能体 |
| 图像生成 |
Qwen-Image-Max |
高清生成、编辑 |
设计、营销内容 |
| 视频生成 |
Wan2.6-i2v |
电影级、超写实 |
专业影视创作 |
7、腾讯
| 系列 |
代表型号 |
核心能力 |
定位 |
| 通用旗舰 |
HY 2.0 Instruct |
406B MoE、256K 上下文 |
企业级全能基座 |
| 推理增强 |
HY 2.0 Think |
深度推理、代码、Agent |
复杂决策、研发 |
| 多模态 |
混元图像 3.0 |
80B、图生图 / 编辑 / 修复 |
设计、内容创作 |
| 视频 |
HunyuanVideo 1.5 |
文生高清视频 |
短视频、创意 |
| 3D |
混元 3D 2.1 |
工业级 3D 生成、开源 |
游戏、影视建模 |
| 端侧 |
HY-1.8B-2Bit |
2Bit 量化、超低功耗 |
手机、IoT 部署 |
8、字节跳动
| 系列 |
代表型号 |
核心能力 |
定位 |
| 通用旗舰 |
豆包 2.0 Pro |
32K 上下文、深度推理、多模态 |
企业决策、科研、复杂任务 |
| 通用均衡 |
豆包 2.0 Lite |
性能成本平衡、高频对话 |
日常办公、内容创作 |
| 轻量端侧 |
豆包 2.0 Mini |
低延迟、高并发、轻量化 |
手机、IoT、边缘部署 |
| 代码专用 |
豆包 2.0 Code |
代码生成 / 调试、TRAE 集成 |
研发编程、智能开发 |
| 视频生成 |
Seedance 2.0 |
四模态输入、2K 多镜头视频 |
影视、广告、短视频 |
| 图像生成 |
Seedream 5.0 Lite |
文 / 图生图、高清编辑 |
设计、营销内容 |
9、华为
| 系列 |
代表型号 |
核心能力 |
定位 |
| 云端旗舰 |
Pangu 5.5 NLP |
718B MoE、快慢思考、强推理 |
企业级复杂决策、研发、Agent |
| 云端旗舰 |
Pangu 5.5 CV |
300B MoE、多模态视觉 |
工业质检、视频分析、感知 |
| 行业专用 |
盘古气象 / 金融 / 制造 |
领域深耕、行业 SOTA |
垂直场景降本提效 |
| 端侧轻量 |
Pangu Lite |
1B–10B 参数、离线运行 |
手机、IoT、鸿蒙设备 |
10、百度
| 系列 |
代表型号 |
核心能力 |
定位 |
| 旗舰通用 |
文心 5.0 Pro |
2.4 万亿 MoE、原生全模态、深度推理 |
企业决策、复杂任务、多模态创作 |
| 通用均衡 |
文心 5.0 Lite |
全模态、免费、高效 |
日常对话、内容创作、个人助手 |
| 深度思考 |
文心 X1.1 |
强逻辑、工具调用、低幻觉 |
复杂规划、智能体、专业分析 |
| 代码专用 |
文心快码 |
代码生成 / 调试、IDE 集成 |
研发编程、智能开发 |
| 端侧轻量 |
文心 Mini |
1B–7B、离线、低功耗 |
手机、IoT、边缘设备 |
二、AIGC(生成式AI)
生成式 AI(Generative AI) 是一类能基于海量数据学习规律、自主生成全新、原创内容的人工智能技术,核心是“无中生有”地创造文本、图像、音频、视频、代码等,是当前 AIGC 领域最热门的方向。上文表格中各家厂商的“图像生成”、“视频生成”等模型,均属于AIGC范畴。
总结:AI技术发展日新月异,各厂商的模型迭代速度非常快。本文汇总的信息旨在提供一个横向对比的视角,帮助大家快速了解主流 大语言模型 的能力矩阵与市场格局。在实际项目选型时,还需结合具体的性能评测、成本、生态集成度以及合规要求进行综合考量。如果你想持续跟踪此类技术动态或与其他开发者交流,云栈社区 是一个不错的平台。
|