找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1419

积分

0

好友

179

主题
发表于 2026-2-12 17:55:20 | 查看: 50| 回复: 0

人工智能从简单的聊天机器人向智能体(Agentic AI)演进的关键节点,推理能力的瓶颈和多模态处理链路的碎片化,成为了阻碍其工程化落地的两大核心挑战。本文将深入剖析昆仑天工旗下天工 Skywork,如何通过与 Google Cloud 深度合作,引入其 Gemini 3 模型家族并结合 Google Distributed Cloud (GDC) 混合云架构,成功构建出面向 Windows 生态的下一代桌面级智能体。

天工 Skywork 桌面版全球同步发布

为了应对 多步推理死循环、多模态处理链路割裂 以及 企业级数据主权 这三大技术难题,以满足海外用户更复杂的需求,Skywork 技术团队选择了与 Google Cloud 携手。通过引入 Gemini 3 模型的强大能力与机密计算技术,团队对产品的底层架构进行了全面重构。

突破推理天花板:基于 Gemini 3 DeepThink 的多路径决策

推理死循环与浅层输出
在早期的业务实践中,当 AI 智能体面对诸如“阅读 100 页金融财报并生成符合品牌规范的 PPT”这类高复杂度专业任务时,常常会受限。传统模型的单链式推理容易陷入逻辑死循环,或者只能生成非常浅显的摘要,远远达不到“专家级”的交付标准。

解决方案
Skywork 引入了 Google Gemini 3 及其核心的 Deep Think 能力。与传统的思维链(CoT)不同,Gemini 3 允许智能体在推理过程中同时探索多条潜在的解决路径(Reasoning Paths),并对中间结果进行自我评估与修正,从而选择最优解。

  • 架构优化:从过去单一的“提示-响应”模式,转变为“规划-执行-反思”的自主循环架构。
  • 性能实测:在全球通用的 GAIA 基准测试中,重构后的 Skywork Agent 以 82.42% 的准确率斩获全球榜首,充分证明了其在处理高难度、多步骤现实任务时具备的鲁棒性。

链路融合:1M+ 上下文重塑多模态工作流

碎片化模型的延迟累积
在处理包含图表、视频会议录音和文本的混合数据时,传统方案通常采用“流水线模式”。这种需要串联多个独立模型的碎片化管道,不仅会导致严重的上下文信息丢失,还会产生极高的端到端延迟,难以满足海外用户对极致流畅体验的期待。

解决方案
Skywork 充分利用了 Gemini 原生的多模态理解能力以及 1M+ Token 的超长上下文窗口,将原本割裂的流水线重构为单一的 统一数据流

  • 技术实现:摒弃了通过中间件进行格式转译的步骤,直接将原生的视频流、音频流和文档数据注入 Gemini 模型的上下文进行一体化处理。
  • 效率提升:复杂深度研究报告的生成时间从 3 小时大幅缩减至 60 分钟以内,生产力效能提升 63%,为用户带来了真正的“近实时”交互体验。

混合云架构:Google Distributed Cloud 支撑的数据主权与机密计算

Skywork 的海外市场覆盖了大量对数据隐私极为敏感的金融与法律行业客户。这些对云端部署持谨慎态度的企业,要求数据处理过程必须严格遵守严格的数据驻留规定。

解决方案
为了在充分利用全球云端强大算力的同时,切实保障用户的数据主权,Skywork 采用了创新的混合云部署策略,这也是云原生架构思想在AI领域的重要实践。

  • 边缘部署:通过 Google Distributed Cloud (GDC),将 Gemini 驱动的智能体部署在海外客户的本地环境或指定的边缘节点上。
  • 机密计算:启用 Google Cloud 的机密计算节点,确保数据在处理态全程处于加密状态,即使是云服务商也无法窥探。这一特性成为了 Skywork 成功叩开国际高端企业市场的“敲门砖”。
  • 市场反馈:这一架构成功消除了海外高合规要求行业的顾虑,在企业级试点项目中实现了 97% 的超高用户留存率。

生态协同:One Google 技术栈的集成优势

Skywork 的技术演进并不仅仅是模型的替换,更是对 “One Google” 技术生态的深度集成。

  • Google Workspace API 集成:智能体可以直接通过安全 API 操作 Docs、Sheets 和 Slides,将非结构化的推理结果自动转化为结构化的办公文档,极大提升了办公自动化效率。
  • 合作伙伴支持:在架构迁移过程中,Google Cloud 提供了关键的工程化支持,协助团队针对 Gemini 3 的长上下文特性进行了精细化的提示工程调优,确保了复杂任务处理时的高并发稳定性。

结语

从天工 Skywork 从其他模型迁移至 Gemini 3 的实践来看,这不仅仅是技术组件的升级,更是一次从“对话式 AI”向“自主智能体”的技术跨越。通过在出海赛道上的成功验证,这一案例证明,在构建面向全球的下一代桌面级操作系统智能体时,原生的多模态能力、超长上下文的深度推理以及兼顾安全的混合云架构三者缺一不可。Google Cloud 所提供的全栈 AI 基础设施,正成为天工 Skywork 将领先的智能 & 数据 & 云解决方案规模化落地全球市场的核心引擎。

关于昆仑天工
昆仑天工是昆仑万维旗下子公司,专注 AGI 与 AIGC 业务,是国内少数真正践行全模态输入与全模态输出路径的 AI 公司,也是 AI 行业“务实主义”标杆,以实现 AGI 为核心愿景,自研 8 大核心大模型,覆盖文本、视频、音乐、音频、3D 等多领域,构建“底层架构-技术能力-场景落地”完整体系。依托底层统一全模态架构,打破模态壁垒,结合海外布局优势,实现 AI 音乐 Mureka、AI 社交 Linky、AI 智能体 Skywork 等业务规模化变现,海外收入占比极高,形成“研发-落地-变现-迭代”良性闭环,凭借技术硬实力与商业落地能力,成为 AGI 赛道最具潜力的落地样本。

  • 行业:科技
  • 地区:中国
  • 使用的产品:Confidential Computing,Google Workspace API,Google Gemini

Google Cloud 解决方案与专业知识




上一篇:BigQuery MCP服务器实战:六步集成全托管服务,加速数据分析智能体开发
下一篇:一文详解C# LINQ左连接(Left Join)的两种语法与实战应用
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 14:19 , Processed in 0.696290 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表