导读
本次分享聚焦腾讯游戏数据与AI结合的细分治理话题,不覆盖AI服务的全貌。核心理念是通过AI驱动,构建端到端的协同机制,解决当前游戏数据在组件异构、历史沉淀方面的挑战,最终实现两大目标:提升数据可塑性与整体资源效能,支撑业务稳定迭代与高效运营。
主要内容分为三部分:
- 阐述腾讯游戏数据当前的发展背景及面临的具体情况。
- 介绍针对上述问题,在“AI驱动协同治理”层面的实践进展与方法。
- 延伸说明腾讯游戏在“AI助力数据提效”方面所做的支撑工作。
分享嘉宾|张兴华 腾讯游戏 数据治理技术负责人
编辑整理|王红雨
内容校对|郭慧敏
出品社区|DataFun
01. 研究背景与行业痛点
随着腾讯游戏业务全球化扩张与数据体量爆发式增长,传统数据治理模式面临资源浪费、协作低效、决策被动等痛点。
1. 腾讯游戏数据业务基础
腾讯游戏以数据驱动为核心策略,为全球游戏业务及企业提供智能数据工具平台与定制化方案,覆盖智力开发、全链路分析及多业务场景,助力业务高效增长。其业务主要包含四大板块:
- 一站式数据处理与治理平台:提供覆盖数据全生命周期的治理方法论,在优化成本、提升开发效率的同时提供客制化沟通平台。
- 游戏洞察服务:依托二十余年行业经验及七百多款游戏的实践积累,为全品类游戏业务场景提供解决方案,助力精准把握业务方向。
- AI 技术融合应用:重点探索AI在数据驱动决策中的应用价值,已构建整套数据平台服务体系,优化了传统方法论支撑的业务交互流程,提供更便捷高效的用户体验。
- 全球化数据服务支持:针对海外业务,提供合规性保障、稳定性支撑及成本管控服务,保障业务合规、稳定、可控地运行。

2. 腾讯游戏数据服务发展的四个阶段
腾讯游戏数据服务的核心目标是持续提供稳定服务,并高效提升使用效率。当前的工作重点是进一步降低使用门槛。其演进经历了四个关键阶段:
- 初始阶段:单纯的定制化游戏支撑。
- 管控阶段:以大量原始数据日志表为支撑,由业务方提需求,开发人员进行定制化服务搭建,覆盖社区、广告、商业化等场景,但缺乏标准化沉淀。
- 稳健沉淀阶段 (当前):核心是“方法沉淀+工具支撑”。形成成熟的业务处理方法、标准化模板和知识沉淀,并孵化配套工具。此阶段的核心成果是“10%的核心数据资产可覆盖80%的定制化开发需求”,但仍存在巨大优化空间。
- AI优化阶段 (推进中):核心是通过AI重构数据服务交付流程,从“需求-定制交付”的To B模式,转变为“提供平台服务+数据资源”的模式,缩短交付链路,提升数据更新速度与整体效率。
本研究重点聚焦AI优化阶段的“数据治理”环节,探索如何将非标准化的元数据、知识文档转化为可支撑大模型应用的标准化数据资产,进而依托AI能力构建自助式数据服务体系。

3. 稳健阶段数据服务面临的挑战
在稳健阶段,尽管业务流程可控,但在资源成本、协作效率、资源浪费方面仍存在显著问题:
- 资源与成本管控被动:治理长期“被动响应”,缺乏主动规划;“资源管控”环节弱化,未形成系统性机制;现有管控能力局限于技术层面,难以延伸至业务层。
- 存储资源浪费严重:约30%的历史数据分区处于未使用状态但无人敢清理;大量无效任务持续运行,日均浪费约20%的计算资源;优化依赖人工“点状处理”,全链路优化困难,决策溯源难。
- 协作效率挑战:元数据、数仓规范及指标定义高度依赖人工维护;组件间血缘关系断裂,仅能支持点状技术追溯,无法为业务理解提供支持;需求沟通中的“口径对齐”消耗了大量时间。

4. 传统数据治理方案的局限性
- 传统流程现状:业务提需 -> 开发人员沟通、明确口径 -> 梳理上游数据表 -> 开发 SQL 或代码生成数据 -> 聚合生成结果表 -> 推送至报表系统。
- 局限性
- 信息留存与追溯难:开发人员对需求的时效记忆有限,后续运维或迭代时,需重新溯源全部代码,人力成本高。
- 治理手段缺陷:依赖规则引擎(如表名、任务名识别),技术指标颗粒度仅集中在单点,难以回溯完整链路。人工维护滞后,无主动触发机制。
- 需求定义非语义化:需求的生命周期与业务逻辑未实现语义化表达,仅通过简单元数据或规则描述,无法满足精细化管理需求。

综上,需求生命周期与业务逻辑未“语义化”是导致开发与治理层面一系列问题的根源。
02. AI驱动的数据治理范式设计
1. 技术路径:从“规则驱动”到“语义化重塑”
针对传统治理痛点,腾讯游戏构建了以“语义化”为核心的AI治理框架,技术路径如下:
- 元数据语义化学习:基于游戏历史 SQL 日志、存量表结构,通过AI模型学习数据资产的命名规范和开发逻辑,实现“人可理解、机器可调用”的语义标注。例如,自动解析 SQL 任务的字段提取、逻辑处理过程,生成结构化的业务逻辑描述。
- 需求链路智能反推:突破“业务需求→开发→资产”的正向链路局限,通过 AI Agent 调用接口与行业知识库,基于技术血缘(任务-表关联关系)反推已消亡或未关联的需求链路,形成“SQL to Text”的逆向解析能力。具体而言,通过聚合多任务(任务1-任务3)的技术元数据(存储、计算成本、引用关系)和业务指标(看板30天 PV/UV),推测该链路对应的原始业务需求,实现“技术血缘→语义化需求包”的转化。

- 统一语义模型构建:整合“通用常识(大模型自带)-行业知识(游戏术语)-企业知识(内部黑话、数仓规范)”三级知识体系,确保跨团队对同一数据资产的语义理解一致,解决术语歧义问题。
2. 两大治理场景落地
基于上述技术路径,AI治理范式落地于“资源管控”与“协作提效”两大场景,实现“治理即服务”的目标。
(1)资源智能管控场景:
- 异动成本分析报告:将传统资源明细账单升级为“业务可理解”的分析报告。基于语义化链路标注,明确“新增需求A→新增任务/表数量→资源增长占比”的关联关系。例如,告知业务“本月国庆活动需求新增10个任务、5张表,导致存储成本上升15%”,替代过去“仅告知资源增长数据”的被动答疑模式。
- 无效链路主动识别:针对180天无访问的看板,系统自动推送语义化需求包(含链路DAG、业务描述、资源消耗)至相关负责人,替代繁重的人工溯源,明确链路业务价值,显著推动无效链路的下线效率。

(2)协作效率提升场景:
- 指标口径智能问答:基于语义化资产库构建问答式搜索系统,快速响应“指标口径是什么”的问题,自动返回指标对应的需求背景、底层 SQL、成本与复用情况,无需人工溯源,口径对齐时间可缩短50%以上。
- 需求开发智能辅助:结合行业知识库与语义化资产库,对新需求进行拆解与特征匹配,自动推荐复用度高的优质资产(人工标注+AI解析的需求包),并生成基础 SQL 执行。可将单个需求开发时长从1小时缩短至30分钟。
03. 协作效率提升
1. 实践背景与核心挑战
在游戏行业数据管理实践中,面临着两大关键挑战:
- 资源层面:数据资产维护依赖大量人工操作,存在重复表识别难、需求关联效率低等问题。数据存储增速过快,资源决策缺乏高效支撑,需投入大量人力进行分析。
- 效率层面:跨团队协作存在显著理解成本。需求对接中,“对口径”耗时极高,整体耗时呈“433”结构(数据口径对齐占40%,开发与测试各占30%)。不同团队对数据术语、资产命名存在差异,极易产生理解歧义。

2. 实践路径与方案
(1)数据资产语义化建设
以游戏行业数据资产为核心,通过语义化学习实现资产重塑,具体路径如下:

- 基础资产语义化:针对游戏历史 SQL 日志表、存量表等核心资产,提取基础命名规则、开发规范,确保人工可理解。同时将独立链路的表与任务封装为标准化的可复用资产单元。
- 资产评价模型构建:建立多维度资产评价体系,涵盖“资产有用性”、“SQL 写法规范性”等核心维度,并融入人工反馈数据,筛选优质资产供业务复用,同时为数据治理提供依据。

- 分层知识体系融合:构建三层语义理解体系:底层依托大模型通用常识,中层融入游戏行业专属术语,顶层整合企业内部数据“黑话”,确保跨团队对资产理解一致。

(2)跨团队协作效能提升
将资产语义化能力迁移至协作场景,解决跨团队理解成本问题:
- 指标口径智能解答:基于语义化模型搭建问答式搜索系统(MCP模式),用户提问后可自动调取指标对应的需求背景、底层 SQL、成本数据、复用情况等信息,避免信息偏差。
- 需求实现自动化辅助:结合知识库与语义化资产,对业务需求进行拆解与特征匹配,关联已解析的血缘资产,自动生成 SQL 并执行,缩短需求实现周期。

(3)资产应用模式创新
打破传统平台主导的应用模式,构建开放式探索体系。将标准化语义化资产以灵活形式开放,支持用户基于大模型自主创新应用,减少对特定团队的依赖,整合全员力量拓展资产应用场景。
3. 实践成效
- 资源与治理效能提升:语义化覆盖后,人工维护成本降低约30%,数据存储增速显著下降,资源决策效率大幅提升。

- 资产推荐与开发效率优化:资产推荐 Top3 准确率达95%;业务开发效率提升50%,单个需求开发时间从1小时缩短至0.5小时。
- 资产规模与质量:已完成5500个资产表、10万个字段的语义化处理,并实现资产自动评估,形成标准化优质资产库。

该范式首次在游戏行业实现“治理即服务”的落地,突破“治理=成本中心”的传统认知,证明AI可将治理从“被动支撑”转化为“主动服务”,其经验可为 大数据 场景下的行业治理提供可复用的技术路径(如元数据语义化、链路反推)。
04. 行业趋势与未来规划
- 技术融合深化:加强“数据+AI”融合能力,探索智能数据治理、资源优化的基础能力创新,提升数据资产全生命周期智能化水平。
- 治理模式转型:推动数据治理从“成本支撑部门”向“数据服务提供者”转型,将治理能力转化为标准化数据服务,赋能业务发展。
- 业务创新引领:以语义化资产为核心,持续探索游戏行业数据应用新场景,引领行业数据驱动的业务创新实践。
05. 结语
本文以腾讯游戏数据治理实践为案例,阐述了AI如何推动数据治理从“规则驱动的单点管控”向“语义化驱动的服务化范式”跃迁。
通过元数据语义化、链路智能反推与统一语义模型,解决了传统治理中的资源浪费、协作低效与手段局限问题,实现了“治理即服务”的目标。
实践表明,该范式不仅能提升治理效率与资产质量,更能为业务创新提供有力支撑。对技术的持续精进与分享交流,是推动整个行业向前发展的关键动力,也欢迎大家在 云栈社区 继续深入探讨相关技术话题。
问答环节
Q1:资源治理场景中,实现“从业务需求逆向推导任务链路”的大致步骤和难点是什么?
A1:
- 资源整合阶段:完成基础数据工作,如打通业务看板、数据仓库表、计算任务、资源账单之间的血缘关系,构建资源与数据资产的基础关系图谱。
- 语义化阶段:利用大模型将技术化的血缘关系转换为业务可理解的语义描述。例如,将多张表和多个 SQL 任务“翻译”成一个业务需求包。
- 难点:血缘关系的完整性和准确性是基础,而语义化转换的精准度是关键,需要结合行业知识库和内部术语不断调优模型。
Q2:当业务看板下线清理时,系统识别无效链路的机制,与人工判断相比准确率如何?
A2:
当前准确率表现不错,关键在于给到决策者的信息维度发生了质变。人工判断只能看到孤立的表或任务,而系统通过语义化需求包,能向负责人清晰展示:这个即将下线的链路,当年是为哪个“国庆活动”需求创建的,它的业务价值是什么,具体消耗了多少资源。从“要不要删掉这张表”的犹豫,转变为“确认这个已结束的活动需求是否下线”的明确决策,极大降低了判断难度。
Q3:针对高并发场景下的元数据治理,遇到过哪些技术瓶颈?
A3:
高并发主要带来的挑战是元数据的实时性和一致性。我们的瓶颈不在于并发量本身,而在于治理动作的自动化。
- 更新时效性:大量 SQL 任务频繁变更,如何快速捕获变更并将语义化的元数据同步更新。
- 治理决策的容错:自动化治理操作(如自动下线)如果出现误判,恢复成本高。因此,我们的自动化治理目前更多是“强提醒+人工确认”的模式,而非完全自动执行,这是技术之外,工程可靠性上的瓶颈。
Q4:如何评估和保障AI生成语义化元数据的准确性?
A4:
采用多维度评估体系:
- 程序化校验:基础准确性通过程序检查,如字段和表是否存在,SQL 血缘能否跑通。
- 业务逻辑校验:大模型生成的语义描述,会与已沉淀的优质资产进行特征比对,判断模型幻觉。
- 人工反馈闭环:建立评价和反馈机制。用户在使用过程中对推荐资产的采纳、修改行为,都会成为优化模型的标注数据,形成迭代闭环。
- 关键资产人工标注:对于高频使用、影响面大的核心资产,采用“AI初筛 + 人工审核/标注”的模式,确保高准确率。
以上就是本次分享的内容,谢谢大家。