找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

478

积分

0

好友

66

主题
发表于 4 天前 | 查看: 16| 回复: 0

在大模型、AI Agent、Vibe Coding 与 Spec Coding 飞速发展的浪潮中,AI 与泛前端的融合正引发行业的深度思考:AI 究竟会 “替代” 传统开发模式,还是会推动一场效率与体验的全新 “革命”?它又将为泛前端领域带来哪些底层变革?

本文是系列文章的上篇,将围绕 “AI 浪潮下的泛前端变革与应对” 展开深度探讨 —— 从泛前端的日常工作切入,拆解 AI 带来的关键影响。系列下篇则会聚焦前端高频场景 “UI2Code”,用具体实践展现AI技术如何落地到设计稿转代码的全流程。

AI 时代,“图形用户界面”是必须的吗?

目前,泛前端的核心工作仍集中在“图形用户界面”的开发上。那么,在 AI 时代,“图形用户界面”将迎来哪些可能的变化?

在人机交互中,“图形用户界面”的作用是什么?

用户界面(User Interface,简称 UI)在人机交互领域,主要工作在如下图所示的 “Input-Output Loop”中。输入端,是人类通过“手”、“声音”等方式,借助键盘、鼠标等硬件设备将信息输入系统。输出端,是系统侧通过显示器、音箱等设备将信息反馈给人类。

图片

图片来源:维基百科

简而言之,UI是人机交互的载体。其核心目标是让人能有效操作机器,同时机器能反馈关键信息以辅助人的决策。

当用户界面进化到图形用户界面(Graphical User Interface,简称 GUI)时代,它允许用户通过图形图标与“系统”进行交互。“图形用户界面指采用图形方式显示的计算机操作的用户界面。与早期计算机使用的命令行界面(Command Line Interface,简称 CLI)相比,除了降低用户的操作负担之外,对于新用户而言,图形界面在视觉上更易于接受,学习成本大幅下降,也让电脑的大众化得以实现。”——维基百科

基于此,我们可以将GUI的核心作用归结为三点:

  1. 人机间信息的“传递者”
    a. 负责用户诉求、信息及行为数据的录入。
    b. 实现系统状态的直观呈现。
  2. 系统功能的“翻译者”
    a. 衔接技术与用户:通过可视化设计,将技术功能转化为用户可感知的服务。
    b. 明确功能优先级:借助元素的大小、颜色、位置等设计,突出核心功能,弱化次要功能,帮助用户快速定位需求。
  3. 用户体验的“承载者”
    a. 交互层面:通过流程引导,降低操作复杂度。
    b. 界面层面:以美观、统一的 UI 设计,提升用户的愉悦感。

图片

大语言模型对用户界面的影响

那么,大语言模型(LLM) 的出现带来了哪些变化?我们可以从人工智能的三大基础能力来观察。

图片

大模型具备三项核心能力:

1. 自然语言处理:人类可以通过自然语言与机器(系统)进行交流;
2. 人工智能:具备一定的决策、规划、监督、学习等智能能力
3. 工具调用:能够自主判断并调用外部工具。

将这三项能力映射到 GUI 上,会引发显著变化:

图片

如上图所示,我们可以推断出:

  • 自然语言将成为“用户界面控件”的核心,取代传统定制化的“用户动线”。系统通过大模型调度、组装各种功能界面来展示信息。
  • 传统图形用户界面可能会被拆解为独立功能模块,而不是以一套整体的页面形式交付给用户。

以上两点变化对应一个专有名词—— “自然语言用户界面(LUI 或 NLUI)”。

自然语言用户界面:LUI (Language User Interface)NLUI(Nature Language User Interface),是使用自然语言充当用户界面控件,用于在软件应用程序中创建、选择和修改数据。它是一种因其速度和易用性而被追求的人机界面,但面临着理解模糊输入的挑战,是自然语言处理领域的活跃研究方向。

在行业实践中,已有不少相关案例,如:

  • 滴滴企业级差旅助手
    差旅助手可以直接对接用户的出差计划。用户点击一键规划后,AI 会跟进计划,查询并匹配行程的机票或高铁方案。

    图片
    图片
    图片

    图片来源:滴滴企业级差旅助手截图

  • 某旅游平台“问一问”
    用户输入“去三亚玩怎么安排比较好?”,AI 会快速分析需求,提供机票预订、天气提醒等全方位信息,并生成多套方案供用户对比选择。

    图片
    图片
    图片

    图片来源:某旅游平台问一问截图

推论一:用户界面将从 GUI 向 LUI 迁移

图片

基于上述分析,我们可以得出推论:“用户界面将逐步从GUI 向 LUI 迁移”。在这一模式下:

  1. 自然语言作为交互中枢,由大模型调度、组装各种功能界面展示信息;
  2. 用户界面可能被拆解为独立功能模块,而非完整的页面;
  3. GUI 和 LUI 将长期并存,满足不同场景需求。

这种迁移的核心价值,在于将用户从繁杂的操作流程中解放出来,使其专注于核心需求。同时,企业将尝试重构开发逻辑、提升运营效率,进而影响包括前端开发在内的整个技术领域的架构与工作内容。

更深层次的改变:通用 AI Agent 带来的变化

“2024 年是生成式 AI(Gen AI)元年,2025 年是 AI Agent 元年”。我们不去深究通用 AI Agent 的内部工作原理,而是观察它如何处理网页。

Playwright 是微软开源的自动化测试工具,支持主流浏览器。其开源的 MCP(Model Context Protocol)方案,可以让我们体验 Agent 如何操作网页。

以下以 AI 编辑器 Trae CN 为例,在安装好 Playwright MCP 后,选择 @Builder with MCP 模式。

图片
图片

输入指令:“请在浏览器中打开某搜索平台,搜索一下关于 AI Agent 的最新趋势,找到三篇最新的、最权威的新闻报道,打开并进行总结。将总结的内容使用 HTML 绘制成图形化的展示。”

接下来,Trae CN 通过 Playwright MCP 自动完成了一系列操作:

  1. 打开浏览器,访问搜索平台并输入关键词进行搜索。
    图片
    图片
  2. 滚动页面,点击“资讯”标签筛选新闻结果。
    图片
    图片
  3. 分析结果,自主判断并选出三篇符合要求的文章。
    图片
  4. 在新标签页打开文章,阅读并收集信息。
    图片
  5. 总结内容,自动创建并打开包含总结和可视化图表的 HTML 文件。
    图片
    HTML 部分源码与效果图
    图片
    图片
    图片
    图片

整个流程中,Agent 展现出强大的自主闭环能力:能自主启动浏览器、操控网页、处理内容、编写运行代码、整合多源信息,全程无需人工干预。

收益对比: 传统模式下,同类需求需业务、产品、设计、前端多角色协作约一周。而借助 Agent,仅需一句指令即可快速完成。

当前,无论是商业产品、开源框架还是私有化部署的 AI Agent,在处理网页时都已能实现全流程自动化。

图片
图片

AI Agent 带来的疑问

这引发了一个关键思考:若 AI Agent 是未来趋势,既能自主访问页面,又能自主构建最终界面,那么企业是否还需要自行开发面向人类的网页或用户界面?是否直接提供 API,才是更高效的服务交付方式?

推论二:企业提供服务将从提供网页向提供 API(MCP Server)迁移

图片

基于成本与效率考量,我们得到第二个推论:如果未来大量流量来自通用 AI Agent 而非人类用户,那么面向人类的用户界面重要性将下降。同时,API 在系统间信息交互中的效率优势显著。因此,企业提供服务的方式将逐步从“提供网页(用户界面)”向“提供 API(MCP Server)”迁移,以实现更灵活、可扩展的系统集成。

AI 时代,专业的泛前端研发岗是必须的吗?

泛前端的专业壁垒是什么?

泛前端的角色定位和指标体系

下图展示了产研团队各角色在“理解用户需求”到“技术实现”链路中的关注侧重。前端开发处于中间,需同时关注“用户体验”和“技术实现”。

图片

以“性能体验”指标为例,通过与后端、设计岗位对比,可以管窥前端的专业壁垒。

图片
图片

性能层面:

  • 前端性能: 聚焦用户直接感知的交互体验,核心是“页面响应速度”和“交互流畅度”。感受是即时的(如点击卡顿、加载缓慢)。
  • 后端性能: 聚焦系统处理业务逻辑的效率,核心是“请求处理速度”和“服务器容量”。其优劣间接影响前端体验(如接口慢导致加载延迟)。

体验层面:

  • 设计的核心目标: 构建“体验蓝图”,确保体验的合理性、可用性和情感共鸣。回答“用户需要什么体验”、“什么样的体验最优”。
  • 前端的核心目标: 落地“体验蓝图”,确保体验的一致性、流畅性和稳定性。回答“如何让设计的体验在实际使用中不打折”。

页面加载速度是最能体现前端专业性的指标之一。这个问题涉及业务形态、用户流程、技术架构和运行环境等多个复杂层面,在企业级应用中尤为突出。以当前的实践经验看,AI 可以帮助分析小问题并提供建议,但这些建议不一定正确。类似“性能优化”这类复杂问题,专业前端有很强的专业壁垒。AI 可作为辅助工具,但无法完全替代专业前端的工作。

“AI 会取代程序员”,到底“取代”的是什么?

这里引用凯文·凯利在《2049——未来10000天的可能》中的观点:
“AI 与人类最大的区别是创造力的不同。”
“我把创造力分为小写的创造力(creativity)和大写的创造力(CREATIVITY)。前者主要体现在复制和应用层面,即在已知世界用已知方法更有效地完成任务;后者则聚焦在突破与创新层面,即在未知世界中探索、寻求创新。”
“AI 会取代很多人类的工作,比如插画师、低阶的程序员,正是因为 AI 正在迅速获得这些领域中小写的创造力。”

推论三:程序员需要从“复制和应用”向“突破与创新”迁移

图片

基于此,我们得到第三个推论:在 AI 浪潮下,程序员的核心能力需从“复制和应用”向“突破与创新”迁移,借助大模型拓展能力边界,创造独特价值。

泛前端程序员要如何跟上 AI 浪潮?

泛前端领域历经 Ajax、智能机、H5、NodeJS、跨端、小程序等多轮技术浪潮。近年,跨端技术与小程序深刻改变了行业生态:

  • 技术方向: 工作重心从 Native 页面转向跨端页面。
  • 市场环境: 跨端减少 Native 需求,小程序让企业不再执着于独立 App,压缩了 Native 空间。
  • 开发者能力: 跨端技术模糊了客户端与前端的壁垒,通过 JS 实现了泛前端技术的统一,也拓展了开发者的全栈能力

回顾前文三个迁移:

  1. 用户界面将从 GUI 向 LUI 迁移
  2. 企业提供服务将从提供网页向提供 API(MCP Server)迁移
  3. 程序员的能力需要从“复制和应用”向“突破与创新”迁移

这三个迁移分别对应泛前端的技术方向、市场环境和能力模型。跟上 AI 浪潮,也需要从这三个方向入手。

图片

提升个人能力

大模型基础知识
当前大模型处于爆发初期,提示词工程、上下文工程、氛围编程(Vibe Coding)、Spec Coding 等概念层出不穷,说明其使用仍处摸索阶段,尚未形成规范。这类似于 JavaScript 早期作为“胶水语言”诞生,历经30年发展才具备强大的全栈能力。大模型的潜力也需要时间沉淀和持续探索来释放。

大模型的出现,近乎圆了“自然语言编程”的梦想。 之所以说“近乎”,原因有二:

  1. 输入端: 自然语言灵活度高、缺乏规范,给精准转化带来挑战。
  2. 输出端: 大模型存在随机性与幻觉问题。

正是这两点局限,导致不同人的使用效果天差地别。因此,面对这项新技术,我们仍需通过持续学习与实践来驾驭它。

大模型学习清单参考:

  1. 原理: 大语言模型的发展脉络(从语言模型到神经网络,再到大语言模型)。
  2. 理论: AI Agent 的演进(从 Chatbot 到 AI 助手,以及如何搭建自己的 AI Agent)。
  3. 理论: 提示词工程(Prompt Engineering)。
  4. 理论: 上下文工程(Context Engineering)。
  5. 实践: 使用 AI 编辑器和 AI 编程(Vibe Coding、Spec Coding)提效日常工作(编码及其他场景)。
  6. 实践: 使用 Coze、Dify、n8n 等平台搭建私有 AI Agent。
  7. 实践: 训练自己的专属模型,深化对大模型运行逻辑的理解。

思维能力
“Code is cheap, show me your thinking” 这句流行语,精准指出了当前技术环境的核心需求。个人能力从“复制与应用”向“突破与创新”迁移已是必然,而卓越的思考力是这场迁移的核心通行证。

代码编写门槛正在降低。过去需反复调试的语法、背诵的 API、手动搭建的框架,如今借助 AI 辅助工具,几句提示词就能快速生成。这意味着,单纯“会写代码”、“能套用方案”的能力正在失去稀缺性。反而是那些藏在代码背后的深度思考——如拆解核心痛点、预判潜在风险、找到问题根本原因——这些无法被工具替代的“思考增量”,才是彰显价值的关键。

这种思考能力在提示词工程、Vibe Coding 等新兴实践中体现得更为直接。以提示词工程为例,它本质是对需求的深度拆解与逻辑梳理,考验的是“定义问题、拆解任务、设计路径”的思考逻辑。Vibe Coding 强调通过整体语境提升效率,也需要开发者先理解场景核心需求和用户交互习惯。过往在逻辑拆解、问题分析上的训练,恰恰为这些新实践提供了底层支撑。

归根结底,技术工具可以替代重复劳动,却无法替代深度思考;代码可以被快速生成,却需要思考来赋予它“解决问题、创造价值”的灵魂。 对从业者而言,未来的技术竞争,本质上是“思考力”的竞争。

升级技术架构

GUI 向 LUI 迁移的过程中,需要面对两大核心变化:

  1. 现有项目架构升级: GUI 架构围绕“可视化交互”设计,而 LUI 以“自然语言交互”为核心,需要底层支持对话上下文理解、意图识别、多轮交互等。现有项目需要从数据流转、功能模块划分等层面进行重构,才能适配 LUI 模式。
  2. 日常工作模式转变: “编写功能卡片”将成为 LUI 生态下的主要工作。开发者需要理解 LUI 交互场景,设计卡片如何适配不同对话语境、如何用简洁语言反馈结果、如何兼容多轮对话中的参数补充。

正是因为涉及底层架构的“硬调整”和日常工作模式的“软适配”,我们必须主动学习 LUI 的交互设计逻辑、功能卡片开发规范与架构升级关键技术,通过提前布局抢占先机。

下图是我们对前端架构从 GUI 转向 LUI 的一些思考,主要分为“架构设计差异”与“架构迁移”两部分:

  • 架构设计差异
    图片
  • 架构迁移
    图片

适应新市场环境
“寇可往,我亦可往”。大模型的爆发没有削弱泛前端的价值,反而打破了技术壁垒,让所有人站在了同一起跑线。泛前端从业者完全有能力主动掌控“无页面化”的未来。

从技术本质看,大模型带来的“无页面化”核心是通过 AI Agent 实现“需求-服务”的直接对接,这离不开对用户意图的精准理解、服务逻辑的高效串联和交互体验的细腻把控。这些正是泛前端领域多年积累的核心能力。在 GUI 时代,我们通过界面传递服务价值;在 LUI 与 AI Agent 驱动的“无页面化”时代,我们需要将“通过界面承载体验”的能力,转化为“通过 Agent 定义交互逻辑”的能力。

再看行业竞争,其他领域尝试通过 AI Agent 实现无页面化,更多是依托大模型的通用能力进行探索。而泛前端从业者自带“懂交互、懂服务串联、懂用户体验”的基因,在打造无页面方案时更具天然优势,能更快理清交互链路,更精准地规避无页面场景下的体验痛点,甚至能将过往跨端、组件化的技术经验复用到 AI Agent 的设计中。

因此,大模型带来的“无页面化”浪潮,并非是对泛前端的替代,而是提供了新的技术出口。“无页面”不代表“无体验”,而把控体验的核心能力,始终握在泛前端手中。

结语

以上为系列文章的上篇,全文以“AI 与泛前端融合”为核心,围绕“思考”展开探讨:从人机交互本质出发,剖析 GUI 向 LUI 迁移的界面变革,梳理企业服务从网页向 API 转型的趋势,明确程序员能力升级的方向,并给出“提升个人能力、升级技术架构、适应新市场环境”的应对路径,为泛前端从业者厘清 AI 浪潮下的变革逻辑。

后续下篇将聚焦前端高频场景“UI2Code”(设计稿转代码),通过工具对比、技术拆解与实践案例,具体展现 AI 如何落地设计稿转代码全流程,为前端开发提供效率助力。




上一篇:Ant Design发布X-Markdown:专为React AI流式应用的高性能渲染方案
下一篇:MCP协议实战:从JS云函数到LangChain Agent与Flowise的跨平台工具集成
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-24 20:52 , Processed in 0.172329 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表