找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

498

积分

0

好友

68

主题
发表于 昨天 05:12 | 查看: 3| 回复: 0

Phone Agent 是一个基于 AutoGLM 框架开发的手机端智能助理。它能够以多模态方式感知和理解手机屏幕内容,并通过自动化操作帮助用户完成任务。该系统的核心工作流是:首先利用 ADB(Android Debug Bridge)与设备建立连接,然后借助视觉语言模型对当前屏幕状态进行感知与分析。系统会结合其智能规划能力,生成并执行一系列操作步骤。

用户只需用自然语言下达指令,例如“打开小红书搜索美食”,Phone Agent 便会自动解析用户意图、理解当前界面、规划下一步动作并执行,最终完成整个任务流程。值得注意的是,系统内置了安全机制,在执行涉及敏感信息的操作(如支付、登录)前会请求用户确认,并在遇到验证码等复杂场景时支持人工接管,确保了使用的安全性与灵活性。它还支持通过 WiFi 或网络进行远程 ADB 连接,方便开发者进行远程控制与调试。

图片图片

参考文献 [1] https://github.com/zai-org/Open-AutoGLM [2] https://huggingface.co/zai-org/AutoGLM-Phone-9B [3] https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B




上一篇:VMware vSphere固件下载指南:企业级软件与系统镜像资源全收录
下一篇:开源AI Agent系统教程Hello-Agents:从入门到实战构建智能体应用
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-11 05:10 , Processed in 0.076722 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表