3988 积分	0 好友	548 主题

发消息

[其他] 手机离线部署大模型指南：使用MNN-LLM在Android设备本地运行AI

发表于 2026-1-25 06:49:27 | 查看: 102| 回复: 0

背景

现在大家使用大模型，基本都是依赖各大厂商提供的在线服务。但你想过没有，万一在一个完全没有网络的环境下，你又恰好遇到需要AI协助的问题，该怎么办呢？别着急，今天就介绍一个可以在手机上离线部署、并能通过本地网络访问的大模型解决方案：MNN-LLM。

官方下载地址和文档如下：
https://gitee.com/alibaba/MNN

简介

MNN是一个轻量级的深度神经网络引擎，全面支持深度学习模型的推理与训练。它的设计目标就是跨平台，能够在服务器、个人电脑、手机以及各类嵌入式设备上高效运行（包括iOS和Android系统）。目前，MNN已经在阿里巴巴集团内部的手机淘宝、手机天猫、优酷等超过30个App中广泛应用，覆盖了直播、短视频、搜索推荐、商品图像搜索、互动营销、安全风控等多个核心场景。

而MNN-LLM正是基于强大的MNN引擎，专为运行大语言模型（Large Language Model, LLM）而开发的解决方案。它致力于解决大语言模型在个人设备上的高效部署难题，无论是手机、电脑还是嵌入式设备。它兼容市面上主流的模型，例如通义千问、百川、智谱ChatGLM以及LLaMA系列等。

手机部署和API开放教程

想在手机上体验离线大模型？跟着下面几个步骤操作即可：

安装App：从上面的下载地址中找到并下载 MNN Chat 应用，在Android设备上完成安装。
下载模型：打开App，进入“模型市场”。这里提供了多个不同规格的模型，请根据自己手机的硬件性能（特别是内存大小）选择合适的模型下载。切记不要勉强运行参数过大的模型，否则可能导致手机卡顿甚至发热严重。
开始对话：模型下载完成后，在“我的模型”列表中可以看到它。点击模型即可进入聊天对话界面。
离线测试：现在，你可以尝试关闭手机的Wi-Fi和移动数据，然后向模型发送一个问题。如图所示，即使完全断网，模型依然能够进行独立的思考和回复，真正做到不依赖互联网。
启用API服务：如果你希望通过电脑网页来与手机上的模型对话，可以在App的“设置”中，找到并开启“开启API网络服务”选项。这将启动一个兼容OpenAI API格式的本地服务器。
配置网络：开启API服务后，通常还需要进入“API服务设置”界面，确认服务器监听的端口（默认是8080）和IP地址（手机在局域网内的IP，如172.167.3.39）。保持默认设置或按需调整即可。
网页访问：确保你的电脑和手机连接在同一个Wi-Fi网络下。然后在电脑的浏览器中，输入上一步中配置的访问地址（例如 http://172.167.3.39:8080），就能打开一个Web对话界面进行聊天了。根据实测，这个Web界面的功能相对基础，但用于基础的对话测试完全足够。