Qwen-Web 是一个开源项目,允许在本地浏览器中直接运行 Qwen3-0.6b 大语言模型,无需额外安装,且不记录日志或数据。

在线 Demo:https://qwen-web.sdan.io
安装
使用 Docker Compose 进行部署:
services:
qwen-web:
image: heizicao/qwen-web:latest
container_name: qwen-web
ports:
- 8443:443
restart: always
使用
在浏览器中输入 https://NAS的IP:8443 访问界面,注意使用 HTTPS 协议。

提示:如果显示部署私密连接,选择继续访问即可。

每次打开网页时,需要先加载 Qwen3-0.6b 模型。

顶部栏可以切换颜色主题。

背景支持网格效果。

输入文字并回车,模型会生成回复。

回复速度显示为 14.93 TPS,由于显示思考过程,速度在可接受范围内。

左侧内置多个角色,可选择进行对话。

网页聊天功能利用 WebGPU 技术,调用设备 GPU 进行计算。

总结
该项目展示了在浏览器中运行 Qwen3 大语言模型的可行性,通过 WebGPU 实现 GPU 加速计算。目前,PC 界面适配有待改进,且偶现 BUG(如卡顿或英文回复)。但作为技术演示,它提供了测试设备 GPU 性能的有趣方式。
综合推荐:⭐⭐⭐(技术新颖)
使用体验:⭐⭐(界面简易,偶发问题)
部署难度:⭐(非常简单)
|