找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1812

积分

0

好友

232

主题
发表于 昨天 12:28 | 查看: 5| 回复: 0

一个帮助个人开发者从社交媒体自动发现用户核心痛点的 Web 应用,支持智能聚类分析和 AI 产品方案生成。

DeepPoint 工具 Logo

功能特性

痛点分析模块

  • 输入关键词自动抓取抖音相关视频和评论
  • 基于 embedding + DBSCAN 的语义聚类算法,对海量用户反馈进行智能分组。
  • 调用 GLM-4.6 思考模型,对聚类结果进行深度分析与归纳。
  • 深度分析维度
    • 痛点深度:从表面痛点挖掘到根本原因,结合用户场景和情感强度。
    • 市场格局:分析现有解决方案、未被满足的需求以及潜在的市场机会。
    • MVP计划:生成包含核心功能、验证假设、首批用户获取及成本估算的最小可行产品路线图。
  • 优先级评分系统:综合需求强度、市场规模和竞争程度,为每个痛点进行量化评估。
  • 数据质量分级:根据分析样本量,将结果分为 exploratory (<50条)、preliminary (50-200条)、reliable (≥200条) 三个可信度等级。
  • 以清晰的可视化表格展示分析结果。
  • 支持一键导出 CSV 格式的详细报告。
  • 原始数据导出:可导出爬虫获取的原始数据以及经过聚类处理的分组数据。

AI 产品建议模块

  • 模拟 AI 产品经理角色,根据分析出的用户痛点自动生成完整的产品方案。
  • 方案内容包括产品核心功能、推荐技术栈、分阶段开发路线图等。
  • 对产品的实现难度和市场潜力进行评估,为决策提供参考。

数据源说明

数据源 状态 说明
抖音 - 旧版 可用 基于 DrissionPage 浏览器自动化,支持视频搜索和评论采集。
抖音 - 新版 可用 基于 Playwright + CDP,反检测能力更强,首次使用需扫码登录。
小红书 暂停 测试发现此数据源易导致账号被封,暂不建议使用。

运行预览

更多界面截图与资源文件,请浏览 assets 文件夹。

DeepPoint 仪表盘界面,展示了分析过程的配置和结果概览

详细的痛点分析页面,展示了需求强度、根因分析、用户场景和情绪强度等信息

快速开始

环境要求

  • Node.js >= 18
  • Python >= 3.10
  • npm 或 pnpm
  • Google Chrome

1. 安装依赖

# 克隆项目
git clone https://github.com/your-username/deeppoint-ai.git
cd deeppoint-ai

# 安装 Node.js 依赖
npm install

# 安装 Python 依赖
pip install -r requirements.txt

# 如果使用新版抖音数据源,还需安装浏览器
playwright install chromium

# 或手动安装核心依赖
pip install DrissionPage beautifulsoup4 lxml scikit-learn numpy python-dotenv

2. 配置环境变量

cp .env.example .env.local

编辑 .env.local 文件:

# 智谱AI GLM API配置 (必需)
# 注册地址: https://open.bigmodel.cn/
GLM_API_KEY=your_glm_api_key_here
GLM_MODEL_NAME=glm-4.6
GLM_EMBEDDING_MODEL=embedding-3

# 浏览器配置 (服务器环境设为 true)
HEADLESS=false

3. 运行项目

# 开发模式
npm run dev

# 生产构建
npm run build
npm run start

访问 http://localhost:3000 即可开始使用。

使用指南

痛点分析(主页)

  1. 选择数据源(推荐使用新版抖音)。
  2. 输入关键词,多个用逗号分隔,例如:露营, 新手, 装备
  3. 可选开启“包含评论区观点分析”(更耗时但数据更丰富)。
  4. 点击“开始智能分析”,耐心等待结果。
  5. 在结果表格中,点击任意行可查看详细分析原文,或点击导出按钮下载 CSV 报告。

新版抖音说明:首次使用时系统会弹出一个浏览器窗口,需要你扫码登录抖音。登录状态会自动保存,后续分析无需重复登录。

AI 产品建议(/ai-product 页面)

  1. 输入你感兴趣的目标领域关键词。
  2. AI 将自动分析该领域的用户反馈,并生成一份完整的产品方案。
  3. 查看方案详情,包括产品名称、核心功能、技术栈建议、开发计划等。

技术栈

类别 技术
前端框架 Next.js 15 + React 19
样式 Tailwind CSS 4
数据请求 SWR(用于轮询任务状态)
后端 Next.js API Routes
数据采集 Python + DrissionPage / Playwright
AI 分析 智谱 GLM-4.6(思考模型) + embedding-3
聚类算法 基于 embedding + DBSCAN 的语义聚类

API 配置

智谱 AI (必需)

  1. 注册账号:https://open.bigmodel.cn/
  2. 在控制台创建 API Key。
  3. 将获取到的 Key 配置到 GLM_API_KEY 环境变量中。

常见问题

Q: 抖音数据采集很慢?

A: 这是正常现象。工具使用浏览器自动化模拟真实用户操作以避免被封,速度相对较慢。“深度抓取”模式会采集更多数据,因此耗时也更长。

Q: 如何在服务器部署?

A: 在服务器环境变量中设置 HEADLESS=true 以启用无头浏览器模式。

Q: 聚类结果太少?

A: 可以尝试输入更多或更相关的关键词来扩大数据样本。此外,你也可以调整 clustering-service.ts 文件中的 minClusterSize(最小聚类尺寸)参数来获得不同粒度的聚类结果。

Q: 小红书数据源能用吗?

A: 目前暂不建议使用。在测试阶段发现,使用该数据源进行采集有较高的账号被封禁风险。

项目地址

该项目的完整源码和最新文档可以在 GitHub 上找到:https://github.com/weiyf2/deeppoint-ai

如果你对使用 AI 进行用户研究或构建类似的 Next.js 全栈应用感兴趣,欢迎在云栈社区 与更多开发者交流心得。




上一篇:Shiro反序列化漏洞在不出网环境下的渗透利用实践
下一篇:使用Windows App SDK现代化旧桌面应用:WinUI 3集成与部署指南
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-16 00:39 , Processed in 0.408089 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表