找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3097

积分

0

好友

431

主题
发表于 2025-12-15 09:39:07 | 查看: 74| 回复: 0

在AI辅助办公领域,PPT生成一直是一个关键方向。然而,现有的工具往往难以兼顾美观性、易用性与内容准确性之间的平衡。

对于科研人员而言,演示文稿的核心需求并非炫目的动画效果,而是严谨的逻辑结构与真实的数据呈现。近期,一个名为 Paper2Slides 的开源项目在GitHub上引起了广泛关注。

图片

该项目开源仅一周,便获得了超过1.8K的Star数。

图片

它能够通过一条命令将学术论文转换为专业级别的幻灯片,甚至支持生成学术海报(Poster)。其最大的亮点在于,有效缓解了AI生成内容中常见的“幻觉”问题。

核心机制:RAG驱动,确保内容可追溯

许多AI PPT工具的工作原理仅依赖于标题和通用知识库进行生成,容易产生与原文不符的内容。Paper2Slides采用了截然不同的核心逻辑:基于文档本身的检索增强生成(RAG)

在学术汇报场景中,准确性至关重要。每一句话的出处、每一个结论的依据、每一张图表的上下文都必须清晰可循。如果生成的幻灯片内容无法快速追溯到原始论文,那么其可信度将大打折扣。

因此,Paper2Slides引入RAG(检索增强生成) 机制,确保所有生成内容都紧密锚定在输入文档的信息之上。

此外,该项目还具备以下特性:

图片

支持多Worker并行处理,对处理长篇文档非常高效。

主要功能

  • 多格式文档支持:可无缝处理PDF、Word、Excel、PowerPoint、Markdown等多种常见文件格式。
  • 精准内容提取:通过RAG机制,确保论文中的关键论点、数据及图表被精确捕获并呈现。
  • 来源可追溯性:生成的内容与原文保持直接关联,有效避免了信息在传递过程中的失真。
  • 高度可定制化:提供多种内置专业主题,也支持使用自然语言描述来自定义幻灯片样式。
  • 快速生成与预览:“即时预览”模式支持快速调整并实时查看效果。
  • 会话管理:高级检查点系统可以保存所有进度,方便随时暂停、恢复或切换任务。
  • 专业级视觉输出:生成的幻灯片和海报符合出版质量标准,可直接用于演示或展示。

样式定制展示

以下是一个自定义“龙猫”主题的样式提示词示例:

--style "Studio Ghibli anime style with warm whimsical aesthetic. Use soft watercolor Morandi tones with light cream background, muted sage green and dusty pink accents. Totoro character can appear as a friendly guide relating to the content, with nature elements like soft clouds or leaves."

使用该样式生成的效果如下图所示:

图片

图片

图片

图片

快速开始

Paper2Slides提供了两种使用方式:

  • 命令行工具:适合习惯基于Python环境部署的科研人员。
  • Web图形界面:降低了使用门槛,更适合学生群体。

环境部署与安装

首先进行环境搭建,项目依赖于Python:

# 克隆项目仓库
git clone https://github.com/HKUDS/Paper2Slides.git
cd Paper2Slides
# 创建Python虚拟环境
conda create -n paper2slides python=3.12 -y
conda activate paper2slides
# 安装项目依赖
pip install -r requirements.txt

安装完成后,需在项目目录中创建 .env 文件并配置所需的API密钥,具体变量可参考 paper2slides/paper2slides/.env.example 文件。

命令行使用

基础命令示例:

# 基础用法 - 从论文生成幻灯片
python -m paper2slides --input paper.pdf --output slides --length medium

# 生成自定义样式的海报
python -m paper2slides --input paper.pdf --output poster --style "minimalist with blue theme" --density medium

# 启用快速生成模式
python -m paper2slides --input paper.pdf --output slides --fast

# 启用并行生成(默认使用2个工作进程)
python -m paper2slides --input paper.pdf --output slides --parallel 2

# 列出所有已处理的输出
python -m paper2slides --list

支持的命令行参数详见下图:
图片

Web界面使用

启动Web服务非常简单,只需运行根目录下的脚本:

./scripts/start.sh

该脚本会同时启动后端和前端服务。启动成功后,在浏览器中访问 http://localhost:5173 即可使用直观的图形界面进行操作。
图片

总结

Paper2Slides 不仅仅是一个论文总结工具,它是一个旨在将“科研内容 → 汇报成果”流程自动化的高效解决方案。其基于RAG(检索增强生成) 的核心设计,保证了内容的可追溯性、对图表的准确理解以及生成过程的可控性,这些特性使其显著优于普通的AI摘要产品。

如果你经常需要准备论文汇报或学术演示,这个项目值得尝试。

项目地址:https://github.com/HKUDS/Paper2Slides

图片




上一篇:阿里云边缘安全加速(ESA)免费申请指南:图文详解长期使用步骤
下一篇:Qt与FFmpeg解码TS流:实现多节目动态切换与轨道识别技术解析
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-1 14:31 , Processed in 0.407697 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表