academic-figure-generator
Academic Figure Generator は、AI 駆動の学術論文用図生成プラットフォームです。ユーザーは論文をアップロードするだけで、AI が内容をスマートに分析し、図の記述(プロンプト)を生成し、その後ワンクリックで高品質な研究用図を生成します。これにより、従来の時間と労力を要する論文の図作成プロセスを、アップロード、確認、ダウンロードの3ステップに簡素化し、研究効率を大幅に向上させることを目指しています。また、多様な解像度、配色スキーム、および画像生成編集機能を提供します。
git clone https://github.com/LigphiDonk/academic-figure-generator.gitBefore / After 効果比較
1 组従来、研究者は複雑な学術図版を手作業で作成するために多大な時間を費やす必要がありました。これは時間がかかるだけでなく、専門的な描画スキルと美的センスも求められ、プロセスは煩雑でエラーが発生しやすいものでした。
AIプラットフォームを活用すれば、論文をアップロードするだけで、AIが自動的に分析し、高品質な図版を生成します。これにより、数時間から数日かかっていた図版作成作業が数分に短縮され、効率が大幅に向上します。
description SKILL.md
Academic Figure Generator
AI 驱动的学术论文配图生成工具(个人本地版)。上传论文 → AI 分析内容生成 Prompt → 一键生成高质量科研配图。
一句话:把"写完论文还要画图"的痛点,变成「上传 → 确认 → 下载」三步流程。
示例配图
以下均为本平台实际生成的学术配图示例:
功能特性
| 功能 | 说明 |
|---|---|
| 🤖 智能 Prompt 生成 | 上传 PDF/DOCX/TXT 论文,Claude AI 自动分析内容并生成配图描述 |
| 🖼️ 高质量配图 | 支持 1K/2K/4K 多分辨率,16:9/4:3/1:1 等多种比例 |
| 🎨 配色方案 | 50+ 预设学术配色(含色盲友好方案),支持自定义配色 |
| ✏️ 图生图编辑 | 基于已有图片 + 文字指令进行二次编辑 |
| ⚡ 实时状态 | SSE 流式推送生成进度,无需手动刷新 |
| 📁 项目管理 | 按项目组织论文、Prompt 和配图 |
技术栈
| 层级 | 技术 |
|---|---|
| 后端 | FastAPI · SQLAlchemy (Async) · Python 3.12+ |
| 前端 | React 19 · TypeScript · Vite · Tailwind CSS · Radix UI |
| 数据库 | SQLite (自动创建,零配置) |
| 存储 | 本地文件系统 (backend/data/) |
| AI (Prompt) | Claude Agent SDK (claude-agent-sdk) |
| AI (配图) | NanoBanana / Gemini API |
项目结构
academic-figure-generator/
├── backend/ # FastAPI 后端
│ ├── app/
│ │ ├── api/v1/ # API 路由 (projects, documents, prompts, images, color_schemes)
│ │ ├── models/ # SQLAlchemy ORM 模型 (SQLite)
│ │ ├── schemas/ # Pydantic 请求/响应 Schema
│ │ ├── services/ # 业务逻辑层
│ │ │ ├── claude_code_service.py # Claude Agent SDK 集成
│ │ │ ├── local_storage_service.py # 本地文件存储
│ │ │ ├── image_service.py # NanoBanana 图片生成
│ │ │ ├── document_service.py # PDF/DOCX/TXT 解析
│ │ │ └── prompt_service.py # Prompt CRUD
│ │ ├── core/ # 中间件、异常处理、Prompt 模板/配色
│ │ ├── config.py # 环境变量配置
│ │ └── main.py # FastAPI 应用工厂
│ ├── data/ # 运行时数据 (SQLite DB, 上传文件, 生成图片)
│ └── pyproject.toml
├── frontend/ # React SPA 前端
│ ├── src/
│ │ ├── pages/ # 页面组件 (Projects, ProjectWorkspace, Generate, ColorSchemes, Settings)
│ │ ├── components/ui/ # Radix UI 组件库
│ │ ├── store/ # Zustand 状态管理
│ │ └── lib/ # API 客户端
│ ├── package.json
│ └── vite.config.ts
├── academic-figure-prompt/ # AI Coding Agent Skill (SKILL.md)
├── .env # 环境变量
└── README.md
快速开始
前置要求
- Python 3.12+
- Node.js 18+
- Claude Agent SDK:本机已安装 Claude Code CLI 并登录
- API Key:NanoBanana / Gemini 图片生成 API Key
1. 克隆仓库
git clone https://github.com/LigphiDonk/academic-figure-generator.git
cd academic-figure-generator
2. 配置环境变量
编辑项目根目录的 .env 文件:
# Claude Agent SDK (用于 Prompt 生成)
ANTHROPIC_API_KEY=your-anthropic-api-key
# NanoBanana / Gemini API (用于图片生成)
NANOBANANA_API_KEY=your-nanobanana-api-key
NANOBANANA_API_BASE=https://api.keepgo.icu
NANOBANANA_MODEL=gemini-3-pro-image-preview
3. 启动后端
cd backend
# 创建虚拟环境 (推荐)
python -m venv .venv
source .venv/bin/activate # macOS/Linux
# 安装依赖
pip install -e .
# 启动开发服务器
uvicorn app.main:app --host 0.0.0.0 --port 8000 --reload
首次启动时会自动创建 SQLite 数据库 (backend/data/app.db) 和数据目录。
4. 启动前端
cd frontend
npm install
npm run dev
5. 访问
| 服务 | 地址 |
|---|---|
| 应用首页 | http://localhost:5173 |
| API 文档 (Swagger) | http://localhost:8000/docs |
使用流程
核心工作流
上传论文 (PDF/DOCX/TXT)
│
▼
后端解析 → 提取文本和章节结构
│
▼
Claude Agent SDK → 分析论文 → 生成配图 Prompt
│
▼
确认/编辑 Prompt → 选择分辨率和比例
│
▼
NanoBanana API → 生成高质量配图
│
▼
下载图片 / 图生图编辑
快捷生成
除了项目工作流,还支持快捷生成模式:直接输入 Prompt 文本,跳过论文上传步骤,快速生成配图。
架构概览
浏览器 (React SPA)
│
▼
FastAPI 后端 (localhost:8000)
│
├── SQLite (项目、文档、Prompt、图片元数据)
├── 本地文件系统 (上传文件、生成图片)
│
├── Claude Agent SDK → Prompt 生成 (同步)
└── NanoBanana API → 图片生成 (异步后台任务)
环境变量参考
| 变量 | 必填 | 默认值 | 说明 |
|---|---|---|---|
ANTHROPIC_API_KEY | 是 | — | Claude Agent SDK API Key |
NANOBANANA_API_KEY | 是 | — | NanoBanana / Gemini API Key |
NANOBANANA_API_BASE | 否 | https://api.keepgo.icu | NanoBanana API 地址 |
NANOBANANA_MODEL | 否 | gemini-3-pro-image-preview | 图片生成模型 |
DATABASE_PATH | 否 | ./data/app.db | SQLite 数据库路径 |
DATA_DIR | 否 | ./data | 数据存储目录 |
DEBUG | 否 | true | 调试模式 (启用 API 文档) |
CORS_ORIGINS | 否 | ["http://localhost:3000","http://localhost:5173"] | CORS 允许来源 |
MAX_UPLOAD_SIZE_MB | 否 | 50 | 最大上传文件大小 (MB) |
AI 学术配图 Prompt 技能(AI Coding Agent Skill)
本项目附带了一个独立的 AI Coding Agent Skill——academic-figure-prompt,兼容多种 AI 编程助手(Claude Code / Gemini CLI / Cursor 等),无需部署完整平台即可获得顶会级学术论文配图提示词生成能力。
功能简介
academic-figure-prompt 是一个专为学术论文设计的 AI 提示词生成器,能够:
- 📄 阅读并分析论文内容(PDF / LaTeX / Word)
- 🎨 提供 8 种预设学术配色方案(Okabe-Ito、Blue 单色系、Teal+Amber 等),含色盲友好选项
- 🖼️ 生成极其详细的英文提示词,用于 AI 图片工具生成顶会级别的专业配图
- 📐 覆盖多种图表类型:框架图、网络架构图、模块详解图、对比/消融图、数据模板图
安装方式
方式 1:使用 npx skills 一键安装(推荐)
npx skills add LigphiDonk/academic-figure-generator
方式 2:手动安装
git clone https://github.com/LigphiDonk/academic-figure-generator.git
# Gemini CLI
cp -r academic-figure-generator/academic-figure-prompt .gemini/skills/
# Claude Code
cp -r academic-figure-generator/academic-figure-prompt .claude/skills/
使用方法
安装后,在 AI 编程助手对话中直接触发即可:
You: 帮我看一下这篇论文,生成论文配图提示词
AI: [分析论文内容 → 展示配色方案选择 → 生成详细英文提示词]
You: 用 Teal+Amber 配色,帮我画一个网络架构图的提示词
AI: [直接使用方案C生成网络架构图提示词]
开发指南
后端开发
cd backend
source .venv/bin/activate
# 运行测试
pytest -v
# 代码检查
ruff check app/
ruff format app/
前端开发
cd frontend
npm run dev # 启动开发服务器 (localhost:5173)
npm run build # 生产构建
npm run lint # ESLint 检查
前端开发服务器会自动将 /api 请求代理到 localhost:8000。
致谢
感谢 Linux DO 社区的支持与帮助 🙏
许可证
本项目基于 MIT License 开源。
forumユーザーレビュー (0)
レビューを書く
レビューなし
統計データ
ユーザー評価
この Skill を評価