Home/多媒体与音视频/academic-figure-generator
A

academic-figure-generator

by @LigphiDonkv
3.5(0)

Academic Figure Generator is an AI-driven platform for generating accompanying figures for academic papers. Users simply upload their papers, and the AI intelligently analyzes the content to generate figure descriptions (prompts), then creates high-quality scientific research figures with a single click. It aims to simplify the traditional time-consuming and labor-intensive process of creating paper figures into three steps: upload, confirm, and download, significantly boosting research efficiency. It also provides various resolutions, color schemes, and image-to-image editing functionalities.

AIAcademic ResearchFigure GenerationScientific VisualizationResearch ToolGitHub
Installation
git clone https://github.com/LigphiDonk/academic-figure-generator.git
compare_arrows

Before / After Comparison

1
Before

Traditionally, researchers had to spend a significant amount of time manually creating complex academic illustrations. This was not only time-consuming but also required professional drawing skills and aesthetic judgment, making the process cumbersome and prone to errors.

After

With an AI platform, researchers only need to upload their paper. The AI can automatically analyze it and generate high-quality illustrations, reducing illustration work that used to take hours or even days to just a few minutes, significantly boosting efficiency.

description SKILL.md

Academic Figure Generator

Python FastAPI React License

AI 驱动的学术论文配图生成工具(个人本地版)。上传论文 → AI 分析内容生成 Prompt → 一键生成高质量科研配图。

一句话:把"写完论文还要画图"的痛点,变成「上传 → 确认 → 下载」三步流程。

示例配图

以下均为本平台实际生成的学术配图示例:

功能特性

功能说明
🤖 智能 Prompt 生成上传 PDF/DOCX/TXT 论文,Claude AI 自动分析内容并生成配图描述
🖼️ 高质量配图支持 1K/2K/4K 多分辨率,16:9/4:3/1:1 等多种比例
🎨 配色方案50+ 预设学术配色(含色盲友好方案),支持自定义配色
✏️ 图生图编辑基于已有图片 + 文字指令进行二次编辑
实时状态SSE 流式推送生成进度,无需手动刷新
📁 项目管理按项目组织论文、Prompt 和配图

技术栈

层级技术
后端FastAPI · SQLAlchemy (Async) · Python 3.12+
前端React 19 · TypeScript · Vite · Tailwind CSS · Radix UI
数据库SQLite (自动创建,零配置)
存储本地文件系统 (backend/data/)
AI (Prompt)Claude Agent SDK (claude-agent-sdk)
AI (配图)NanoBanana / Gemini API

项目结构

academic-figure-generator/
├── backend/                  # FastAPI 后端
│   ├── app/
│   │   ├── api/v1/           # API 路由 (projects, documents, prompts, images, color_schemes)
│   │   ├── models/           # SQLAlchemy ORM 模型 (SQLite)
│   │   ├── schemas/          # Pydantic 请求/响应 Schema
│   │   ├── services/         # 业务逻辑层
│   │   │   ├── claude_code_service.py   # Claude Agent SDK 集成
│   │   │   ├── local_storage_service.py # 本地文件存储
│   │   │   ├── image_service.py         # NanoBanana 图片生成
│   │   │   ├── document_service.py      # PDF/DOCX/TXT 解析
│   │   │   └── prompt_service.py        # Prompt CRUD
│   │   ├── core/             # 中间件、异常处理、Prompt 模板/配色
│   │   ├── config.py         # 环境变量配置
│   │   └── main.py           # FastAPI 应用工厂
│   ├── data/                 # 运行时数据 (SQLite DB, 上传文件, 生成图片)
│   └── pyproject.toml
├── frontend/                 # React SPA 前端
│   ├── src/
│   │   ├── pages/            # 页面组件 (Projects, ProjectWorkspace, Generate, ColorSchemes, Settings)
│   │   ├── components/ui/    # Radix UI 组件库
│   │   ├── store/            # Zustand 状态管理
│   │   └── lib/              # API 客户端
│   ├── package.json
│   └── vite.config.ts
├── academic-figure-prompt/   # AI Coding Agent Skill (SKILL.md)
├── .env                      # 环境变量
└── README.md

快速开始

前置要求

  • Python 3.12+
  • Node.js 18+
  • Claude Agent SDK:本机已安装 Claude Code CLI 并登录
  • API Key:NanoBanana / Gemini 图片生成 API Key

1. 克隆仓库

git clone https://github.com/LigphiDonk/academic-figure-generator.git
cd academic-figure-generator

2. 配置环境变量

编辑项目根目录的 .env 文件:

# Claude Agent SDK (用于 Prompt 生成)
ANTHROPIC_API_KEY=your-anthropic-api-key

# NanoBanana / Gemini API (用于图片生成)
NANOBANANA_API_KEY=your-nanobanana-api-key
NANOBANANA_API_BASE=https://api.keepgo.icu
NANOBANANA_MODEL=gemini-3-pro-image-preview

3. 启动后端

cd backend

# 创建虚拟环境 (推荐)
python -m venv .venv
source .venv/bin/activate  # macOS/Linux

# 安装依赖
pip install -e .

# 启动开发服务器
uvicorn app.main:app --host 0.0.0.0 --port 8000 --reload

首次启动时会自动创建 SQLite 数据库 (backend/data/app.db) 和数据目录。

4. 启动前端

cd frontend

npm install
npm run dev

5. 访问

服务地址
应用首页http://localhost:5173
API 文档 (Swagger)http://localhost:8000/docs

使用流程

核心工作流

上传论文 (PDF/DOCX/TXT)
    │
    ▼
后端解析 → 提取文本和章节结构
    │
    ▼
Claude Agent SDK → 分析论文 → 生成配图 Prompt
    │
    ▼
确认/编辑 Prompt → 选择分辨率和比例
    │
    ▼
NanoBanana API → 生成高质量配图
    │
    ▼
下载图片 / 图生图编辑

快捷生成

除了项目工作流,还支持快捷生成模式:直接输入 Prompt 文本,跳过论文上传步骤,快速生成配图。

架构概览

浏览器 (React SPA)
    │
    ▼
FastAPI 后端 (localhost:8000)
    │
    ├── SQLite (项目、文档、Prompt、图片元数据)
    ├── 本地文件系统 (上传文件、生成图片)
    │
    ├── Claude Agent SDK → Prompt 生成 (同步)
    └── NanoBanana API → 图片生成 (异步后台任务)

环境变量参考

变量必填默认值说明
ANTHROPIC_API_KEYClaude Agent SDK API Key
NANOBANANA_API_KEYNanoBanana / Gemini API Key
NANOBANANA_API_BASEhttps://api.keepgo.icuNanoBanana API 地址
NANOBANANA_MODELgemini-3-pro-image-preview图片生成模型
DATABASE_PATH./data/app.dbSQLite 数据库路径
DATA_DIR./data数据存储目录
DEBUGtrue调试模式 (启用 API 文档)
CORS_ORIGINS["http://localhost:3000","http://localhost:5173"]CORS 允许来源
MAX_UPLOAD_SIZE_MB50最大上传文件大小 (MB)

AI 学术配图 Prompt 技能(AI Coding Agent Skill)

本项目附带了一个独立的 AI Coding Agent Skill——academic-figure-prompt,兼容多种 AI 编程助手(Claude Code / Gemini CLI / Cursor 等),无需部署完整平台即可获得顶会级学术论文配图提示词生成能力。

功能简介

academic-figure-prompt 是一个专为学术论文设计的 AI 提示词生成器,能够:

  • 📄 阅读并分析论文内容(PDF / LaTeX / Word)
  • 🎨 提供 8 种预设学术配色方案(Okabe-Ito、Blue 单色系、Teal+Amber 等),含色盲友好选项
  • 🖼️ 生成极其详细的英文提示词,用于 AI 图片工具生成顶会级别的专业配图
  • 📐 覆盖多种图表类型:框架图、网络架构图、模块详解图、对比/消融图、数据模板图

安装方式

方式 1:使用 npx skills 一键安装(推荐)

npx skills add LigphiDonk/academic-figure-generator

方式 2:手动安装

git clone https://github.com/LigphiDonk/academic-figure-generator.git

# Gemini CLI
cp -r academic-figure-generator/academic-figure-prompt .gemini/skills/
# Claude Code
cp -r academic-figure-generator/academic-figure-prompt .claude/skills/

使用方法

安装后,在 AI 编程助手对话中直接触发即可:

You: 帮我看一下这篇论文,生成论文配图提示词
AI:  [分析论文内容 → 展示配色方案选择 → 生成详细英文提示词]

You: 用 Teal+Amber 配色,帮我画一个网络架构图的提示词
AI:  [直接使用方案C生成网络架构图提示词]

开发指南

后端开发

cd backend
source .venv/bin/activate

# 运行测试
pytest -v

# 代码检查
ruff check app/
ruff format app/

前端开发

cd frontend
npm run dev     # 启动开发服务器 (localhost:5173)
npm run build   # 生产构建
npm run lint    # ESLint 检查

前端开发服务器会自动将 /api 请求代理到 localhost:8000

致谢

感谢 Linux DO 社区的支持与帮助 🙏

许可证

本项目基于 MIT License 开源。

forumUser Reviews (0)

Write a Review

Effect
Usability
Docs
Compatibility

No reviews yet

Statistics

Installs586
Rating3.5 / 5.0
Version
Updated2026年4月7日
Comparisons1

User Rating

3.5(0)
5
0%
4
0%
3
0%
2
0%
1
0%

Rate this Skill

0.0

Compatible Platforms

🔧Manual

Timeline

Created2026年4月7日
Last Updated2026年4月7日