Home/自媒体运营/videocut-skills
V

videocut-skills

by @Ceeonv
3.5(0)

This GitHub repository provides an AI video editing agent, built on Claude Code Skills, specifically designed for spoken videos. It leverages Claude's semantic understanding capabilities to address the pain point that traditional editing tools cannot identify repetitive sentences and verbal errors, and it uses custom dictionaries to enhance subtitle accuracy. Users simply need to provide the original video, and the agent automatically identifies and cuts out silent sections, verbal errors, and redundant content, significantly boosting the editing efficiency and quality of spoken videos.

video-editingai-agentclaude-codecontent-creationspeech-processingGitHub
Installation
git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut
compare_arrows

Before / After Comparison

1
Before

Manually editing a 19-minute raw spoken video requires extensive manual handling of numerous verbal errors, stutters, and repetitive content. Traditional tools lack semantic understanding, resulting in poor subtitle quality, making the process time-consuming and laborious.

After

AI automatically identifies and processes 608 issues (114 silences + 494 verbal errors/repetitions). The edited video is 72MB. With full AI assistance, human intervention is limited to confirmation, significantly boosting efficiency and accuracy.

description SKILL.md

Videocut Skills

用 Claude Code Skills 构建的视频剪辑 Agent,专为口播视频设计

为什么做这个?

剪映的"智能剪口播"有两个痛点:

  1. 无法理解语义:重复说的句子、说错后纠正的内容,它识别不出来
  2. 字幕质量差:专业术语(Claude Code、MCP、API)经常识别错误

这个 Agent 用 Claude 的语义理解能力解决第一个问题,用自定义词典解决第二个问题。

效果演示

输入:19 分钟口播原片(各种口误、卡顿、重复)

输出

  • 自动识别 608 处问题(静音 114 + 口误/重复 494)
  • 剪辑后视频 72MB
  • 全程 AI 辅助,人工只需确认

核心功能

功能说明对比剪映
语义理解AI 逐句分析,识别重说/纠正/卡顿只能模式匹配
静音检测>0.3s 自动标记,可调阈值固定阈值
重复句检测相邻句开头≥5字相同 → 删前保后无此功能
句内重复"好我们接下来好我们接下来做" → 删重复部分无此功能
词典纠错自定义专业术语词典无此功能
自更新记住你的偏好,越用越准无此功能

快速开始

1. 安装 Skills

# 克隆到 Claude Code skills 目录
git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut

2. 配置 API Key

cd ~/.claude/skills/videocut
cp .env.example .env
# 编辑 .env,填入火山引擎 API Key

3. 安装环境

打开 Claude Code,输入:

/videocut:安装

AI 会自动:

  • 检查 Python、FFmpeg、Node.js
  • 安装 FunASR(口误识别模型,约 2GB)
  • 安装 Whisper large-v3(字幕模型,约 3GB)

使用流程

┌─────────────────────────────────────────────────────────┐
│  /videocut:安装  →  首次使用,安装环境和模型            │
└─────────────────────────────────────────────────────────┘
                            ↓
┌─────────────────────────────────────────────────────────┐
│  /videocut:剪口播 视频.mp4                              │
│                                                         │
│  1. 提取音频 → 上传云端                                 │
│  2. 火山引擎转录 → 字级别时间戳                         │
│  3. AI 审核:静音/口误/重复/语气词                      │
│  4. 生成审核网页 → 浏览器打开                           │
└─────────────────────────────────────────────────────────┘
                            ↓
┌─────────────────────────────────────────────────────────┐
│  【人工审核 + 执行剪辑】                                │
│                                                         │
│  - 单击跳转播放                                         │
│  - 双击选中/取消                                        │
│  - Shift 拖动多选                                       │
│  - 确认后点击「执行剪辑」→ 自动 FFmpeg 剪辑            │
└─────────────────────────────────────────────────────────┘
                            ↓
┌─────────────────────────────────────────────────────────┐
│  /videocut:字幕                                         │
│                                                         │
│  - Whisper 转录                                         │
│  - 词典纠错(Claude Code → claude code)                │
│  - 人工确认 → 烧录字幕                                  │
└─────────────────────────────────────────────────────────┘
                            ↓
┌─────────────────────────────────────────────────────────┐
│  /videocut:自更新  (可选)                             │
│                                                         │
│  告诉 AI 你的偏好,它会记住:                           │
│  - "静音阈值改成 1 秒"                                  │
│  - "保留适量嗯作为过渡"                                 │
└─────────────────────────────────────────────────────────┘

Skill 清单

Skill功能输入输出
安装环境准备安装日志
剪口播转录 + AI 审核 + 剪辑视频文件剪辑后视频
字幕生成字幕视频文件带字幕视频
自更新记录偏好用户反馈更新规则文件

目录结构

videocut/
├── README.md           # 本文件
├── .env.example        # API Key 模板
├── 安装/               # 环境安装 skill
├── 剪口播/             # 核心:转录 + AI 审核 + 剪辑
│   ├── SKILL.md        # 流程说明
│   ├── *.js            # 脚本(生成字幕、审核页面、服务器)
│   ├── *.sh            # 脚本(转录、剪辑)
│   └── 用户习惯/       # 审核规则(可自定义)
│       ├── 1-核心原则.md       # 删前保后
│       ├── 2-语气词检测.md     # 嗯啊呃
│       ├── 3-静音段处理.md     # >0.3s 删除
│       ├── 4-重复句检测.md     # 相邻句开头相同
│       ├── 5-卡顿词.md         # 那个那个、就是就是
│       ├── 6-句内重复检测.md   # A+中间+A 模式
│       ├── 7-连续语气词.md     # 嗯啊、啊呃
│       └── 8-重说纠正.md       # 部分重复、否定纠正
├── 字幕/               # 字幕生成与烧录
│   └── 词典.txt        # 自定义词典
└── 自更新/             # 自我进化机制

技术架构

┌──────────────────┐     ┌──────────────────┐
│   火山引擎 ASR   │────▶│  字级别时间戳    │
│  (云端转录)    │     │  subtitles.json  │
└──────────────────┘     └────────┬─────────┘
                                  │
                                  ▼
┌──────────────────┐     ┌──────────────────┐
│   Claude Code    │────▶│   AI 审核结果    │
│  (语义分析)    │     │  auto_selected   │
└──────────────────┘     └────────┬─────────┘
                                  │
                                  ▼
┌──────────────────┐     ┌──────────────────┐
│   审核网页       │────▶│   最终删除列表   │
│  (人工确认)    │     │  delete_segments │
└──────────────────┘     └────────┬─────────┘
                                  │
                                  ▼
┌──────────────────┐     ┌──────────────────┐
│     FFmpeg       │────▶│   剪辑后视频     │
│  filter_complex  │     │   xxx_cut.mp4    │
└──────────────────┘     └──────────────────┘

依赖

依赖用途安装方式
Node.js 18+运行脚本brew install node
FFmpeg音视频处理brew install ffmpeg
Python 3.8+模型运行系统自带
火山引擎 API语音转录申请 Key

常见问题

Q: 火山引擎转录超时?

上传音频到 uguu.se(脚本默认),不要用 catbox.moe(火山引擎访问慢)。

Q: 审核网页打不开?

检查端口 8899 是否被占用:lsof -i :8899

Q: 剪辑后音画不同步?

使用 filter_complex + trim 而非 concat demuxer,脚本已处理。

Q: 如何添加自定义词典?

编辑 字幕/词典.txt,每行一个词:

Claude Code
MCP
API

License

MIT

forumUser Reviews (0)

Write a Review

Effect
Usability
Docs
Compatibility

No reviews yet

Statistics

Installs1.3K
Rating3.5 / 5.0
Version
Updated2026年4月7日
Comparisons1

User Rating

3.5(0)
5
0%
4
0%
3
0%
2
0%
1
0%

Rate this Skill

0.0

Compatible Platforms

🔧Claude Code

Timeline

Created2026年4月7日
Last Updated2026年4月7日