firecrawl-parse
「firecrawl parse」は、ローカルドキュメント(PDF、DOCX、HTMLなど)をクリーンなMarkdown形式に変換します。AIによる要約や質疑応答機能をサポートし、ユーザーがドキュメントから重要な情報を迅速に抽出したり、コンテンツを作成したりするのに役立ちます。ドキュメントの自動処理やデータ分析のワークフローに最適です。
git clone https://github.com/firecrawl/cli.gitBefore / After 効果比較
1 组大量のPDFやDOCXなどのローカルドキュメントから手動で重要な情報を抽出したり、AI分析に利用できるテキスト形式に変換したりする作業は、時間と労力がかかり、エラーが発生しやすく、フォーマットも乱れがちで、データ利用効率を著しく妨げます。
さまざまなローカルドキュメントを自動でクリーンなMarkdownに変換し、AIによる要約や質疑応答を活用することで、ドキュメント処理時間を大幅に短縮し、データ品質と利用効率を向上させ、AIアプリケーション開発を加速します。
firecrawl parse
Turn a local document into clean markdown on disk. Supports PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, HTML/HTM/XHTML.
When to use
- You have a file on disk (not a URL) and want its text as markdown
- User drops a PDF/DOCX and asks what it says, or to summarize it
- Use
scrapeinstead when the source is a URL
Quick start
Always save to .firecrawl/ with -o — parsed docs can be hundreds of KB and blow up context if streamed to stdout. Add .firecrawl/ to .gitignore.
mkdir -p .firecrawl
# File → markdown
firecrawl parse ./paper.pdf -o .firecrawl/paper.md
# AI summary
firecrawl parse ./paper.pdf -S -o .firecrawl/paper-summary.md
# Ask a question about the doc
firecrawl parse ./paper.pdf -Q "What are the main conclusions?" \
-o .firecrawl/paper-qa.md
Then head, grep, rg etc., or incrementally read the file - don't load the whole thing at once.
Options
| Option | Description |
|---|---|
-S, --summary | AI-generated summary |
-Q, --query <prompt> | Ask a question about the parsed content |
-o, --output <path> | Output file path — always use this |
-f, --format <fmt> | markdown (default), html, summary |
--timeout <ms> | Timeout for the parse job |
--timing | Show request duration |
Tips
- Quote paths with spaces:
firecrawl parse "./My Doc.pdf" -o .firecrawl/mydoc.md. - Max upload size: 50 MB per file.
- Credits: ~1 per PDF page; HTML is 1 flat.
- Check
.firecrawl/before re-parsing the same file. - To check your credit balance (recommended for batch processing and similar workflows), use the
firecrawl credit-usagecommand.
See also
- firecrawl-scrape — same idea for URLs
ユーザーレビュー (0)
レビューを書く
レビューなし
統計データ
ユーザー評価
この Skill を評価