description SKILL.md

web-content-fetcher

Name: web-content-fetcher AI Agent Skill
Rating: 4.9 (17 reviews)
Author: shirenchuang

Web Content Fetcher — 网页正文提取能力说明给一个 URL，返回干净的 Markdown 格式正文，保留：标题层级（# ## ###）超链接（文字）图片（）列表、代码块、引用块提取策略（三级降级） URL ↓ 1. Jina Reader（首选） web_fetch("https://r.jina.ai/", maxChars=30000) 优点：快（~1.5s），格式干净限制：200次/天免费配额失败场景：微信公众号（403）、部分国内平台 ↓ 2. Scrapling + html2text（Jina 超限或失败时） exec: python3 scripts/fetch.py 30000 优点：无限制，效果和 Jina 相当，能读微信公众号适合：mp.weixin.qq.com、Substack、Medium 等反爬平台 ↓ 3. web_fetch 直接抓（静态页面兜底） web_fetch(url, maxChars=30000) 适合：GitHub README、普通静态博客、技术文档域名快捷路由直接跳过 Jina，节省配额： mp.weixin.qq.com → 直接用 Scrapling zhuanlan.zhihu.com、juejin.cn、csdn.net → 优先 Scrapling 使用方式自动模式（推荐）直接告诉我要读取的 URL，我会自动选择合适的方案：帮我读取这篇文章：https://example.com/article 手动指定方案用 Scrapling 读取：https://mp.weixin.qq.com/s/xxx 安装依赖 # 安装基础依赖（包含 fetchers） pip install "scrapling[fetchers]" html2text --break-system-packages # 安装浏览器依赖（首次使用需要执行） scrapling install 脚本路径 scripts/fetch.py — Scrapling + html2text 提取脚本调用方式： python3 ~/.openclaw/workspace/skills/web-content-fetcher/scripts/fetch.py [max_chars] 防死循环规则同一个 URL 累计失败 2 次就放弃，记录为"无法提取"，不重复重试。Weekly Installs345Repositoryshirenchuang/we…-fetcherGitHub Stars212First Seen9 days agoSecurity AuditsGen Agent Trust HubPassSocketPassSnykWarnInstalled ongemini-cli341github-copilot341codex341cline341kimi-cli341cursor341

forumユーザーレビュー (0)

レビューを書く

効果

使いやすさ

ドキュメント

互換性

レビューなし

web-content-fetcher

Before / After 効果比較

description SKILL.md

web-content-fetcher

forumユーザーレビュー (0)

統計データ

ユーザー評価

対応プラットフォーム

タイムライン