china-summarizer

中文内容智能总结工具。Summarize local files (TXT/MD/PDF/Word), web pages, news articles, or WeChat articles. No login, no API key required. 内容总结、文章提炼。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "china-summarizer" with this command: npx skills add tobewin/china-summarizer

中文内容智能总结 China Summarizer

支持本地文件和网页内容的智能总结。 使用 OpenClaw 当前加载的模型进行总结,无需任何额外配置。

触发时机

  • "帮我总结这篇文章:[URL]"
  • "这篇公众号讲了什么:[URL]"
  • "总结一下这个文件:/path/to/file.pdf"
  • "提炼这份文档的核心内容:/path/to/file.docx"
  • 用户粘贴一段文字,要求提炼要点

Step 1:识别内容源

包含 http:// 或 https:// → 网页/公众号 → [网页流程]
路径包含 .pdf            → 本地 PDF   → [PDF流程]
路径包含 .docx           → 本地 Word  → [Word流程]
路径包含 .txt / .md      → 本地文本   → [文本流程]
用户直接粘贴文字          → 直接进入   → [总结流程]

[网页/公众号流程]

网页抓取

使用浏览器工具抓取网页内容。

提取正文

从 HTML 提取纯文本,处理规则:

去除:<script> <style> <nav> <header> <footer> <aside> 及其内部内容
去除:HTML 注释、HTML 标签(保留标签内文字)
去除:连续空行(多个空行合并为一个)
保留:<p> <h1>~<h6> <li> <article> <main> <section> 中的文本

微信公众号特殊处理:
  正文集中在 <div id="js_content"> 内
  优先提取该区域内容

质量检查

提取文本 < 200 字:
  → 页面为 JS 动态渲染,无法获取正文
  → 告知用户:该页面需要 JavaScript,无法直接抓取
  → 建议:将文章内容复制粘贴后再请求总结

提取文本 ≥ 200 字:
  → 进入 [总结流程]

支持情况说明

✅ 通常可以直接抓取:
  微信公众号(mp.weixin.qq.com)
  知乎专栏(zhuanlan.zhihu.com)
  博客园(cnblogs.com)
  CSDN 博客(blog.csdn.net)
  简书(jianshu.com)
  少数派(sspai.com)
  36氪、虎嗅、澎湃等新闻网站
  政府/机构官网静态页面

⚠️ 可能失败(JS渲染):
  今日头条、微博、部分知乎回答
  → 遇到时引导用户手动复制文本

[本地 PDF 流程]

按顺序尝试,成功即停止:

  1. pdftotext(最推荐)- 需要安装 poppler
  2. Python pypdf - 需要安装 pypdf
  3. Python pdfminer - 需要安装 pdfminer

全部失败时提示:

请安装 PDF 解析工具:
  macOS:   brew install poppler
  Ubuntu:  sudo apt install poppler-utils

提取结果为空或乱码时:

该 PDF 可能是扫描版(图片型),文本提取工具无法处理。
建议:使用 OCR 工具处理,或手动复制文字后粘贴总结。

[本地 Word 流程]

使用 Python python-docx 库读取 Word 文档。

失败时提示:

需要安装 python-docx 库(用户需手动安装)

[本地文本流程]

直接读取文件内容。


[总结流程]

获取到纯文本后,根据内容类型选择对应模板进行总结。

内容类型判断:

包含大量代码/命令/配置   → 技术文章模板
包含时间/地点/人名/事件  → 新闻简报模板
包含研究方法/数据/结论   → 学术报告模板
其他                     → 通用总结模板

输出格式(通用):

📝 内容总结
━━━━━━━━━━━━━━━━━━━━
来源:[文件名 / URL]
提取字数:约 X 字

【核心观点】
(1-3句话,概括最重要的结论)

【主要内容】
• 要点1
• 要点2
• 要点3
(3-7条,视内容长度而定)

【关键信息】
(具体数字、时间、人名、结论等值得记录的细节)

【一句话总结】
(用一句话概括全文精髓)

内容过长(> 8000字)时:

1. 将内容分为若干段(每段约2000字)
2. 对每段先生成段落摘要
3. 再对所有段落摘要做最终汇总

总结质量要求

✅ 保留原文所有具体数字、时间、人名
✅ 忠实原文,不添加原文没有的内容
✅ 用中文输出(无论原文是何语言)
✅ 长文总结控制在 500 字以内
✅ 逻辑清晰,层次分明

❌ 不用"本文介绍了..."等废话开头
❌ 不泛泛而谈,要有实质信息
❌ 不遗漏核心数据和结论

Notes

  • 使用 OpenClaw 当前模型进行总结
  • 无需额外 API Key
  • 支持中英文内容
  • 网页抓取可能因 JS 渲染失败,引导用户手动复制

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

公众号写手

专业公众号内容创作专家,支持多平台文章写作(公众号/小红书/知乎等)。 基于传播学原理和新媒体运营实践,创作具有传播力、高质量的内容。 集成去AI痕迹技术,确保内容自然流畅、富有感染力。

Registry SourceRecently Updated
2140Profile unavailable
Coding

DailyBit — AI Tech Daily Digest

Curated daily digest from 92 top tech blogs (Andrej Karpathy's list) with AI-generated Chinese summaries, hierarchical tags, and personalized recommendations...

Registry Source
3770Profile unavailable
General

Bing CN Search

使用必应中文搜索(Bing CN)获取互联网信息。当用户询问新闻、时事、需要搜索互联网内容、或提到"搜索一下"、"查一下"、"网上说"等场景时触发。

Registry SourceRecently Updated
3590Profile unavailable
General

finance-daily-report

Generate a modular, configurable global finance daily report (全球财经日报). Default 9 modules. External LLM collectors. Output to chat (auto-chunked). Use when: u...

Registry SourceRecently Updated
2540Profile unavailable