wechat-article-parser

解析微信公众号文章,提取标题、作者、正文内容、图片等信息。当用户发送微信公众号链接(mp.weixin.qq.com)并希望获取文章内容、摘要或保存时触发。支持自动提取内容并可选保存到飞书表格。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "wechat-article-parser" with this command: npx skills add harven-droid/wechat-article-parser

微信公众号文章解析器

解析微信公众号文章,自动提取标题、作者、发布时间、正文内容等信息。

功能特性

  • ✅ 自动提取文章标题、作者、发布时间
  • ✅ 完整正文内容提取
  • ✅ 图片链接提取
  • ✅ 字数统计
  • ✅ 支持保存为 JSON/TXT
  • ✅ 可选保存到飞书表格

使用方法

基本用法:解析文章

python3 scripts/wechat_parser.py "https://mp.weixin.qq.com/s/xxxxx"

输出示例:

================================================================================
📰 标题: 文章标题
✍️  作者: 公众号名称
🕐 发布时间: 2026-03-10
📊 字数: 3500
🖼️  图片数: 5
================================================================================

📝 正文内容:

这是文章的正文内容...
================================================================================

保存到文件

# 保存为 JSON(包含全部信息)
python3 scripts/wechat_parser.py "URL" --save

# 指定输出文件名
python3 scripts/wechat_parser.py "URL" --save --output article.json

保存到飞书表格

python3 scripts/save_to_feishu.py "https://mp.weixin.qq.com/s/xxxxx"

# 手动指定标题
python3 scripts/save_to_feishu.py "https://mp.weixin.qq.com/s/xxxxx" "自定义标题"

在 OpenClaw 对话中使用

直接发送微信公众号链接,AI 会自动调用此 skill 解析内容:

https://mp.weixin.qq.com/s/xxxxx

或带指令:

解析这篇文章 https://mp.weixin.qq.com/s/xxxxx
收藏 https://mp.weixin.qq.com/s/xxxxx

输出格式

JSON 格式

{
  "title": "文章标题",
  "author": "公众号名称",
  "publish_time": "2026-03-10",
  "content": "正文内容...",
  "word_count": 3500,
  "images_count": 5,
  "images": ["url1", "url2", ...],
  "url": "原始链接",
  "parsed_at": "2026-03-10 12:00:00"
}

飞书保存配置

如需使用飞书保存功能,需配置 .env 文件:

FEISHU_APP_ID=your_app_id
FEISHU_APP_SECRET=your_app_secret
FEISHU_APP_TOKEN=your_bitable_app_token
FEISHU_TABLE_ID=your_table_id

支持的链接格式

  • https://mp.weixin.qq.com/s/xxxxx
  • https://mp.weixin.qq.com/s?__biz=xxx&mid=xxx&idx=xxx
  • 微信短链接

常见问题

Q: 提取内容不完整? A: 微信有反爬机制,部分文章可能提取不完整。建议:

  1. 使用浏览器 Cookie(高级用法)
  2. 手动复制重要段落

Q: 图片无法显示? A: 微信图片有防盗链机制,需要带 Referer 头访问。

文件结构

wechat-article-parser/
├── SKILL.md              # 本文档
├── scripts/
│   ├── wechat_parser.py       # 核心解析脚本
│   └── save_to_feishu.py      # 飞书保存脚本
├── .env.example          # 配置模板
└── requirements.txt      # 依赖

依赖

requests
beautifulsoup4
python-dotenv

安装:

pip3 install requests beautifulsoup4 python-dotenv

许可证

MIT License

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

微信公众号媒体下载器 WeChat Media Downloader

下载微信公众号文章(mp.weixin.qq.com)中的视频、音频和音乐卡片。适用于:用户想把公众号文章里的 1 个或多个视频、多个音频/音乐保存到本地;直接抓取被微信“环境异常/去验证”拦截;需要通过可见 Chrome + 人工验证 + 远程调试抓取真实媒体地址,再自动下载、提取标题、重命名并整理输出。优先用...

Registry SourceRecently Updated
1850Profile unavailable
General

公众号写手

专业公众号内容创作专家,支持多平台文章写作(公众号/小红书/知乎等)。 基于传播学原理和新媒体运营实践,创作具有传播力、高质量的内容。 集成去AI痕迹技术,确保内容自然流畅、富有感染力。

Registry SourceRecently Updated
2260Profile unavailable
Automation

Wechat Mp Auto

自动完成微信公众号文章的选题调研、Markdown写作、智能配图、内容审核和发布全流程管理。

Registry SourceRecently Updated
3111Profile unavailable
General

WeChat Article to Markdown

This skill converts WeChat Official Account (微信公众号) article pages into high-quality, clean Markdown format. It should be used when the user provides a WeChat...

Registry SourceRecently Updated
1390Profile unavailable