微信公众号媒体下载器 WeChat Media Downloader

下载微信公众号文章(mp.weixin.qq.com)中的视频、音频和音乐卡片。适用于:用户想把公众号文章里的 1 个或多个视频、多个音频/音乐保存到本地;直接抓取被微信“环境异常/去验证”拦截;需要通过可见 Chrome + 人工验证 + 远程调试抓取真实媒体地址,再自动下载、提取标题、重命名并整理输出。优先用于中文微信公众号内容场景。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "微信公众号媒体下载器 WeChat Media Downloader" with this command: npx skills add ewanwu/wechat-media-downloader-weixin

仅在用户有权访问和保存目标媒体时使用。

核心思路

不要和微信反爬硬碰硬。最稳的成功路径是:

  1. 先试普通抓取。
  2. 一旦页面返回“环境异常 / 去验证”,立即切换为:
    • 可见 Chrome
    • 用户手动完成验证
    • 通过 DevTools 远程调试连接已打开页面
    • 抓取真实视频/音频地址
    • 下载并按文章顺序重命名

执行流程

1) 先判定是否被拦截

  • 直接请求文章链接。
  • 若返回微信验证页,不继续 headless 硬爬,直接进入人工验证路线。

2) 安装最小工具

优先用户级安装,不要求 sudo。

需要:

  • playwright
  • yt-dlp(可选;有时直接 HTTP 下载更稳)

推荐命令:

python3 -m pip install --user playwright yt-dlp

3) 让用户启动可见 Chrome

让用户执行:

google-chrome --remote-debugging-port=9222 --user-data-dir=/tmp/openclaw-wechat-debug

然后让用户:

  • 打开目标公众号文章
  • 完成微信验证/登录
  • 确认页面中的视频和音频能正常显示

4) 连接真实浏览器会话抓 URL

使用:

  • scripts/capture_wechat_media.py

做法:

  • 先读取 http://127.0.0.1:9222/json/version
  • 取其中 webSocketDebuggerUrl
  • 用 CDP 连入 Chrome
  • 监听 request / response
  • 同时保存页面 HTML

若只抓到视频没抓到音频:

  • 让用户把每个音频都点一次播放
  • 重新抓取

5) 下载媒体

  • 视频:优先使用抓到的 mpvideo.qpic.cn 直链
  • 音频:使用 https://res.wx.qq.com/voice/getvoice?mediaid=<voice_encode_fileid>

注意:

  • 某些 MP4 直链用 yt-dlp 可能卡收尾;这时直接用 Python HTTP 流式下载反而更稳。

6) 提取标题并重命名

从文章 HTML 中提取:

  • 文章标题
  • <mp-common-mpaudio ... name="..." voice_encode_fileid="...">

按文章顺序输出成:

  • 00. <视频标题>.mp4
  • 01. <音频标题>.mp3
  • 02. <音频标题>.mp3
  • ...

7) 交付与清理

  • 把最终文件放入一个干净的新目录
  • 可以清理:临时 HTML、JSON、.part、乱码副本、抓取脚本输出
  • 不要默认删除最终交付目录

经验规则

  • 微信公众号抓取的关键不是“更强的爬虫”,而是“接管已通过验证的真实浏览器会话”。
  • 纯 headless 路线经常失败。
  • 音频 URL 经常只有播放后才出现。
  • 如果 connect_over_cdp('http://127.0.0.1:9222') 返回 400,不要死磕;先取 /json/version 里的 websocket 地址再连接。

自带资源

  • scripts/capture_wechat_media.py:连接 Chrome 调试端口,抓取视频/音频请求与页面 HTML
  • scripts/download_wechat_media.py:下载视频和音频,并根据文章内容重命名
  • references/reusable-workflow.md:可复用操作清单与故障处理

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

WeChat Article Parser - 微信公众号文章解析

解析微信公众号文章,提取标题、作者、正文内容、图片等信息。当用户发送微信公众号链接(mp.weixin.qq.com)并希望获取文章内容、摘要或保存时触发。支持自动提取内容并可选保存到飞书表格。

Registry SourceRecently Updated
1.3K1Profile unavailable
General

TencentCloud ASR

腾讯云语音识别 ASR Skill,适用于语音转文字、音频转写、字幕生成、会议转录、语音消息识别、 本地文件或 URL 音频识别。包含三种模式:一句话识别(<=60s 短音频)、录音识别极速版 (<=2h/100MB 中长音频快速同步返回)、录音识别(<=5h 长音频异步识别)。支持普通话、 英语、粤语、日语、韩...

Registry SourceRecently Updated
1.4K5Profile unavailable
General

Wechat Sendmedia

send images and files to a wechat conversation through openclaw's wechat channel. use when the user asks to send a local image, send a screenshot, send a dow...

Registry SourceRecently Updated
1000Profile unavailable
General

微信公众号合规检查

扫描微信公众号文章中的违规敏感词并自动改写。覆盖翻墙工具、政治敏感、灰产、 破解逆向、引流卖货等 8 大类 100+ 敏感词。输出违规报告和改写后的安全版本。 Use when publishing WeChat articles, checking "违规", "敏感词", "审核", "公众号合规", or...

Registry SourceRecently Updated
980Profile unavailable