bidding-document-parser

招标文件解析助手。自动解析招标文档(PDF/DOCX/TXT),提取资格审查项、废标项、评分标准、技术要求、装订要求、格式要求等6类关键信息,默认输出为结构化Word(DOCX)报告,带PDF原始页码标注。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "bidding-document-parser" with this command: npx skills add junqio/bidding-document-parser

招标文件解析 SKILL

概述

本SKILL用于解析招标文件,自动识别并提取6类关键信息,生成结构化的Word(DOCX)分析报告(带PDF原始页码标注)。

触发条件

当用户输入以下任一内容时,应加载本SKILL:

  • 关键词:"解析招标文件"、"分析招标文档"、"提取招标要点"、"招标文件解析"
  • 上传招标相关文件(PDF、DOCX、TXT)
  • 提供招标文件文本内容

工作流程

步骤1:获取招标文件内容

根据输入类型选择解析方式:

输入为PDF文件 ⚠️ 必须使用带页码的PDF转换工具

  • 使用Python脚本 scripts/extract_pdf_with_pages.py(基于pdfplumber库,保留页码信息)
  • 执行命令:
    cd "[workspace]"
    py scripts/extract_pdf_with_pages.py "PDF文件路径"
    # 或指定输出路径
    py scripts/extract_pdf_with_pages.py "PDF文件路径" "输出TXT路径"
    
  • 输出文件:<PDF文件名>_带页码.txt(默认与PDF同目录)
  • ⚠️ 禁止使用 @pdf skill(无法保留页码信息)

输入为DOCX文件

  • 使用 @docx skill 读取内容
  • 或使用 Markdown Converter skill 转换

输入为文本内容

  • 直接使用提供的文本

输入为文件路径

  • 根据扩展名选择上述对应方式

步骤2:提取6类关键信息

使用方法:读取 references/extraction_prompt.md 文件,获取完整的提取提示词模板。

执行步骤

  1. 读取 references/extraction_prompt.md 文件内容
  2. 将招标文件内容插入到模板的 [在此插入招标文件文本内容] 位置
  3. 使用填充后的提示词模板进行信息提取
  4. 按照模板中的表格格式输出6类关键信息

提取的6类信息

  1. 资格审查项
  2. 废标项/取消资格项
  3. 评分标准得分项/加分项
  4. 技术要求
  5. 装订要求
  6. 格式要求

⚠️ 重要

  • 凡涉及"废标"、"取消资格"、"投标作废"、"投标文件作废"、"无效标"等描述的条款,均应列入废标项
  • 必须添加PDF原始页码标注(格式:P5P9-10

步骤3:生成Markdown报告(中间格式)

将提取的6类信息整合为一个完整的Markdown文档,包含:

  • 报告标题:# 招标文件解析报告
  • 项目基本信息(项目名称、编号、解析日期、招标人、集采机构)
  • 6个章节,每章为一个表格
  • ⚠️ 必须添加PDF原始页码标注(如:P5P9-10
  • 总结和建议(可选)

保存为Markdown文件:

  • 文件名:招标文件解析报告_[项目名称]_[YYYYMMDD].md
  • 保存路径:[workspace]/(工作空间根目录)
  • 如无法获取项目名称,使用 招标文件解析报告_未知项目_[YYYYMMDD].md

步骤4:生成DOCX报告(⚠️ 必须执行)

执行方式:使用Python脚本 scripts/md_to_docx.py 将Markdown报告转换为DOCX格式。

⚠️ 重要:此步骤为必须执行步骤,DOCX格式为默认输出格式。

执行命令

cd "[workspace]"
py scripts/md_to_docx.py "招标文件解析报告_XXX_YYYYMMDD.md" "招标文件解析报告_XXX_YYYYMMDD.docx"

输入输出

  • 输入:[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].md
  • 输出:[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].docx

格式规范

  • 详细格式规范参见 references/report_format.md
  • 全文微软雅黑字体
  • 表格:深蓝色表头(#2E5496)、黑色边框、无首行缩进
  • 自动清理LaTeX公式
  • 页码标注格式:P4P9-15

注意

  • [workspace] 为当前会话的工作空间路径(如 e:/000 Skills/招标文件解析
  • 如Markdown报告中无页码标注,DOCX表格中"页码"列留空

工具和依赖

PDF文件解析 ⚠️ 必须使用带页码的工具

工具路径说明
extract_pdf_with_pages.pyscripts/extract_pdf_with_pages.py基于pdfplumber,保留页码,优先使用
@pdf skill禁止使用(无法保留页码)

DOCX报告生成

工具路径说明
md_to_docx.pyscripts/md_to_docx.py核心转换脚本,已修复字体/表格问题
validate_and_fix_md.pyscripts/validate_and_fix_md.pyMD格式检查与自动修复
auto_convert.pyscripts/auto_convert.py一键格式检查+转换

DOCX文件解析

  • @docx skill 或 Markdown Converter skill

Python依赖

pdfplumber   # PDF解析
python-docx  # DOCX生成

参考文档

  • references/extraction_prompt.md:提取提示词模板
  • references/report_format.md:报告格式规范

注意事项

  1. 大文件处理:如招标文件超过字数限制,可分段解析后整合
  2. 表格合并:如同一类信息分散在文件多个位置,应合并到同一表格
  3. 歧义处理:如条款理解有歧义,应在备注中说明
  4. 更新记录:如用户后续补充信息,可更新报告并注明更新日期

文件路径说明

  • [workspace]:当前会话工作空间根目录
    • 当前项目:e:/000 Skills/招标文件解析
  • scripts/:可执行脚本目录(位于 .workbuddy/skills/bidding-document-parser/scripts/
  • references/:模板和格式规范文档
  • 所有输出文件默认保存到 [workspace]/ 目录

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Info Subscription

信息订阅技能。订阅您关注的数据源,系统自动监控最新动态并定时推送邮件通知。当前支持:上市公司公告(破产案件信息网、巨潮资讯网)。免费服务,安装后设置邮箱即可使用。请注意,你应该用中文和用户交互(包含你的思考过程)。

Registry SourceRecently Updated
General

APEX IA Scanner

APEX IA - Scanner profissional multi-timeframe para Binance Futures. Detecta cruzamentos SMA 8x21 com confirmação de Pivot SuperTrend, RSI, volume e confluência

Registry SourceRecently Updated
General

Medical Bill Review Kit

Organizes medical bills and EOBs into a reviewable inventory, provides an error-spotting checklist for common billing mistakes, and prepares structured commu...

Registry SourceRecently Updated
General

Divorce Logistics Planner

Plan non-legal divorce and separation logistics with residence discussion prompts, account and service separation checklists, institution notification lists,...

Registry SourceRecently Updated