招标文件解析 SKILL
概述
本SKILL用于解析招标文件,自动识别并提取6类关键信息,生成结构化的Word(DOCX)分析报告(带PDF原始页码标注)。
触发条件
当用户输入以下任一内容时,应加载本SKILL:
- 关键词:"解析招标文件"、"分析招标文档"、"提取招标要点"、"招标文件解析"
- 上传招标相关文件(PDF、DOCX、TXT)
- 提供招标文件文本内容
工作流程
步骤1:获取招标文件内容
根据输入类型选择解析方式:
输入为PDF文件 ⚠️ 必须使用带页码的PDF转换工具
- 使用Python脚本
scripts/extract_pdf_with_pages.py(基于pdfplumber库,保留页码信息) - 执行命令:
cd "[workspace]" py scripts/extract_pdf_with_pages.py "PDF文件路径" # 或指定输出路径 py scripts/extract_pdf_with_pages.py "PDF文件路径" "输出TXT路径" - 输出文件:
<PDF文件名>_带页码.txt(默认与PDF同目录) - ⚠️ 禁止使用
@pdfskill(无法保留页码信息)
输入为DOCX文件
- 使用
@docxskill 读取内容 - 或使用
Markdown Converterskill 转换
输入为文本内容
- 直接使用提供的文本
输入为文件路径
- 根据扩展名选择上述对应方式
步骤2:提取6类关键信息
使用方法:读取 references/extraction_prompt.md 文件,获取完整的提取提示词模板。
执行步骤:
- 读取
references/extraction_prompt.md文件内容 - 将招标文件内容插入到模板的
[在此插入招标文件文本内容]位置 - 使用填充后的提示词模板进行信息提取
- 按照模板中的表格格式输出6类关键信息
提取的6类信息:
- 资格审查项
- 废标项/取消资格项
- 评分标准得分项/加分项
- 技术要求
- 装订要求
- 格式要求
⚠️ 重要:
- 凡涉及"废标"、"取消资格"、"投标作废"、"投标文件作废"、"无效标"等描述的条款,均应列入废标项
- 必须添加PDF原始页码标注(格式:
P5、P9-10)
步骤3:生成Markdown报告(中间格式)
将提取的6类信息整合为一个完整的Markdown文档,包含:
- 报告标题:
# 招标文件解析报告 - 项目基本信息(项目名称、编号、解析日期、招标人、集采机构)
- 6个章节,每章为一个表格
- ⚠️ 必须添加PDF原始页码标注(如:
P5、P9-10) - 总结和建议(可选)
保存为Markdown文件:
- 文件名:
招标文件解析报告_[项目名称]_[YYYYMMDD].md - 保存路径:
[workspace]/(工作空间根目录) - 如无法获取项目名称,使用
招标文件解析报告_未知项目_[YYYYMMDD].md
步骤4:生成DOCX报告(⚠️ 必须执行)
执行方式:使用Python脚本 scripts/md_to_docx.py 将Markdown报告转换为DOCX格式。
⚠️ 重要:此步骤为必须执行步骤,DOCX格式为默认输出格式。
执行命令:
cd "[workspace]"
py scripts/md_to_docx.py "招标文件解析报告_XXX_YYYYMMDD.md" "招标文件解析报告_XXX_YYYYMMDD.docx"
输入输出:
- 输入:
[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].md - 输出:
[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].docx
格式规范:
- 详细格式规范参见
references/report_format.md - 全文微软雅黑字体
- 表格:深蓝色表头(#2E5496)、黑色边框、无首行缩进
- 自动清理LaTeX公式
- 页码标注格式:
P4、P9-15
注意:
[workspace]为当前会话的工作空间路径(如e:/000 Skills/招标文件解析)- 如Markdown报告中无页码标注,DOCX表格中"页码"列留空
工具和依赖
PDF文件解析 ⚠️ 必须使用带页码的工具
| 工具 | 路径 | 说明 |
|---|---|---|
| ✅ extract_pdf_with_pages.py | scripts/extract_pdf_with_pages.py | 基于pdfplumber,保留页码,优先使用 |
❌ @pdf skill | — | 禁止使用(无法保留页码) |
DOCX报告生成
| 工具 | 路径 | 说明 |
|---|---|---|
| ✅ md_to_docx.py | scripts/md_to_docx.py | 核心转换脚本,已修复字体/表格问题 |
| ✅ validate_and_fix_md.py | scripts/validate_and_fix_md.py | MD格式检查与自动修复 |
| ✅ auto_convert.py | scripts/auto_convert.py | 一键格式检查+转换 |
DOCX文件解析
@docxskill 或Markdown Converterskill
Python依赖
pdfplumber # PDF解析
python-docx # DOCX生成
参考文档
references/extraction_prompt.md:提取提示词模板references/report_format.md:报告格式规范
注意事项
- 大文件处理:如招标文件超过字数限制,可分段解析后整合
- 表格合并:如同一类信息分散在文件多个位置,应合并到同一表格
- 歧义处理:如条款理解有歧义,应在备注中说明
- 更新记录:如用户后续补充信息,可更新报告并注明更新日期
文件路径说明
[workspace]:当前会话工作空间根目录- 当前项目:
e:/000 Skills/招标文件解析
- 当前项目:
scripts/:可执行脚本目录(位于.workbuddy/skills/bidding-document-parser/scripts/)references/:模板和格式规范文档- 所有输出文件默认保存到
[workspace]/目录