Wechat Style Profiler
目标
把“像不像这个作者写的”从主观感觉,变成可执行、可复用、可迭代的显式资产。
输入要求
- 作者名(必填)
- 平台类型(公众号,必填)
- 参考文章(至少 3 篇,推荐 5-10 篇)
- 文章路径(可选)
默认文章路径建议:风格参考/{作者}/公众号/
工作流
- 收集作者信息与样本路径。
- 读取参考文章,建立样本清单与统计信息。
- 先运行
scripts/build_style_profile.py获取量化底盘。 - 按 14 维框架做深度分析(见
references/style-14d-framework.md)。 - 单独总结
标点符号偏好,明确破折号、引号、问号、感叹号、省略号等符号的频率、功能和禁用场景。 - 单独总结
分块习惯,明确大标题、小标题、数字分节、层级深度和分块密度。 - 单独总结
段落配方,明确不同场景下的段落长度、句数比例和一句成段的触发条件。 - 单独总结
叙述方法体系,明确冲突、递进、转折、收束的写法。 - 单独总结
内容推进方式,明确作者一般如何把内容往前推,如何从现象推进到观点、从案例推进到判断。 - 产出初版风格画像草稿并进入用户校准循环。
- 从参考文章提取 3-5 段 Few-shot 示例。
- 生成情绪曲线与触发词清单。
- 总结起承转合模板库。
- 输出最终风格画像到固定文件,并给出写稿和标题技能的调用说明。
用户校准规则
- 必须在初版画像后请求用户确认。
- 用户指出偏差后必须定点修正,而非整体重写。
- 至少完成 1 轮校准;用户明确“可用”后再固化最终版。
14 维分析框架
使用下列四层共 14 维(详见 references/style-14d-framework.md):
- 表层特征(4 维)
- 结构特征(3 维)
- 深层特征(4 维)
- 独特标记(3 维)
输出契约
按以下顺序输出:
样本概况14维风格分析标点符号偏好分块习惯段落配方叙述方法体系内容推进方式Few-shot 示例段落情绪曲线分析起承转合模板可复用 Prompt Block风格画像文件路径
默认固定文件
- 如果用户希望形成长期资产,默认同时维护一份固定 DNA 文件。
- 当前默认文件可放在:
references/style-dna-default-template.md
支持格式
.md.txt.docx(先提取文本再分析)
固化文件
最终画像默认保存到:
风格参考/{作者}/风格画像.md
如果用户未指定作者目录,降级保存到:
/tmp/{author_slug}-style-profile.md
质量红线
- 不允许只做“词汇模仿”,必须覆盖结构、节奏、论证。
- 不允许跳过标点符号偏好分析。
- 不允许跳过分块习惯分析。
- 不允许跳过段落配方和叙述方法体系。
- 不允许跳过内容推进方式分析。
- 不允许跳过用户校准直接定稿。
- 不允许输出空泛结论,必须给示例、比例或频率。
- 不允许生成与样本证据不一致的风格判断。
脚本
量化分析脚本:
python3 scripts/build_style_profile.py --input-dir /path/to/samples --output /path/to/style_profile.json
交付模板
最终文档结构使用:
references/style-profile-template.md