ai-drama-review

AI短剧规范识别技能包。检测AI短剧中的文本/小说版权侵权、年龄分级合规性(18+/12+)、小说魔改程度,并生成结构化合规报告。支持本地关键词快速扫描 + AI深度分析两层架构。Beta 阶段 - 仅供参考,不作为法律依据。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "ai-drama-review" with this command: npx skills add AAAlenwow/ai-drama-review

This skill identifies compliance risks in AI-generated short dramas, including copyright infringement, age rating violations, and unauthorized novel adaptations. It uses a two-layer architecture: local keyword scanning for fast baseline detection, plus AI-powered deep analysis for context-aware accuracy.

Warning: BETA — 本技能包正在测试中,检测结果仅供参考,不作为法律依据。请结合专业法律意见使用。

用户提供剧本文本、字幕文件或视频描述,本技能将执行合规审查并生成结构化风险报告。


Phase 1: 环境检测与初始化

当用户请求对短剧内容进行合规审查时,先执行环境检测:

python3 scripts/env_detect.py

检测内容:

  1. Python 版本: >= 3.8
  2. 可用 API 密钥: OPENAI_API_KEY / ANTHROPIC_API_KEY(用于深度分析)
  3. 可选 Python 包: jieba(中文分词,提升版权检测精度)
  4. 网络连通性: API 端点可达性

确定运行模式:

  • 仅本地模式 (local_only): 无 API 密钥时的降级模式,仅执行关键词匹配和文本算法分析
  • 混合模式 (hybrid)(推荐): 本地快速扫描 + AI 深度上下文分析,精度更高

向用户展示环境状态和可用功能。


Phase 2: 版权侵权检测

接收用户提供的剧本/台词文本,执行版权侵权检测:

python3 scripts/text_similarity.py --input <script_file> --reference-dir <reference_texts_dir>

2.1 文本预处理

  1. 统一编码(Unicode 归一化)
  2. 去除标点符号和多余空白
  3. 按段落分割,过滤过短段落(< 20 字)
  4. 中文分词(优先使用 jieba,降级为字符级分词)

2.2 三重相似度检测

对每个段落与参考文本库逐段比对,计算三种互补指标:

算法检测能力权重
n-gram Jaccard 系数局部词汇重复0.3
归一化编辑距离整体文本差异0.3
TF-IDF 余弦相似度语义主题相似0.4

综合得分超过阈值(默认 0.7)的段落标记为疑似侵权。

2.3 AI 语义确认(混合模式)

将高疑似段落发送 AI 进行语义级分析:

  • 排除通用表达和公共领域内容
  • 评估独创性和实质性相似
  • 识别改写和同义替换

向用户展示:可疑段落列表、相似度分数、疑似来源、AI 分析意见。


Phase 3: 年龄分级合规检测

扫描剧本内容的年龄分级合规性:

python3 scripts/age_rating_scanner.py --input <script_file> --target-rating <all_ages|12+|18+>

3.1 Layer 1: 本地关键词快速扫描

加载分类关键词库(暴力/色情/恐怖/脏话/烟酒毒品),逐段扫描:

  • 记录命中的关键词、类别、严重度(mild/moderate/severe)
  • 保留命中位置和上下文(前后 30 字)
  • 根据命中密度和严重程度计算初步分级建议

3.2 Layer 2: AI 上下文深度分析(混合模式)

将关键词命中的上下文段落发送 AI 模型:

  • 判断是否为真正的不当内容(排除否定语境、文学修辞、历史引用等误报)
  • 评估上下文中的内容倾向
  • 给出分级建议及具体理由

3.3 辅助内容分析

  • 视频关键帧描述: 如果用户提供了视频帧描述,分析画面内容风险
  • 音频转录文本: 如果用户提供了音频转录,扫描脏话和不当音效描述

3.4 分级输出

分级说明
全年龄 (all_ages)内容适合所有年龄段
12+含轻度暴力/冲突,需家长指导
18+含较强暴力/恐怖/成人主题
不合规 (non_compliant)超出可接受范围,建议修改

Phase 4: 小说魔改检测

比对原著与改编版本,评估改编偏离程度:

python3 scripts/adaptation_detector.py --original <original_file> --adapted <adapted_file>

4.1 结构对齐

使用动态规划算法(Needleman-Wunsch 变体)将原著章节与改编版段落对齐,识别:

  • 保留的原始情节
  • 新增的情节段
  • 被删除的原著内容
  • 被修改的段落

4.2 角色偏离检测

提取角色列表和设定,比对变化:

  • 性格特征改动
  • 角色关系改动
  • 角色命运改动

4.3 关键情节比对

通过 AI 提取核心情节点,评估改编对原著核心的改动程度。

4.4 偏离度评分

综合输出偏离度评分(0-100):

评分范围分类说明
0 - 30忠实改编保留原著核心,合理调整
30 - 60合理改编有较大改动但未偏离核心
60 - 100严重魔改大幅偏离原著,可能引发争议

Phase 5: 合规报告生成

汇总所有检测结果,生成结构化报告:

python3 scripts/report_generator.py --results <detection_results.json> --format <json|markdown>

报告内容:

  • 总体风险等级: 低 / 中 / 高 / 严重
  • 版权侵权风险: 疑似来源、相似段落、相似度分数
  • 年龄分级合规: 分级建议、各类别命中详情
  • 小说魔改详情: 偏离度评分、核心改动列表
  • 违规位置标注: 段落编号、时间戳、场景编号
  • 整改建议清单: 针对每项风险的具体修改建议

Phase 6: 编排与完整审查

一键执行完整审查流程:

python3 scripts/review_orchestrator.py --input <script_file> [--reference-dir <dir>] [--original <file>] [--target-rating 12+] [--checks copyright rating adaptation]

流程:

  1. 环境检测,确定运行模式
  2. 加载输入文本(支持 .txt / .srt / .json 格式)
  3. 执行选定的检测模块
  4. AI 综合风险评估(混合模式)
  5. 生成合规报告
  6. 格式化风险提示文本,标注并告知用户违规风险

风险提示格式: 当检测到违规时,生成结构化的风险提示,供模型向用户展示具体的违规类型、位置和整改建议。


凭证安全

环境变量配置

AI 分析(至少配置一个以启用混合模式):

  • OPENAI_API_KEY — OpenAI API(用于深度内容分析)
  • ANTHROPIC_API_KEY — Anthropic Claude API(备选)

安全原则:

  • 所有凭证仅通过环境变量读取,零持久化
  • 不记录、不打印、不缓存任何密钥值
  • 无 API 密钥时自动降级为本地模式

免责声明

本技能包提供的合规检测结果仅供参考,不构成法律意见。使用者应结合专业法律顾问的意见做出最终判断。检测结果可能存在误报或漏报,建议对高风险内容进行人工复核。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Purefeed

Monitors Twitter/X feeds with AI signal detection. Searches tweets semantically, manages signal detectors, generates human-sounding posts, checks AI detectio...

Registry SourceRecently Updated
2070Profile unavailable
General

Signalradar

SignalRadar — Monitor Polymarket prediction markets for probability changes and send alerts when thresholds are crossed. Use when user asks to "add a Polymar...

Registry SourceRecently Updated
5402Profile unavailable
General

quark-ocr

使用夸克 OCR 服务从图片中提取文本(支持中英文混合)。当用户提供图片 URL,并要求“OCR”、“提取文本”、“读取图片”、“识别文档”或“获取图片文字”时触发。支持通用文档识别,具备版面感知输出能力。

Registry SourceRecently Updated
1700Profile unavailable
General

musicful music generator

Generate AI music or lyrics from natural language with a single sentence. The system auto-detects whether to create a vocal song or pure instrumental BGM, an...

Registry SourceRecently Updated
1383Profile unavailable