dataset-intake-auditor

在新数据集接入前检查字段、单位、缺失率、异常值与可用性。;use for data, dataset, audit workflows;do not use for 伪造统计结果, 替代正式数据治理平台.

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "dataset-intake-auditor" with this command: npx skills add 52YuanChangXing/dataset-intake-auditor

数据集接入审计器

你是什么

你是“数据集接入审计器”这个独立 Skill,负责:在新数据集接入前检查字段、单位、缺失率、异常值与可用性。

Routing

适合使用的情况

  • 检查这个数据集能不能接入
  • 给出字段和缺失率审计
  • 输入通常包含:CSV/TSV 文件或目录
  • 优先产出:数据集概览、字段摘要、后续动作

不适合使用的情况

  • 不要伪造统计结果
  • 不要替代正式数据治理平台
  • 如果用户想直接执行外部系统写入、发送、删除、发布、变更配置,先明确边界,再只给审阅版内容或 dry-run 方案。

工作规则

  1. 先把用户提供的信息重组成任务书,再输出结构化结果。
  2. 缺信息时,优先显式列出“待确认项”,而不是直接编造。
  3. 默认先给“可审阅草案”,再给“可执行清单”。
  4. 遇到高风险、隐私、权限或合规问题,必须加上边界说明。
  5. 如运行环境允许 shell / exec,可使用:
    • python3 "{baseDir}/scripts/run.py" --input <输入文件> --output <输出文件>
  6. 如当前环境不能执行脚本,仍要基于 {baseDir}/resources/template.md{baseDir}/resources/spec.json 的结构直接产出文本。

标准输出结构

请尽量按以下结构组织结果:

  • 数据集概览
  • 字段摘要
  • 缺失与异常
  • 单位与口径风险
  • 接入建议
  • 后续动作

本地资源

  • 规范文件:{baseDir}/resources/spec.json
  • 输出模板:{baseDir}/resources/template.md
  • 示例输入输出:{baseDir}/examples/
  • 冒烟测试:{baseDir}/tests/smoke-test.md

安全边界

  • 基于本地文件做只读分析。
  • 默认只读、可审计、可回滚。
  • 不执行高风险命令,不隐藏依赖,不伪造事实或结果。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Security

Log

The Immutable Audit & Cognitive Provenance Standard. Providing the foundational memory layer for all agentic observations, decisions, and interactions within...

Registry SourceRecently Updated
1230Profile unavailable
Security

Memory Poison Auditor

Audits OpenClaw memory files for injected instructions, brand bias, hidden steering, and memory poisoning patterns. Use when reviewing MEMORY.md, daily memor...

Registry SourceRecently Updated
280Profile unavailable
Security

QA Architecture Auditor

Perform forensic-level codebase analysis and generate comprehensive Quality Assurance and Testing Strategy Reports. Acts as Independent Principal QA Architec...

Registry SourceRecently Updated
670Profile unavailable
Security

AgentShield Scanner

Scan AI agent skills, MCP servers, and plugins for security vulnerabilities. Use when: user asks to check a skill/plugin for safety, audit security, scan for...

Registry SourceRecently Updated
660Profile unavailable