redcap-crf-generator

开发者:邹和建、刘从进 REDCap 数据字典生成器 - 将 Word 文档(CRF/方案)转换为 CSV 格式的 REDCap 数据字典。 适用场景: - 用户上传临床试验 CRF/方案 Word 文档,要求生成数据字典 - 将问卷/调查表转换为 REDCap 可导入的 CSV 格式 功能特点: - 智能识别表单、分节、字段结构 - 支持单选题、多选题、Likert量表、频率量表 - 自动生成 CDISC 兼容的变量名 - Section Header 仅第一个字段填写(同组后续字段留空)

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "redcap-crf-generator" with this command: npx skills add kenlcj/redcap-crf-generator

REDCap CRF 数据字典生成器

概述

本技能将 Word 格式的临床试验方案/CRF 表单转换为符合 REDCap 标准的数据字典 CSV 文件。

数据字典格式(REDCap CSV)

列名说明示例
Variable / Field Name字段变量名,CDISC规范sex, js_1, ws_22
Form Name表单英文名demographics, basic_info
Section Header分节标题(仅首字段填写)人口学特征
Field Type字段类型text, dropdown, radio, checkbox, calc, notes, file
Field Label字段中文标签性别, 您对工作满意吗
Choices, Calculations, OR Slider Labels选项(radio/checkbox/dropdown用)0, 否 | 1, 是
Field Note特殊说明/格式要求反向计分, YYYY-MM-DD
Text Validation Type验证类型date, phone, email, number, integer
Text Validation Min/Max数值范围0, 100
Identifier?是否隐私字段y(是)或留空
Branching Logic分支逻辑[sex] = "0"
Required Field?是否必填y(是)或留空

⚠️ 重要:Section Header 规则

Section Header 仅第一个字段填写,后续同组字段留空!

这是 REDCap 数据字典的标准要求。同一个分节的字段,第一个字段标注 Section Header,后续字段该列留空。

示例:

Variable / Field Name,Form Name,Section Header,Field Type,Field Label,...
bi_1,basic_info,人口学特征,radio,您的性别,...
bi_2,basic_info,,radio,您的年龄,...
bi_3,basic_info,,radio,您的户籍,...

支持的字段类型

类型说明Choices 格式
text单行文本
notes多行文本/备注
dropdown下拉选择0, 选项1 | 1, 选项2
radio单选按钮0, 选项1 | 1, 选项2
checkbox多选框0, 选项1 | 1, 选项2 | 2, 选项3
calc计算字段round([weight]*10000/([height]^2),1)
file文件上传
date日期(用text类型+date验证)

量表支持

Likert 量表(职业压力等)

  • 格式:1, 非常符合 | 2, 基本符合 | 3, 有点不符合 | 4, 非常不符合
  • 反向计分题选项顺序颠倒:1, 非常不符合 | 2, 有点不符合 | 3, 基本符合 | 4, 非常符合

频率量表(工作状态等)

  • 格式:0, 从未发生 | 1, 一年几次或更少 | 2, 一月一次或更少 | 3, 一月几次 | 4, 一周一次 | 5, 一周几次 | 6, 每天发生

CDISC 变量命名规范

表单前缀说明示例
bi_basic_info 基本信息bi_1, bi_2
js_job_stress 职业压力js_1, js_31
ws_work_status 工作状态ws_1, ws_22
mh_mental_health 心理健康mh_1, mh_10

规则:

  • 小写字母 + 下划线 + 数字
  • 题号后缀便于溯源(如 js_5 = job_stress 第5题)
  • 避免缩写,使用通用词汇

处理流程

  1. 读取 Word 文档 → 使用 python-docx 解析
  2. 识别结构 → 段落(基本信息和第四部分)/ 表格(第二、三部分量表)
  3. 字段解析 → 提取题目、选项、量表类型
  4. 智能推断 → 字段类型、验证规则、反向计分标记
  5. 生成 CSV → REDCap 标准格式,UTF-8 编码

使用方式

当用户上传 Word 文档并要求生成数据字典时:

  1. 读取文档内容
  2. 解析表单结构和字段
  3. 生成符合上述格式的 CSV
  4. 通过飞书发送文件给用户

依赖

pip install python-docx lxml

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Obsidian Cleaner

Automatically clean up loose images and attachments in Obsidian vault root, moving them to the Attachments folder. Trigger when user says "clean obsidian", "clean attachments", or "整理附件".

Registry SourceRecently Updated
General

tradealpha实时新闻

获取 TradeAlpha 实时新闻和语义检索结果。适用于用户提到 TradeAlpha 新闻、今日新闻、路透、彭博、Truth、国内资讯、研报快讯,或要求按主题、事件、公司、叙事检索相关新闻的场景。通过聊天向用户索取 token,并在当前会话中复用,不读取环境变量,不写入本地文件。

Registry SourceRecently Updated
General

Everclaw — Inference You Own

Open-source first AI inference — GLM-5 as default, Claude as fallback only. Own your inference forever via the Morpheus decentralized network. Stake MOR toke...

Registry SourceRecently Updated
General

Identitygram Signin

Sign in to IdentityGram by calling the /auth/signin endpoint.

Registry SourceRecently Updated