aa-pair-analysis

蛋白质氨基酸功能类别相邻对频率分析。对任意蛋白质家族的多物种序列进行多序列比对(MSA)、共识序列提取、对型统计和配方计算,输出Top5高频对型及φ值。适用于:(1)对新物种/类群运行完整分析流程,(2)从已有共识序列进行对型统计,(3)横向比较不同物种/类群的氨基酸对组成差异,(4)修改氨基酸分类或统计参数后重新分析。适用于任何蛋白质家族。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "aa-pair-analysis" with this command: npx skills add wuhen9nine/aa-pair-analysis

氨基酸对频率分析(aa-pair-analysis)

首次使用:环境初始化

首次调用本 skill 前,先运行初始化脚本,自动检测并安装所有依赖:

bash skills/aa-pair-analysis/scripts/setup.sh

脚本会依次检查并安装:

依赖说明自动安装方式
Python 3.8+运行分析脚本需手动预装
pandas数据处理与CSV输出pip install pandas
biopython序列处理(可选)pip install biopython
ClustalOmega多序列比对(MSA)apt / brew / conda / 二进制下载

如果环境已配置好,跳过此步骤直接运行分析即可。


核心文件

  • 分析脚本(完整流程): scripts/species_analysis_workflow.py(FASTA→MSA→结果)
  • 方法详情: references/method.md
  • 氨基酸分类: references/classification.md

快速运行

cd skills/aa-pair-analysis

# 从原始FASTA完整流程(MSA→共识→对分析)
python scripts/species_analysis_workflow.py 任务名 数据目录 --threshold 0.5

# 断点续传
python scripts/species_analysis_workflow.py 任务名 数据目录 --resume 已有结果目录

关键参数

参数默认值说明
--threshold0.5共识序列保守性阈值(最高频氨基酸占比≥该值才写入,否则标X)
--resume指定已有结果目录,从断点继续

输出文件

文件内容
species_formulations.csv每个类群的Top5对型、φ值、21种对型计数
top_5_pairs_details.csvTop5对型逐条明细
formulation_summary.csv总类群数、独特配方数

氨基酸分类(固定,不可更改)

详见 references/classification.md

参与统计(17种):Hydrophobic(V,L,I,M) / Nucleophilic(S,T,C) / Aromatic(F,Y,W) / Amide(N,Q) / Acidic(D,E) / Cationic(H,K,R)

排除(不统计):X、A(丙氨酸)、G(甘氨酸)、P(脯氨酸)

计数方法(已验证,不可更改)

  1. 剔除共识序列中所有 X/A/G/P,直接拼接为新序列
  2. 统计新序列所有相邻对(有方向)
  3. 合并对称对(N-H + H-N → H-N)得21种无向对型
  4. 按计数排名选Top5

修改分析参数时的注意事项

  • 修改氨基酸分类:同步更新 scripts/run_pdf_analysis.pyscripts/species_analysis_workflow.py 中的 FUNCTIONAL_CLASSES 字典
  • 修改阈值:使用 --threshold 参数,无需改代码
  • 修改计数方法:Step3(过滤拼接)和Step5(对称合并)需同步修改两个脚本

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

AI Product Manager

OpenClaw-first AI product manager for turning analytics, revenue, crash, store, and feedback signals into execution-ready proposals and backlog work.

Registry SourceRecently Updated
General

Kai Slide Creator Publish V224

生成HTML演示文稿/幻灯片 — 21 种风格模版,播放/演讲者模式。适用于路演、产品发布、技术分享、方案宣讲等场景。

Registry SourceRecently Updated
General

IELTS Reading Review 雅思阅读复盘助手

IELTS Reading passage review, scoring, and progress tracking skill. Generates structured review data (JSON) and professional HTML/PDF review notes locally —...

Registry SourceRecently Updated
General

Google Calendar Update Time

Atomic node skill to exclusively update the start and end time of a Google Calendar event.

Registry SourceRecently Updated