数据分析 Skill
功能说明
本 Skill 提供 analyze_data 工具,能够:
- 读取 CSV 或 Excel 数据文件(.csv / .xlsx / .xls)
- 自动进行数据概览(行列数、字段类型、缺失值)
- 执行统计分析(描述统计、相关性分析、异常值检测)
- 根据用户需求生成针对性的分析和洞察
- 输出带交互式 ECharts 图表的自包含 HTML 报告
触发场景
当用户出现以下意图时,应主动调用 analyze_data 工具:
- 上传了 CSV 或 Excel 文件,并提出分析需求
- 要求"帮我分析这份数据"、"生成数据报告"、"可视化这个文件"
- 要求找规律、找差异、找趋势、找异常
- 要求生成 BI 报告、数据洞察报告
调用方式
analyze_data(
file_path: "<文件绝对路径>",
requirements: "<自然语言分析需求>",
output_dir: "<输出目录,可选>"
)
调用示例
示例 1:
用户说「帮我分析一下这个销售数据,各区域表现怎么样?」
→ 调用 analyze_data(file_path="/path/to/sales.csv", requirements="分析各区域销售额差异,找出表现最好和最差的区域,给出改善建议")
示例 2:
用户说「分析用户行为数据,找出流失节点」
→ 调用 analyze_data(file_path="/path/to/users.xlsx", requirements="对用户行为数据做漏斗分析,找出主要流失节点,分析流失原因")
示例 3:
用户说「分析产品退货率的影响因素」
→ 调用 analyze_data(file_path="/path/to/orders.csv", requirements="分析产品退货率,找出与退货率相关的主要因素,给出降低退货率的建议")
返回值说明
工具返回一个对象,包含:
| 字段 | 说明 |
|---|---|
report_path | HTML 报告文件路径,可直接在浏览器打开 |
summary | 结构化摘要数据(行列数、字段信息、关键洞察列表) |
charts_count | 生成的图表数量 |
insights | 规则引擎提取的关键洞察列表 |
open_command | 打开报告的命令(如 open /path/to/report.html) |
报告结构
生成的 HTML 报告包含以下模块:
- 执行摘要 — 核心发现概览卡片
- 数据概览 — 字段类型、缺失值、基础统计表格
- 数据洞察 — 规则引擎自动提取的关键发现
- 可视化图表 — 交互式 ECharts 图表(分布图、柱状图、热力图、趋势图等)
- 描述统计 — 数值列的 min/max/mean/std/quartile 详细统计
- 分析结论 — 针对用户需求的分析总结
获取文件路径
如果用户上传了文件但未提供路径,使用以下方式获取:
# OpenClaw 上传文件后,路径通常在 ~/Downloads/ 或临时目录
# 可以用 list_files 工具确认
list_files("~/Downloads")
首次使用:安装 Python 依赖
本 Skill 在首次调用时会自动尝试创建隔离的 Python 环境并安装依赖。如果自动安装失败,请手动执行:
# 在 Skill 目录下创建虚拟环境
python3 -m venv ~/.openclaw/skills/data-analysis-partner/.venv
# 安装依赖
~/.openclaw/skills/data-analysis-partner/.venv/bin/pip install pandas numpy openpyxl xlrd
依赖安装优先级:
- Skill 目录内置
.venv(隔离环境,推荐) - 系统
python3(需已安装 pandas/numpy) - 自动创建
.venv并安装(首次运行时尝试)
隐私说明
生成的 HTML 报告通过 CDN 加载 ECharts 图表库:
<script src="https://cdn.jsdelivr.net/npm/echarts@5/dist/echarts.min.js"></script>
这意味着:
- 用浏览器打开报告时会向
cdn.jsdelivr.net发出网络请求 - CDN 服务器可能记录访问 IP、时间等基础日志
- 报告本身的数据内容不会上传,仅加载图表渲染库
如需完全离线查看,可在有网络时打开一次报告(ECharts 会被浏览器缓存),后续即可离线使用。
其他注意事项
- 大文件(>100MB)分析时间可能较长(30秒~2分钟)
- 超过 5 万行的数据集会自动随机抽样,原始行数在报告中标注
- HTML 报告自包含(图表配置内嵌),可发送给他人查看