DiePre Vision Cognition Skill
元数据
| 字段 | 值 |
|---|---|
| 名称 | diepre-vision-cognition |
| 版本 | 1.0.0 |
| 作者 | KingOfZhao |
| 发布日期 | 2026-03-31 |
| 置信度 | 96% |
学术参考文献
本视觉框架的技术路线受以下前沿研究启发:
- Generating CAD Code with Vision-Language Models — VLM生成CAD代码+迭代验证(CADCodeVerify),直接升级照片→DXF管道
- From 2D CAD to 3D Parametric via VLM — 2D图纸→参数化3D,解决透视矫正和参数化问题
- Tool-Augmented VLLMs as Generic CAD Task Solvers (ICCV 2025) — VLLM+工具调用做通用CAD,封装OpenCV管道为可调用Skill
- Efficient Vision-Language-Action Models — VLA高效优化(低延迟+内存优化),适合本地部署
- Vlaser: Synergistic Embodied Reasoning — 具身推理VLA,未来"照片→动作决策"的理论基础
核心能力
将 DiePre(模切压痕)机器视觉感知与 SOUL 认知框架融合:
- 视觉已知/未知分离:从图像中提取确定特征(已知)与模糊区域(未知)
- 文件记忆:每次检测结果写入
vision_log/YYYY-MM-DD.jsonl - 四向视觉碰撞:正视角、反转、侧光、整体布局四个维度同时分析
- 人机闭环质检:AI 初判 → 人类复核 → 标注反馈 → 模型持续进化
- 置信度质检输出:低于 90% 置信度的缺陷自动升级为人工复核
安装命令
clawhub install diepre-vision-cognition
# 或手动安装
cp -r skills/diepre-vision-cognition ~/.openclaw/skills/
调用方式
from skills.diepre_vision_cognition import DiePrevisionCognition
vision = DiePrevisionCognition(workspace=".")
result = vision.analyze(
image_path="path/to/dieline.png",
context={"material": "corrugated", "thickness_mm": 3.0}
)
print(result.confidence) # 置信度
print(result.defects) # 检测到的缺陷列表
print(result.collision_log) # 四向分析详情