super-self-improving

超级自我优化智能体 - 多模态记忆、反馈循环、元学习、置信度校准 / Super Self-Improving Agent - Multi-modal Memory, Feedback Loops, Meta-Learning, Confidence Calibration

Safety Notice

This listing is imported from skills.sh public index metadata. Review upstream SKILL.md and repository scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "super-self-improving" with this command: npx skills add bombfuock/super-self-improving/bombfuock-super-self-improving-super-self-improving

超级自我优化智能体 / Super Self-Improving Agent

基于原有self-improving的增强版,增加多模态记忆、元学习、置信度校准等功能。

Enhanced version with multi-modal memory, meta-learning, confidence calibration and more.

🆕 相比原版新增功能

1. 多模态记忆 / Multi-modal Memory

  • 📝 文本偏好 (Text preferences)
  • 💻 代码模式 (Code patterns)
  • 🎨 风格偏好 (Style preferences)
  • 🔧 工具使用习惯 (Tool usage habits)
  • 📊 性能指标 (Performance metrics)

2. 反馈循环 / Feedback Loops

  • ✋ 显式反馈 (Explicit feedback) - 用户直接纠正
  • 👁️ 隐式反馈 (Implicit feedback) - 从行为推断
  • 🤖 合成反馈 (Synthetic feedback) - 自我评估

3. 元学习 / Meta-Learning

  • 学习如何学习 (Learn how to learn)
  • 识别最佳策略 (Identify best strategies)
  • 动态调整方法 (Dynamic method adjustment)

4. 置信度校准 / Confidence Calibration

  • 预测准确度追踪 (Track prediction accuracy)
  • 校准评分 (Calibration score)
  • Uncertainty quantification

5. 错误分析 / Error Analysis

  • 错误分类 (Error categorization)
  • 根因分析 (Root cause analysis)
  • 预防模式 (Prevention patterns)

📁 目录结构 / Directory Structure

~/.super-self-improving/
├── memory/
│   ├── hot.md           # 始终加载 (<100行)
│   ├── preferences.md    # 用户偏好
│   ├── patterns.md      # 行为模式
│   └── metrics.md       # 性能指标
├── projects/            # 项目级记忆
├── domains/             # 领域级记忆
├── archive/             # 归档
├── feedback/
│   ├── explicit.md      # 显式反馈
│   ├── implicit.md      # 隐式反馈
│   └── synthetic.md     # 自我评估
├── errors/              # 错误分析
│   ├── categories.md    # 错误分类
│   ├── root_causes.md  # 根因分析
│   └── prevention.md   # 预防模式
└── meta/
    ├── strategy.md      # 学习策略
    ├── calibration.md  # 置信度校准
    └── stats.json      # 统计信息

🔄 工作流程 / Workflow

用户输入 → 意图识别 → 上下文匹配 → 执行 → 反馈收集
                  ↓                        ↓
            记忆检索 ←──────────────── 自我评估
                  ↓
            模式学习 → 策略更新 → 置信度调整

📊 性能指标 / Performance Metrics

追踪以下指标:

指标说明
task_completion_rate任务完成率
user_satisfaction用户满意度
error_rate错误率
response_time响应时间
pattern_accuracy模式识别准确率
calibration_score置信度校准分数

🎯 核心机制 / Core Mechanisms

1. 反馈收集 / Feedback Collection

# 收集反馈
def collect_feedback(context):
    explicit = detect_explicit_correction(context)  # 用户直接纠正
    implicit = detect_implicit_feedback(context)    # 行为推断
    synthetic = self_assessment(context)            # 自我评估
    
    return combine_feedback(explicit, implicit, synthetic)

2. 模式识别 / Pattern Recognition

# 识别重复模式
def recognize_patterns(memory, threshold=3):
    # 统计出现频率
    # 识别关联规则
    # 生成模式建议
    return patterns

3. 策略更新 / Strategy Update

# 基于反馈更新策略
def update_strategy(patterns, metrics):
    # 分析什么有效
    # 调整方法
    # 更新置信度
    return updated_strategy

4. 置信度校准 / Confidence Calibration

# 校准置信度
def calibrate(prediction, actual_outcome):
    # 记录预测 vs 实际
    # 计算校准分数
    # 调整未来预测
    return calibrated_confidence

📋 触发条件 / Triggers

显式纠正

  • "不对"
  • "应该是..."
  • "我告诉过你..."
  • "我不喜欢..."

隐式信号

  • 用户重复问题
  • 长时间沉默
  • 跳过回答
  • 转换话题

自我评估触发

  • 完成复杂任务后
  • 收到模糊反馈
  • 遇到新场景

🏆 升级规则 / Promotion Rules

层级使用频率确认次数
HOT每次3次确认
WARM相关上下文5次使用
COLD显式查询归档

🔒 安全边界 / Security Boundaries

  1. 不存储敏感信息 (No sensitive data)
  2. 不访问未授权文件 (No unauthorized file access)
  3. 不修改系统配置 (No system config changes)
  4. 定期清理过期数据 (Regular cleanup)

📈 使用示例 / Usage Examples

# 查看记忆统计
super-self-improving stats

# 添加显式反馈
super-self-improving feedback --explicit "不要用markdown表格"

# 查看性能指标
super-self-improving metrics

# 导出记忆
super-self-improving export

# 置信度校准
super-self-improving calibrate

⚡ 与原版对比 / Comparison with Original

特性原版增强版
记忆类型文本多模态
反馈来源显式显式+隐式+合成
学习方式被动主动+被动
错误处理记录分析+预防
置信度完整校准
性能追踪完整指标

📝 记录格式 / Logging Format

显式反馈

## 2026-03-05
- 用户纠正: "不要用表格,用列表"
- 原因: 用户偏好
- 状态: 已确认

隐式反馈

## 2026-03-05
- 行为: 用户重复提问3次
- 推断: 上次回答不够清晰
- 动作: 改进回答方式

自我评估

## 2026-03-05
- 任务: 复杂代码调试
- 评估: 第一次尝试失败
- 改进: 添加更多调试信息

🎯 最佳实践 / Best Practices

  1. 频繁小改进 > 偶尔大改进
  2. 量化跟踪 > 主观感觉
  3. 预防优先 > 事后纠正
  4. 透明可解释 > 黑箱学习
  5. 用户控制 > 自主推断

💰 Token监控 / Token Monitoring

功能 / Features

  • 📊 实时token消耗追踪 / Real-time token consumption tracking
  • ⚠️ 异常消耗预警 / Abnormal consumption alerts
  • 📈 使用趋势分析 / Usage trend analysis
  • 💵 成本估算 / Cost estimation

指标 / Metrics

指标说明
session_tokens当前会话消耗
total_tokens总会话消耗
cache_efficiency缓存效率
avg_tokens_per_turn每轮平均消耗
cost_estimate成本估算

告警规则 / Alert Rules

- 超过平均2倍 → 警告
- 超过平均3倍 → 严重告警
- 缓存效率<50% → 优化建议
- 接近限制(80%) → 提醒

🤖 Agent调度优化 / Agent Scheduling Optimization

功能 / Features

  • 🎯 智能任务分配 / Intelligent task allocation
  • ⚡ 负载均衡 / Load balancing
  • 🔄 自动扩缩容 / Auto scaling
  • 📊 性能最优化 / Performance optimization

调度策略 / Scheduling Strategies

策略适用场景
round_robin均衡负载
shortest_queue最少等待
skill_match技能匹配
cost_efficiency成本优先
performance_based性能最优

优化规则 / Optimization Rules

  1. 根据任务类型选择最佳agent
  2. 监控agent负载并动态调整
  3. 缓存常用上下文减少重复
  4. 预测任务复杂度分配资源
  5. 定期评估并优化策略

性能指标 / Performance Metrics

指标说明
task_completion_time任务完成时间
success_rate成功率
queue_wait_time等待时间
resource_utilization资源利用率
user_satisfaction用户满意度

自动调优 / Auto-tuning

  • 收集历史性能数据
  • 分析瓶颈和优化点
  • 动态调整调度参数
  • 持续监控效果

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

super-self-improving

No summary provided by upstream source.

Repository SourceNeeds Review
Automation

Smart Agent Memory CN

跨平台 Agent 长期记忆系统。分层上下文供给 + 温度模型 + Skill经验记忆 + 结构化存储 + 自动归档。三层存储:Markdown(人可读,QMD 可搜索)+ JSON(结构化)+ SQLite/FTS5(高性能全文搜索)。纯 Node.js 原生模块,零外部依赖。

Registry SourceRecently Updated
Automation

Agent Reader

Document beautifier for AI Agents. Converts Markdown to styled webpages, Word, PDF, and image slideshows — the 'last mile' rendering engine for AI output. 专为...

Registry SourceRecently Updated
650Profile unavailable
Automation

Feishu Calendar Intelligent Scheduler

飞书智能日历调度器 - 自动推荐最佳会议时间,批量管理日程,生成会议报表

Registry SourceRecently Updated
120Profile unavailable