volcengine-image-gen

使用火山引擎(豆包)Seedream 系列模型生成高质量图片。支持文生图、多种分辨率、多种比例。

Safety Notice

This listing is imported from skills.sh public index metadata. Review upstream SKILL.md and repository scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "volcengine-image-gen" with this command: npx skills add xdrshjr/jr-openclaw-skills/xdrshjr-jr-openclaw-skills-volcengine-image-gen

火山引擎图片生成

使用火山方舟 (Ark) 平台的 Seedream 系列模型生成高质量图片。

支持的模型

模型 ID名称特点
doubao-seedream-3-0-t2i-250115Seedream 3.0轻量级,速度快
doubao-seedream-4-0-t2i-250115Seedream 4.0标准质量
doubao-seedream-4-5-251128Seedream 4.5最新高质量 (默认)

快速开始

1. 配置 API Key

在 skill 目录的 .env 文件中配置:

VOLCENGINE_IMAGE_API_KEY=你的-api-key
VOLCENGINE_IMAGE_ENDPOINT=https://ark.cn-beijing.volces.com/api/v3
VOLCENGINE_IMAGE_DEFAULT_MODEL=doubao-seedream-4-5-251128

或者在环境变量中设置:

export VOLCENGINE_IMAGE_API_KEY=你的-api-key

2. 生成图片

# 基础生成
python3 scripts/generate.py "一只可爱的猫咪" -o cat.png

# 指定比例
python3 scripts/generate.py "科幻城市夜景" -r 16:9 -o city.png

# 指定尺寸 (2K)
python3 scripts/generate.py "山水画" -W 2048 -H 2048 -o landscape.png

# 使用特定模型
python3 scripts/generate.py "赛博朋克风格" -m doubao-seedream-4-0-t2i-250115 -o cyber.png

# 生成多张
python3 scripts/generate.py "不同角度的跑车" -n 4 -o car.png

使用示例

示例 1: 基础文生图

cd ~/clawd/skills/volcengine-image-gen
python3 scripts/generate.py "一只可爱的橘猫在窗台上晒太阳,水彩风格" -o cat.png

示例 2: 指定比例

python3 scripts/generate.py "未来城市夜景,霓虹灯,赛博朋克" -r 16:9 -o cyberpunk.png

支持的比例:

  • 1:1 - 正方形
  • 16:9 / 9:16 - 宽屏/竖屏
  • 4:3 / 3:4 - 标准比例
  • 2:3 / 3:2 - 照片比例

示例 3: Python 调用

import sys
sys.path.insert(0, '/Users/xdrshjr/clawd/skills/volcengine-image-gen/scripts')
from generate import generate_image

# 生成图片
paths = generate_image(
    prompt="一只可爱的猫咪在花园里玩耍",
    ratio="1:1",
    output_path="cat.png"
)

print(f"图片已保存: {paths[0]}")

命令行参数

参数说明默认值
prompt图片描述提示词必填
-o, --output输出文件路径自动生成
-m, --model模型名称Seedream 4.5
-r, --ratio图片比例1:1
-W, --width图片宽度根据比例计算
-H, --height图片高度根据比例计算
-n, --number生成数量 (1-4)1
--no-watermark不添加水印-
--url返回 URL 而不是下载-
--list-models列出支持的模型-
--debug开启调试模式-

尺寸要求

  • 最小像素: 3,686,400 (约 1920x1920)
  • 推荐尺寸: 2048x2048 (2K)
  • 如果指定的比例尺寸不满足最小像素,会自动放大

环境变量

变量名说明必填
VOLCENGINE_IMAGE_API_KEY火山引擎 API Key
VOLCENGINE_IMAGE_ENDPOINTAPI 端点
VOLCENGINE_IMAGE_DEFAULT_MODEL默认模型

获取 API Key

  1. 访问 火山方舟控制台
  2. 点击右上角 API Key 管理
  3. 创建新的 API Key
  4. 复制 Key 并配置到 .env 文件

安装依赖

cd ~/clawd/skills/volcengine-image-gen
pip3 install -r requirements.txt

故障排除

API Key 无效

AuthenticationError: The API key format is incorrect

解决: 确认使用的是火山方舟 (Ark) 的 API Key,不是语音合成的 Access Token。

尺寸太小

InvalidParameter: image size must be at least 3686400 pixels

解决: 使用更大的尺寸,如 2048x2048 或更大的比例。

网络超时

网络请求失败

解决: 图片生成可能需要 30-60 秒,请检查网络连接。

提示词技巧

有效的提示词结构

[主体], [细节描述], [风格], [光线], [构图], [色彩]

示例

一只可爱的橘猫,趴在窗台上晒太阳,毛发柔软蓬松,
水彩画风格,柔和的自然光线,温馨的氛围,
暖色调,细节丰富,高清画质

常用风格关键词

  • 写实: photorealistic, realistic, detailed
  • 动漫: anime, manga, cartoon style
  • 油画: oil painting, classical art
  • 水彩: watercolor, soft colors
  • 赛博朋克: cyberpunk, neon lights, futuristic
  • 中国风: Chinese traditional style, ink wash painting

参考文档

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

doubao-open-tts

No summary provided by upstream source.

Repository SourceNeeds Review
General

session-cleaner

No summary provided by upstream source.

Repository SourceNeeds Review
General

google-image-crawler

No summary provided by upstream source.

Repository SourceNeeds Review
General

remotion-best-practices

No summary provided by upstream source.

Repository SourceNeeds Review