BigModel 生成图片和视频
使用智谱 AI 的 BigModel API 生成高质量图片和视频。支持单张/批量图片生成、视频生成(含 AI 音频)。
🚀 快速开始
1. 设置 API Key
必需步骤 - 只需设置一次:
# 临时设置(当前会话)
export BIGMODEL_API_KEY=your_api_key_here
# 永久设置(推荐)
echo 'export BIGMODEL_API_KEY=your_api_key_here' >> ~/.zshrc
source ~/.zshrc
获取 API Key:访问 智谱 AI BigModel 开放平台
2. 快速使用
最简单的方式 - 使用提供的脚本:
# 生成图片
python scripts/generate.py "一只可爱的橘猫"
# 生成视频
python scripts/generate.py "海边日落" --video
# 批量生成
python scripts/generate.py "日出 日落 星空 彩虹" --batch
# 查看所有选项
python scripts/generate.py --help
编程方式 - 在 Python 代码中使用:
import sys
sys.path.insert(0, '.claude/skills/image-video-generation/lib')
from image_video import generate_image
result = generate_image(prompt="描述内容")
print(result["data"][0]["url"])
📖 使用场景与示例
场景 1:小说/书籍封面
# 武侠小说封面(竖版)
python scripts/generate.py "中国武侠小说封面,水墨画风格,远山如黛,云雾缭绕,一把长剑插在岩石上,月光洒下" --size 1024x1792
# 言情小说封面
python scripts/generate.py "浪漫的粉色花瓣飘落,温柔的夕阳,温暖的色调" --size 1024x1792
# 科幻小说封面
python scripts/generate.py "未来城市,霓虹灯光,赛博朋克风格,高科技感" --size 1024x1792
场景 2:社交媒体内容
# 小红书风格图片
python scripts/generate.py "清新文艺风格,自然光线,极简构图,高饱和度"
# 朋友圈配图
python scripts/generate.py "生活记录,温馨日常,柔和光线"
# 头像生成
python scripts/generate.py "可爱的卡通风格猫咪头像,简洁背景"
场景 3:电商产品图
# 产品展示
python scripts/generate.py "白色背景上的蓝色运动鞋,专业产品摄影,柔和光线" --quality hd
# 场景展示
python scripts/generate.py "产品放在木质桌面上,温馨的家居环境,自然光"
场景 4:短视频制作
# 5秒短视频
python scripts/generate.py "一朵花在阳光下缓缓开放" --video --duration 5
# 10秒高质量视频
python scripts/generate.py "城市夜景,车流穿梭,灯光流动" --video --duration 10 --quality hd
场景 5:批量生成
# 批量生成不同风格的图片
python scripts/generate.py "日出时的山景 蓝色大海的海滩 秋天的森林小路 雪后的村庄" --batch
# 批量生成产品变体
python scripts/generate.py "红色款产品 蓝色款产品 黑色款产品 白色款产品" --batch
🎯 参数选择指南
图片模型选择
| 模型 | 速度 | 质量 | 适用场景 | 推荐指数 |
|---|---|---|---|---|
| cogview-3-flash | ⚡⚡⚡ | ⭐⭐⭐ | 快速测试、大量生成、预览 | 🌟🌟🌟 |
| cogview-4-250304 | ⚡⚡ | ⭐⭐⭐⭐ | 日常使用、平衡质量与速度 | 🌟🌟🌟🌟 |
| cogview-4 | ⚡ | ⭐⭐⭐⭐⭐ | 专业级、高质量输出 | 🌟🌟🌟🌟🌟 |
建议:
- 快速测试 →
cogview-3-flash - 日常使用 →
cogview-4-250304 - 最终输出 →
cogview-4+--quality hd
视频模型选择
| 模型 | 速度 | 质量 | 适用场景 | 推荐指数 |
|---|---|---|---|---|
| cogvideox-flash | ⚡⚡⚡ | ⭐⭐⭐ | 快速预览、测试效果 | 🌟🌟🌟 |
| cogvideox-2 | ⚡⚡ | ⭐⭐⭐⭐ | 标准视频、日常使用 | 🌟🌟🌟🌟 |
| cogvideox-3 | ⚡ | ⭐⭐⭐⭐⭐ | 高质量长视频 | 🌟🌟🌟🌟🌟 |
建议:
- 快速测试 →
cogvideox-flash - 日常使用 →
cogvideox-2 - 高质量输出 →
cogvideox-3
尺寸选择
| 尺寸 | 比例 | 适用场景 |
|---|---|---|
| 1024x1024 | 1:1 | 正方形、头像、社交媒体 |
| 1024x1792 | 9:16 | 竖版、封面、海报 |
| 1792x1024 | 16:9 | 横版、横幅、风景 |
💡 Prompt 编写技巧
好的 Prompt 特征
✅ 具体明确 - 描述主体、风格、场景 ✅ 细节丰富 - 包含光线、角度、氛围 ✅ 风格明确 - 指定艺术风格、质量要求
示例对比
❌ 不好:一只猫
✅ 好:一只橘色的短毛猫,坐在窗台上晒太阳,温暖的下午光线,柔和的景深效果,专业摄影
常用风格关键词
风格类:
- 水墨画、油画、水彩、素描、卡通、写实
- 赛博朋克、极简主义、复古、现代、传统
光线类:
- 自然光、柔和光线、强烈对比、逆光、侧光
氛围类:
- 温馨、神秘、浪漫、科技感、清新、厚重
质量类:
- 专业摄影、高清、8K、电影级、精细细节
⚙️ 高级用法
直接使用 Python API
import sys
sys.path.insert(0, '.claude/skills/image-video-generation/lib')
from image_video import generate_image, batch_generate_images, generate_video, wait_for_video
# 单张图片
result = generate_image(
prompt="描述内容",
model="cogview-3-flash",
quality="standard",
size="1024x1024",
)
url = result["data"][0]["url"]
# 批量图片
prompts = ["描述1", "描述2", "描述3"]
results = batch_generate_images(prompts, max_concurrent=3)
# 视频生成
video = generate_video(prompt="描述内容", duration=5)
task_id = video["id"]
final = wait_for_video(task_id)
video_url = final["video_result"][0]["url"]
自定义并发控制
批量生成时控制并发数以优化性能:
results = batch_generate_images(
prompts,
max_concurrent=5 # 增加并发数(建议不超过 5)
)
📚 完整参考文档
详细的 API 文档和更多示例请参考:
- 完整 API 参考:见
lib/image_video.py中的函数文档 - 示例代码:见
examples/目录 - README:见
README.md获取快速入门
❓ 故障排除
常见问题
Q: 提示 "需要设置 BIGMODEL_API_KEY 环境变量"
- A: 未设置 API Key,参考"快速开始"第1步设置
Q: 生成速度很慢
- A: 尝试使用
cogview-3-flash或cogvideox-flash模型
Q: 视频生成失败
- A: 简化 prompt 或更换模型,检查网络连接
Q: 批量生成时中断
- A: 降低并发数,使用
--concurrent 2
Q: 图片质量不够高
- A: 使用
--quality hd和cogview-4模型
获取帮助
# 查看脚本帮助
python scripts/generate.py --help
# 测试 API Key 是否有效
python scripts/generate.py "test" # 如果有效会生成测试图片
🎯 最佳实践
- 先快速测试 - 使用 flash 模型快速验证效果
- 再精细调整 - 满意后用高质量模型生成最终版本
- 保存好 Prompt - 记录有效的 prompt 供后续复用
- 批量处理 - 相似需求的图片使用批量生成
- 合理选择尺寸 - 根据用途选择合适的尺寸比例