stable Diffusion Skill — stable Diffusion 技能
v1.0.1Complete Stable Diffusion 网页UI integration 技能. Supports txt2img, img2img, inpAInting, ControlNet, LoRA, 模型 switching, upscaling, and more via SD 网页UI API. Use when user wants to 生成 images with Stable Diffusion, edit images, 应用ly styles, use ControlNet, or manage SD 模型s.
运行时依赖
安装命令
点击复制技能文档
🎨 Stable Diffusion 技能
通过本地部署的 Stable Diffusion 网页UI API 实现完整的 AI 图像生成与编辑能力。
前提条件:需要本地安装并启动 SD 网页UI(AUTOMATIC1111 版本),启动时加上 --API 参数。 默认 URL:http://127.0.0.1:7860(可通过环境变量 SD_网页UI_URL 修改)
🚀 快速开始 检查连接状态 python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 状态
第一次使用流程 确认 SD 网页UI 已运行(--API 模式) 检查连接:python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 状态 查看可用模型:python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-模型s 生成第一张图! 📋 功能速查表 功能 命令关键词 说明 文生图 txt2img / 生成图片 / 画 从文字描述生成图像 图生图 img2img / 图片风格化 基于参考图生成新图 局部重绘 inpAInt / 修图 / 重绘 修改图片特定区域 ControlNet controlnet / 姿势控制 精确控制图像结构 超分辨率 up扩展 / 放大 / 高清 放大图片并增强细节 模型管理 换模型 / 加载模型 切换检查点/LoRA 批量生成 批量 / batch 一次生成多张变体 提示词工具 优化提示词 / 翻译 将中文描述转为 SD 提示词 🖼️ 文生图(txt2img) 基本用法
用户说:"帮我画一张..."、"生成一张..."、"txt2img..."
参数收集流程:
如果用户没提供详细参数,先询问关键信息: 描述(正向提示词) 风格偏好(写实/动漫/油画等) 尺寸(512x512 / 768x768 / 512x768 等) 将中文描述智能转换为 SD 提示词(见提示词转换规则) 调用 API 生成
执行命令:
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action txt2img \ --prompt "1girl, beautiful, masterpiece, best 质量" \ --negative-prompt "ugly, bad anatomy, blurry" \ --width 512 --height 768 \ --steps 20 --cfg-扩展 7 \ --sampler "DPM++ 2M Karras" \ --种子 -1 \ --输出-dir "./sd_输出"
常用参数说明:
参数 默认值 说明 --steps 20 采样步数(推荐 20-30) --cfg-扩展 7 提示词遵从度(1-30,推荐 5-12) --sampler DPM++ 2M Karras 采样器 --种子 -1 随机种子(-1=随机) --width/height 512x512 图像尺寸(需为 8 的倍数) --batch-size 1 每批生成数量 --n-iter 1 批次数量 🔄 图生图(img2img)
用户说:"把这张图片..."、"参考这张图风格化..."、"img2img..."
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action img2img \ --init-image "/path/to/image.png" \ --prompt "oil pAInting style, detAIled" \ --denoising-strength 0.75 \ --steps 20 --cfg-扩展 7 \ --输出-dir "./sd_输出"
去噪强度(denoising-strength)指南:
0.1-0.3:轻微修改,保留原图 70-90% 0.4-0.6:中度变化,半保留原始构图 0.7-0.9:大幅改变,保留基本构图 1.0:完全重新生成 🖌️ 局部重绘(InpAInting)
用户说:"把这张图的...改成..."、"修改图片中的..."
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action inpAInt \ --init-image "/path/to/image.png" \ --mask-image "/path/to/mask.png" \ --prompt "new content for masked area" \ --inpAInting-fill 1 \ --denoising-strength 0.85 \ --输出-dir "./sd_输出"
蒙版填充模式:
0:填充(fill) 1:原始(original) 2:潜空间噪声(latent noise) 3:潜空间无(latent nothing) 🎛️ ControlNet 控制
用户说:"参考这个姿势..."、"用 ControlNet..."、"保持构图生成..."
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action txt2img-controlnet \ --prompt "beautiful girl, detAIled" \ --control-image "/path/to/pose.png" \ --control-模块 "openpose" \ --control-模型 "control_v11p_sd15_openpose" \ --control-weight 1.0 \ --输出-dir "./sd_输出"
常用 ControlNet 模块:
模块 用途 openpose 人体姿势控制 canny 边缘线条控制 depth 深度图控制 normal 法线图控制 scribble 手绘草图控制 seg 语义分割控制 tile 细节增强/高清修复 lineart 线稿上色控制 🔍 超分辨率放大(Upscaling)
用户说:"放大这张图..."、"高清化..."、"超分..."
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action up扩展 \ --image "/path/to/image.png" \ --up扩展r "R-ESRGAN 4x+" \ --扩展 2 \ --输出-dir "./sd_输出"
可用放大算法(需 SD 网页UI 中已安装):
Latent(潜空间放大,适合动漫) R-ESRGAN 4x+(通用高质量) R-ESRGAN 4x+ Anime6B(动漫专用) ESRGAN_4x(经典ESRGAN) SwinIR 4x(写实图像) 📦 模型管理 查看可用模型 python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-模型s python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-samplers python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-up扩展rs python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-loras python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-vaes
切换检查点模型 python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action switch-模型 \ --模型-name "rea列出icVisionV60B1_v60B1VAE.safetensors"
在提示词中使用 LoRA
在 prompt 中加入 语法:
1girl, beautiful, , masterpiece
🎨 高清修复(Hires Fix)
在 txt2img 中启用 Hires Fix 生成高清大图:
python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action txt2img \ --prompt "landscape, detAIled" \ --width 512 --height 512 \ --enable-hr \ --hr-扩展 2 \ --hr-up扩展r "R-ESRGAN 4x+" \ --hr-steps 15 \ --denoising-strength 0.5 \ --输出-dir "./sd_输出"
💡 提示词转换规则
当用户用中文描述时,按以下规则转换为 SD 提示词:
标准质量词(始终添加)
正向(推荐加入):
masterpiece, best 质量, ultra-detAIled, high resolution
负向(推荐加入):
(worst 质量:2), (low 质量:2), blurry, ugly, bad anatomy, bad hands, extra limbs, deformed, mutated, poorly drawn face, text, watermark
风格映射 中文 英文提示词 写实/真实 photorea列出ic, ultra rea列出ic, RAW photo 动漫/二次元 anime style, 2d, cel shading 油画 oil pAInting, pAInterly 水彩 watercolor, soft colors 赛博朋克 cyberpunk, neon lights, futuristic 古风/国风 chinese traditional art, hanfu, ink wash 皮克斯风 pixar style, 3d render, cartoon 翻译辅助工具 python ${CLAUDE_技能_DIR}/prompt_辅助工具.py \ --translate "美丽的中国女孩,穿着汉服,站在樱花树下" \ --style "anime"
📊 工作流示例 示例 1:生成动漫风格人物
用户:"画一个穿着汉服的古风美女"
# 步骤1:检查模型 python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action 列出-模型s
# 步骤2:生成图像 python ${CLAUDE_技能_DIR}/sd_命令行工具ent.py --action txt2img \ --prompt "1girl, beautiful chinese girl, hanfu, traditional chinese clothing, cherry blossom, long hAIr, masterpiece, best 质量, anime style" \ --negative-prompt "(worst 质量:2), (low 质量:2), bad