--- name: text-to-image description: "AI绘图工具,当用户想通过文本生成图像时,可以调用该工具。根据用户输入内容提取画图提示词,选择合适的模型进行绘图,返回生成的图片。" argument-hint: "需要 prompt 参数(画图提示词),可选 model(模型)、negative_prompt(反向提示词)、ratio(宽高比)、resolution(分辨率)" --- # Text To Image Skill ## 描述 这是一个 AI 文生图技能,当用户想通过文本描述生成图像时触发。支持多个绘图模型:即梦(JiMeng)、豆包(DouBao)、造相(Z-Image)。 从数据库中读取绘图配置(API 密钥、Base URL 等),根据用户选择的模型调用对应的绘图 API,返回生成的图片 URL。 这个仓库里额外提供了一个可执行脚本 `text-to-image/scripts/text_to_image.py`,方便宿主机器人直接调用。 ## 触发条件 - 用户想画图、生成图片 - 用户说「画一张……」「生成一张……的图片」「帮我画……」 - 用户提到「文生图」「AI绘图」「AI画图」 - 用户描述了想要生成的图片内容 ## 参数说明(JSON Schema) 调用脚本时,需要通过第一个命令行参数传入 JSON 字符串,结构如下: ```json { "type": "object", "properties": { "prompt": { "type": "string", "description": "根据用户输入内容,提取出的画图提示词,但是不要对提示词进行总结。" }, "model": { "type": "string", "description": "画图模型选择(可选):即梦4.5(jimeng-4.5) / 即梦4.6(jimeng-4.6) / 即梦5.0(jimeng-5.0) / 豆包4.5(doubao-seedream-4.5) / 豆包4.0(doubao-seedream-4.0) / 豆包文生图(doubao-seedream-3.0-t2i) / 豆包图生图(doubao-seededit-3.0-i2i) / 造相基础版(Z-Image) / 造相蒸馏版(Z-Image-Turbo) / 造相图片编辑(Qwen-Image-Edit-2511),默认: 空(none)。", "enum": [ "none", "jimeng-4.5", "jimeng-4.6", "jimeng-5.0", "doubao-seedream-4.5", "doubao-seedream-4.0", "doubao-seedream-3.0-t2i", "doubao-seededit-3.0-i2i", "Z-Image", "Z-Image-Turbo", "Qwen-Image-Edit-2511" ], "default": "none" }, "negative_prompt": { "type": "string", "description": "用于描述图像中不希望出现的元素或特征的文本,可选。" }, "ratio": { "type": "string", "description": "图像的宽高比,可选,默认16:9。", "default": "16:9" }, "resolution": { "type": "string", "description": "图像的分辨率,可选,默认2k。", "default": "2k" } }, "required": ["prompt"], "additionalProperties": false } ``` ## 依赖安装 - 在执行 `text-to-image/scripts/text_to_image.py` 之前,必须先安装依赖。 - 执行安装脚本:`python3 text-to-image/scripts/bootstrap.py` ## 执行步骤 1. 当用户输入绘图相关内容时触发该技能。 2. 从用户输入中提取 prompt(画图提示词),不对提示词做总结或修改。可选提取 model、negative_prompt、ratio、resolution 参数。 3. 在执行脚本前,先安装依赖:`python3 text-to-image/scripts/bootstrap.py`。 4. 将参数组装为 JSON 字符串,在仓库根目录下执行本地脚本:`python3 text-to-image/scripts/text_to_image.py ''`。 5. 成功是脚本输出 ``` 图片URL1 图片URL2 ``` ## 回复要求 - 成功时,脚本输出 `图片URL1图片URL2` 格式,AI 智能体接受到这种格式内容会自动发送图片。 - 失败时,返回具体的失败信息。