14
ChatGPT 不仅可以创建文本,还可以创建图片。即使是在免费版中,也可以为创意项目和视觉交流创建图片。
使用 ChatGPT 创建图片:全面概述
ChatGPT 通常用于文本生成。自 2025 年 3 月起,OpenAI 为所有 ChatGPT 用户提供了直接在聊天中创建 AI 生成的图像的功能。
- 该功能基于新型多模态模型 GPT-4o,该模型通过自回归方法改进了图像生成。与其他模型不同,该模型不是将图像由噪声组成,而是从左到右、从上到下由像素块组成。这减少了典型的 AI 错误,并允许更复杂的组合。
- 使用 AI 工具创建图像时,请注意不要使用复制受法律保护材料的描述。此外,您无法在图像中生成知名人物。这些人物受版权保护。
- 特别是在模仿当代在世艺术家的风格时: 即使使用 GPT-4o,对在世艺术家风格的有意模仿仍然受到限制。虽然新准则允许在模仿工作室风格(如皮克斯或吉卜力)方面有更大的自由度,但禁止有针对性地生成当代艺术家风格的作品。OpenAI 以版权和道德考虑为理由解释了这一点。
- 所有受商标法保护的图像、商标和徽标都不能使用人工智能工具创建,因为它们同样受版权保护。敏感信息,如私人信息、地址等,也禁止在图像中出现。
- 免费 ChatGPT 版本的用户受到以下限制:每天最多只能创建两张图像。此外,生成的图像分辨率低于Plus版本。直接编辑或迭代生成的图像的功能受到限制。对于希望每天创建两张以上图像或需要更高分辨率的用户,OpenAI提供付费订阅服务,提供更多高级功能。
- 要创建图片,只需在聊天框中输入详细描述即可。描述越精确(例如风格、视角、光照条件),结果就越好。请注意,由于服务器容量有限,在繁忙时段可能会出现等待时间。
分步指南:如何使用 ChatGPT 创建图像
作为个人用户,您通常使用免费的 ChatGPT 4.o 版本来创建图像。作为企业用户,您可以使用 ChatGPT Enterprise,该版本提供对 ChatGPT 4.o 的无限访问权限,以及用于团队的高级安全措施和管理工具。使用免费版本,您无法编辑图像。
- 创建描述:创建您想要创建的图像的描述。您对图像的描述越准确,结果就越准确。选择合适的形容词来描述图像主题、颜色和细节,例如: “创建一个日落时分的未来主义城市景观,有高楼和霓虹灯。”
- 处理:文本处理工具会转发您的图像描述,并创建人工智能生成的图像。完成后,您可以在 ChatGPT 的聊天窗口中看到它。这可能需要一些时间。
- 进行修改:您可以根据这张图片创建更多变体。为此,请在文本框中输入所需的修改,例如:其他颜色(粉彩代替暗色)、其他风格(铅笔画代替照片)或其他视角(鸟瞰视角代替蛙视角)。& nbsp;注意:免费版本会创建一张全新的图片。付费版本可以修改图片的部分区域。
- 下载:如果您对图片满意,请下载。然后,您可以随意使用它。
使用 ChatGPT 进行填充: 如何优化您的图片
填充是指使用人工智能有针对性地更改或替换图片中的选定区域,同时保留其余图片内容。此功能仅包含在付费版本(ChatGPT Plus 或 Enterprise)中。
- ChatGPT-4o 的填充功能与早期模型(例如 DALL·E 3)类似,但通过更深入地整合多模态功能,该功能变得更精确、更交互、更快速。要使用该功能,请从人工智能生成的图像开始,或上传您自己的图像。
- ChatGPT 将显示该图像。使用鼠标或手指(对于触摸屏)选择您想要更改的区域,例如一个物体、一张脸或某个特定细节。
- 然后输入提示。描述您希望在选定区域出现的内容,例如:“将太阳镜替换为未来派的网络眼镜”。
- GPT-4o 会根据您的提示生成一张新图片。只有选定区域会发生改变,其余部分保持不变。假设您生成了一张公园长椅上坐着一位女士的图片,并在前景中标记了一只狗,您想将它替换为一只松鼠。您的提示是:“将狗替换为松鼠”。
- 您可以重复此过程,以更改其他区域或优化结果。在下一步中,您可以标记女子的脸,并输入提示:“给这个人一个微笑”。每次迭代后,您可以设置新的标记或再次选择旧的区域。实践证明,每张图片通常需要三到八次迭代。
使用 ChatGPT 进行创意图像设计: 获得令人印象深刻的效果的技巧
详细描述和尝试艺术风格、色彩和视角是美学图像的基本要素。通过逐步改进每个版本,并清楚地了解图像的使用位置,您可以创作出观众会铭记在心的独特作品。
- 令人印象深刻的图像的关键在于对所需主题进行详细而富有创意的描述。您对图像的描述越准确、越富有创意,结果就越好。使用具体的形容词,并提供有关颜色、视角和风格的详细信息。例如:“创作一张怀旧的夜市图片,背景中有闪闪发光的灯和巨大的摩天轮”。
- 尝试不同的艺术风格。尝试要求水彩画、油画或未来派数字艺术作品风格的描述。这种多样性使您能够探索各种视觉表达形式,并决定最符合您设想的形式。
- 图像生成过程是迭代的。图像生成后,您可以进行调整。使用该功能可更改颜色、视角或风格等细节。这有助于您根据自己的想法塑造图像。只需说明您想要的更改,然后发送新的描述进行调整即可。
- 使用 ChatGPT 创建图像为许多项目提供了创造性的可能性。无论您是需要演示文稿的图形、故事的插图,还是仅用于个人使用的艺术作品,人工智能支持的图像生成都能帮助您实现您的创意愿景。
- 有许多值得推荐的德语资源,其中包含用于使用 ChatGPT 生成图像的丰富提示集。 All-AI.de 提供了 50 个创意示例、技巧和窍门,帮助您立即开始并发展自己的风格。相比之下, KI-im-Alltag.de 展示了一个由各种人工智能生成的图像库,每个图像都配有相应的提示。这是了解不同描述如何产生不同结果的一种实用方法。
- Galaxy.ai 提供了 28 条提示,侧重于图像生成的基础知识,帮助您了解神经网络在此过程中的作用。 Prompt Engineering Guide 对于想要深入了解提示工程的人来说是一个宝贵的资源。该资源提供了一个全面的集合,包括 3000 多个提示、示例、用例、工具、API 和扩展。
图像版权和使用:ChatGPT 图像需要注意的事项
ChatGPT 中人工智能生成的图像的图像版权和商业使用受明确规则约束,尤其是涉及品牌、名人或受保护风格时。
- 无论您使用的是免费版还是付费版,都可以将生成的图像用于商业用途。例如:网站、社交媒体、印刷品、广告、YouTube、T恤衫、书籍等。这些权利适用于您自己的内容。
- 不允许使用受版权和商标保护的图像、仿制品或徽标、商标或产品的修改版本。即使这些内容是由人工智能生成的,也适用此规定。违反此规定可能会受到警告、版权诉讼和停止侵权诉讼。例如,以下提示是禁止的:“创建一张带有苹果徽标的飞翔的 iPhone 图像”。
- 同样,明确描绘真实人物(无论在世或已故)的图像也是禁止的,因为这会侵犯个人形象权。这包括:演员、政治家、运动员、网红等。以下提示是不允许的:“制作一张中世纪风格的弗里德里希·梅尔茨的逼真肖像”。
- 模仿梵高、班克斯或皮克斯等艺术家的风格存在争议,处于法律灰色地带。因此,OpenAI 会自动过滤许多风格化的提示。诸如“以日本动漫导演宫崎骏的风格绘制一个女孩”这样的提示可能会被屏蔽,或者如果图像用于商业用途,则存在法律风险。
- 请使用描述性的通用风格,例如“水彩画”或“铅笔素描风格”。只要不包含受商标保护的建筑,地点和环境也是合法的:“浮岛上的蒸汽朋克村庄”或“未来主义的夜城”。
- 虚构人物,如“一个戴着机械臂、披着斗篷的冒险家”或“一个穿着骑士盔甲的人形青蛙”,与神话或幻想中的生物一样,在法律上都是安全的。例如,您可以放心使用“一个在洞穴里沉睡的水晶龙”或“一个在森林里长着藤蔓的独角兽”。
- 在提示中,请务必避免使用迪斯尼、漫威、星球大战或皮克斯等名称。此外,请避免使用名人面孔或可识别的面部特征、类似徽标的符号或知名产品形状。诸如“班克斯风格”或“梦工厂风格”等词汇也应避免使用。
免费人工智能图像生成: 探索 ChatGPT 的替代方案
如果 ChatGPT 不适合您,还有许多其他 AI 图像生成器可供您创建或编辑图像。这些生成器大多提供免费选项。
- Microsoft Copilot Designer 使用 DALL·E 3,使用 Microsoft 帐户可免费使用,直到免费图像生成配额用完为止。Copilot Designer 主要专注于生成新图像,而不是有针对性的图像编辑(填充)。它能够快速、轻松地生成高质量的图像,并针对在微软工具(Office、Edge、Windows)中生成图像进行了特别优化。
- Stable Diffusion 是一个技术要求较高的开源深度学习模型,特别适合技术娴熟的用户,如艺术家、开发人员和专业人士,他们希望尝试人工智能图像生成。为了提高本地使用效率,强烈建议使用图形处理器(GPU)。如果没有 GPU,在 CPU 上生成图像会非常耗时(通常每张图像需要几分钟),或者实际上无法使用。
- Stable Diffusion 非常灵活,支持自定义模型、风格、分辨率和各种控制选项。有许多方法可以影响图像生成。该软件提供诸如填充(有针对性地替换/编辑图像区域)、扩展(将图像扩展到原始边缘之外)、Text2Image(从文本生成图像)、Image2Image(图像到图像的转换)以及训练和微调功能。
- Leonardo AI 是一个提供预制图像风格和模型(例如用于游戏、概念艺术、插图)的平台。它特别擅长高度风格化、图形细节丰富的图像(例如幻想、科幻),并提供填充和实时编辑功能。该平台深受创意专业人士的欢迎,但免费套餐存在限制,尤其是积分数量和功能使用方面。免费积分用完后,许多功能只能有限地使用或付费使用。
- Deep Dream Generator:Deep Dream Generator 是一款基于谷歌 DeepDream 算法的免费在线工具。用户可以上传自己的图片,并使用各种风格和效果进行编辑。
- RunwayML: RunwayML 是一个平台,用户可以与各种人工智能互动,以创建创意项目。它提供各种图像生成和编辑模型,例如风格转移、GAN 生成艺术、文本到图像生成以及图像编辑,例如删除背景或添加效果。
- Artbreeder:Artbreeder 是一个网站,您可以使用生成对抗网络 (GAN) 通过组合和调整不同的图像来创作新的艺术作品。基于现有图像,可以混合和修改元素。
- DeepArt.io:DeepArt.io 是一个在线工具,允许用户将自己的照片转换成梵高或毕加索等著名艺术家的风格的艺术作品。