Visual ChatGPT:来自文本请求的图像 – 所有信息

by Flo

你可能想知道是否有可能从文本中生成图像,甚至是编辑它们。有了微软的Visual ChatGPT,这很快就能成为现实。

Visual ChatGPT – 最重要的信息

Visual ChatGPT是微软ChatGPT模型的一个新实现,允许从文本请求中生成和修改图像。为了做到这一点,研究小组整合了几个图像生成器,如稳定扩散、Blip和Pix2Pix,并使用用户和人工智能之间的对话对图像进行动态修改。

  • Visual ChatGPT是微软计划推出的图像工具,可以根据文本请求生成和改变图像。它基于著名的聊天机器人ChatGPT以及各种图像AI。
  • 与传统的图像生成AI(如Midjourney和Dall-E)相比,其特别之处在于它们只能生成新的图像,最多使用以前的作品作为参考。
  • Visual ChatGPT,另一方面,应该能够通过用户和人工智能之间的对话动态地改变现有的图像。例如,它应该能够以有针对性的方式替换或调整个别图像元素。
  • Visual ChatGPT还可以将图像的参数输出为文本响应,因此,例如,解释图像中墙壁的颜色,或给出更复杂的图像描述.
  • 目前,Visual ChatGPT可作为Github上的公开预览版,但它需要大量的视频内存和专用GPU。目前还不清楚微软将如何使用该工具,但它可以,例如,被集成到必应图像搜索或其他程序中。

Related Articles

Leave a Comment