Visual ChatGPT: Изображения из текстовых запросов — Вся информация

by Pramith

Вы наверняка задумывались о том, можно ли генерировать изображения из текстов или даже редактировать их. С Visual ChatGPT от Microsoft это скоро может стать реальностью

Visual ChatGPT — самая важная информация

Visual ChatGPT — это новая реализация модели ChatGPT от Microsoft, которая позволяет генерировать и изменять изображения на основе текстовых запросов. Для этого исследовательская группа интегрировала несколько генераторов изображений, таких как Stable Diffusion, Blip и Pix2Pix, и использует диалоги между пользователями и ИИ для динамического изменения изображений.

  • Visual ChatGPT — это планируемый инструмент для работы с изображениями от Microsoft, который генерирует и изменяет изображения на основе текстовых запросов. Он основан на известном чатботе ChatGPT, а также на различных ИИ для работы с изображениями.
  • Особенностью по сравнению с обычными ИИ, генерирующими изображения, такими как Midjourney и Dall-E, является то, что они могут генерировать только новые изображения и использовать предыдущие работы в качестве ссылки.
  • Visual ChatGPT, с другой стороны, должен быть способен динамически изменять существующие изображения посредством диалога между пользователями и ИИ. Например, должна быть возможность целенаправленно заменять или адаптировать отдельные элементы изображения.
  • Visual ChatGPT может также выводить параметры изображений в виде текстового ответа и, например, интерпретировать цвет стены на изображении или давать более сложные описания изображений.
  • На данный момент Visual ChatGPT доступен в виде общедоступной предварительной версии на Github, но он требует большого объема видеопамяти и выделенного графического процессора. Пока неясно, для чего Microsoft будет использовать этот инструмент, но он может быть, например, интегрирован в поиск изображений Bing или другие программы.

Related Articles

Leave a Comment