TTSFree: принцип работы преобразователя текста в речь

by Pramith

TTSFree — это инструмент, позволяющий наложить текст на музыку с помощью искусственно сгенерированной речи. После этого все это можно загрузить в виде аудиофайла.

TTSFree — вот как пользоваться конвертером

Как использовать TTSFree для преобразования текста в речь:

  • Напишите или скопируйте текст, который вы хотите положить на музыку, в текстовое поле на сайте провайдера.
  • Под текстовым полем находится несколько опций, которые можно использовать для настройки голосов. В TTSFree используются голосовые ИИ от Google и Microsoft. На вкладке «TTS Server 1» находятся голосовые ИИ от Google, а на вкладке «TTS Server 2» — от Microsoft. Используйте выпадающие меню для выбора языка и/или диалекта.
  • После этого вам будут предложены различные голоса. С помощью зеленой кнопки воспроизведения рядом с каждым голосом можно прослушать образец. Под выбором голоса находятся два регулятора «Voice Pitch» и «Adjust Voice Speed». С помощью «Voice Pitch» можно изменить высоту тона, а с помощью «Adjust Voice Speed» — скорость, с которой ИИ зачитывает текст.
  • После установки нужных настроек нажмите кнопку «Convert Now», которая наложит текст на музыку и воспроизведет его непосредственно после процесса конвертации.
  • Нажав кнопку «Download Mp3» под «Convert Now», вы можете скачать аудиофайл.
  • Без платной подписки вы можете преобразовать в устную речь не более 500 символов за проход. Однако этот объем можно расширить, если создать на сайте бесплатную учетную запись. Таким образом, вы сможете озвучивать до 2000 символов одновременно, иметь доступ к более чем 100 голосам вместо 50 и более чем 30 языкам вместо 20.

TTSFree — это то, что может платная версия

Если вы хотите получить максимальную отдачу от TTSFree, вы можете перейти на платную версию.

  • TTSFree имеет два уровня подписки. Вы можете выбрать ежемесячную или ежегодную оплату. При ежегодной оплате вы экономите 10 долл. на подписке Basic и 40 долл. на подписке Premium.
  • За 5 долл. в месяц или 50 долл. в год в модели Basic можно одновременно наложить на музыку до 10 000 символов. Хотя TTSFree рекламирует возможность преобразования неограниченного количества текста в аудио при подписке за 5 долларов, в месяц разрешается использовать не более 2 млн. символов.
  • Базовая подписка дает доступ к более чем 200 голосам, более чем 50 языкам и открывает возможность добавлять фоновую музыку к тексту в аудио. Для этого можно использовать библиотеку бесплатной музыки, встроенную в страницу, или воспользоваться ссылками на YouTube и Soundcloud.
  • При платной подписке вы также получаете возможность распознавания SSML для текстового редактора. SSML расшифровывается как «Speech Synthesis Markup Language» и служит для того, чтобы дать искусственному интеллекту более точные инструкции по наложению текста на музыку. Например, можно задать паузы в определенных местах или по-другому отобразить цифры.
  • При премиум-подписке можно использовать 40 тыс. символов за дубляж и не более 10 млн. символов в месяц. К более чем 200 голосам добавляются так называемые премиум-голоса и разблокируются голоса «Новости», «Neural2» и «Wavenet». Для премиум-пользователей показатель 50+ голосов из базового уровня будет увеличен до 60+.
  • В дополнение к другим возможностям из базовой подписки, реклама будет скрыта на странице
  • Вы получаете доступ к API TTSFree и можете интегрировать его в свои собственные приложения

Related Articles

Leave a Comment