TTSFree: Jak działa konwerter tekstu na mowę?

by Pramith

TTSFree to narzędzie, które pozwala ustawić tekst na muzykę przy użyciu sztucznie generowanej mowy. Następnie całość można pobrać jako plik audio.

TTSFree – tak się korzysta z konwertera

Jak używać TTSFree do konwersji tekstu na mowę:

  • Napisz lub skopiuj tekst, który chcesz ustawić na muzykę, do pola tekstowego na stronie internetowej dostawcy.
  • Pod polem tekstowym znajduje się kilka opcji ustawień, których można użyć do dostosowania głosów. TTSFree korzysta ze sztucznej inteligencji głosowej Google i Microsoft. W zakładce „TTS Server 1” znajdują się głosowe SI od Google, a w zakładce „TTS Server 2” SI od Microsoftu. Użyj rozwijanych menu, aby wybrać język i/lub dialekt.
  • Następnie zostaną wyświetlone różne głosy. Za pomocą zielonego przycisku odtwarzania obok każdego głosu można odsłuchać próbkę. Poniżej wyboru głosu znajdują się dwa elementy sterujące „Voice Pitch” i „Adjust Voice Speed”. Za pomocą „Voice Pitch” zmienia się wysokość dźwięku, a za pomocą „Adjust Voice Speed” zmienia się prędkość, z jaką SI odczytuje tekst.
  • Po dokonaniu żądanych ustawień, kliknij przycisk „Convert Now”, który ustawia tekst na muzykę i odtwarza go bezpośrednio po procesie konwersji.
  • Po kliknięciu przycisku „Download Mp3” pod „Convert Now” można pobrać plik audio.
  • Bez płatnej subskrypcji można przekonwertować maksymalnie 500 znaków na słowo mówione. Zakres ten można jednak rozszerzyć, tworząc bezpłatne konto w witrynie. W ten sposób można dubbingować do 2000 znaków jednocześnie, mieć dostęp do ponad 100 głosów zamiast 50 i ponad 30 języków zamiast 20.

TTSFree – to właśnie potrafi płatna wersja

Jeśli chcesz w pełni wykorzystać możliwości TTSFree, możesz przejść na wersję płatną.

  • TTSFree ma dwa poziomy subskrypcji. Można wybrać płatność miesięczną lub roczną. Jeśli płacisz rocznie, oszczędzasz 10 USD na subskrypcji Basic i 40 USD na subskrypcji Premium.
  • Za 5 USD miesięcznie lub 50 USD rocznie można ustawić do 10 000 znaków do muzyki jednocześnie w modelu Basic. Podczas gdy TTSFree reklamuje się, że możesz konwertować nieograniczoną ilość tekstu na dźwięk w ramach subskrypcji za 5 USD, możesz maksymalnie 2 miliony znaków miesięcznie.
  • Subskrypcja Basic daje dostęp do ponad 200 głosów, ponad 50 języków i odblokowuje możliwość dodawania muzyki w tle do tekstu na dźwięk. Możesz to zrobić za pośrednictwem biblioteki muzyki bez tantiem osadzonej na stronie lub użyć linków do YouTube i Soundcloud.
  • Płatne subskrypcje odblokowują również rozpoznawanie SSML dla edytora tekstu. SSML to skrót od „Speech Synthesis Markup Language” i służy do przekazywania sztucznej inteligencji bardziej precyzyjnych instrukcji dotyczących ustawiania tekstu do muzyki. Na przykład, pauzy mogą być określone w określonych punktach lub liczby mogą być renderowane inaczej.
  • W ramach subskrypcji premium można użyć 40 000 znaków na dubbing i maksymalnie 10 milionów znaków miesięcznie. Tak zwane głosy premium są dodawane do ponad 200 głosów, a głosy „News”, „Neural2” i „Wavenet” są odblokowane. Dla użytkowników premium, 50+ głosów z poziomu podstawowego zostanie zwiększone do 60+.
  • Oprócz innych funkcji z podstawowej subskrypcji, reklamy będą ukryte na stronie
  • Uzyskasz dostęp do API TTSFree i będziesz mógł zintegrować je z własnymi aplikacjami.

Related Articles

Leave a Comment