Разное

Google tts: Lifelike Speech Synthesis  |  Google Cloud

Содержание

Новый CFD 3CX поддерживает Google Text to Speech и Speech to Text

Posted on September 3rd, 2020 by Игорь Снежко, Customer Support Regional Manager — Russia & Ukraine

Мы только что представили новую версию Call Flow Designer (CFD), в которой вы можете закрепить голосовое приложение CFD за добавочным номером и использовать технологии Google TTS (Text to Speech) и STT (Speech to Text). Новый CFD получил поддержку лексики и нейронного голоса Amazon Polly, а также новую Начальную страницу. Для использования этих мощных возможностей, установите 3CX v16 Update 6 и скачайте новую версию CFD.

Welcome! Willkommen! Здравствуйте!

В новом CFD появилась поддержка голосовых сервисов Google TTS и STT. Это позволяет создавать многоязычные приложения, которые произносят живым голосом текст на разных языках, и наоборот, распознают такую речь. Эти технологии позволяют реализовать в ваших приложениях мощное голосовое управление:

  • Разговор с абонентами – приложения CFD теперь смогут общаться с клиентами на их родном языке.
  • Обработка речи абонентов – интеллектуальное приложение конвертирует речь клиента в текстовый файл и использует текст в дальнейшей обработке.

Поддержка 120 языков и наречий расширяет приложения CFD мощной обработкой естественного языка NLP (Natural Language Processing). Ваш бизнес сможет работать с клиентами по всему миру! Comprendez vous?

Чтобы добавить голосовые сервисы Google TTS и STT, ознакомьтесь с этим несложным руководством.

Обновленный интерфейс CFD

В новом релизе CDF также добавлены:

  • Новая Начальная страница с информационными ссылками о системе CFD, ярлыками действий, последними проектами и избранными компонентами. Это упрощает работу разработчика приложения.
  • Новые возможности Amazon’s Polly:
    • Различные произношения, которые позволяют настроить произношение слов в приложении.
    • Нейронные голоса TTS, которые позволяют приложению разговаривать с абонентами более естественным голосом.

Для использования Amazon Polly в ваших голосовых приложениях изучите это руководство.

Позвоните своему приложению!

Теперь за приложением CFD можно закрепить добавочный номер, на который можно звонить или переводить вызовы, как это обычно делается в 3CX. Если ваша АТС обновлена до Update 6, откройте голосовое приложение в новом CFD и при компиляции закрепите его за свободным добавочным номером АТС.

Новый CFD – установка

Для установки нового Call Flow Designer и обязательного обновления 3CX V16 Update 6:

  1. Скачайте 3CX v16 Update или обновите вашу инсталляцию через встроенный механизм обновления:
  2. Скачайте и установите CFD или обновите его через встроенный механизм обновления, как описано в Руководстве по установке.

См. полный журнал изменений и поделитесь своим впечатлением на специализированном форуме.

tts — Перевод на русский — примеры английский

Предложения:
Tt
TT


На основании Вашего запроса эти примеры могут содержать грубую лексику.


На основании Вашего запроса эти примеры могут содержать разговорную лексику.

In 1985 TTS was relegated to the third level and did not manage to come back.

В 1985 ТТС вылетел в третий дивизион и не сумел вернуться обратно.

However Jednota was promoted immediately and changed the name back to TTS.

Несмотря на это, клуб сразу же вернулся во второй дивизион и сменил название обратно на ТТС.

This feature is called TTS (Unified Messaging Text-to-Speech).

Эта функция называется TTS (Unified Messaging Text-to-Speech — перевод текста в речь).

MRCP allows for distribution of resource-intensive operations such as ASR and TTS.

MRCP обеспечивает распределение ресурсов, таких как ASR и TTS.

For example, it is possible to have an MRCP server on a seperate machine running software such as Voxeo Prophecy which can perform text-to-speech (TTS) functionality.

Например, можно иметь MRCP сервер на отдельной машине, на котором работает программное обеспечение, такое как Voxeo Prophecy, которое может выполнять преобразование текста в речь (text-to-speech (TTS)).

Fey’s corporation, Feyline Productions, coordinated with his production company, TTS, to manage the videotaping.

Корпорация Фэя Feyline Productions скоординировалась с его продюсерской компанией TTS, чтобы руководить съёмками.

The Unified Messaging Language Pack page has all language packs available for Exchange Server 2007, all existent language pack support TTS (Text-to-Speech) and the system prompts.

На странице Unified Messaging Language Pack page есть все языковые пакеты, доступные для Exchange Server 2007, все пакеты, поддерживающие преобразование текста в речь (TTS — Text-to-Speech), а также системные подсказки.

The SDK also includes freely distributable text-to-speech (TTS) engines (in U.S. English and Simplified Chinese) and speech recognition (SR) engines (in U.S. English, Simplified Chinese, and Japanese).

SDK также содержит свободно распространяемые движки text-to-speech (TTS) (американский английский и упрощенный китайский) и движки распознавания речи (американский английский, упрощенный китайский и японский.

‘»I want you to come on my tts…'»

«Я хочу, чтоб ты кончил на мои сск. ..»

An exception was raised during a call to the current TTS driver.

if MS Agent and appropriate TTS Engines installed, Polyglossum can use MS Agent to pronounce dictionary text.

если MS Agent и соответствующие голоса (TTS Engines) установлены, Polyglossum может использовать MS Agent для озвучивания текста словаря.

TTS Trenčín first played in the top flight of Slovakia during World War II, when Slovak and Czech competitions were separated.

«Тренчин» впервые вошёл в число лучших клубов Словакии во время Второй мировой войны, когда словацкие и чешские соревнования были разделены.

CoolReader 3.X is experimental open-source multiplatform version under development (neither skinning nor TTS support).

CoolReader 2 — для Windows, с поддержкой скинов и чтения вслух; развитие ветки заморожено.

Balabolka is a freeware Text-To-Speech (TTS) program with many advanced settings.

Balabolka — программа для чтения текстовых файлов человеческим голосом.

After reports on TTS Made him loose his license.

Синтез речи в Облачном Контакт Центре

Облачная платформа интегрирована с TTS от Google

Разработчик сервиса Облачный Контакт Центр – компания BrightPattern, объявила о готовности интеграции c функционалом Синтеза речи (Text-to-Speech) от корпорации Google. Основанная на технологии облачного машинного обучения (Google Cloud Machine Learning) интеграция использует наиболее совершенные алгоритмы обучающихся нейронных сетей для мультиязычного синтеза речи (text-to-speech).

Инструмент Google Cloud Text-to-Speech предоставляет доступ к уникальной глубокой нейронной сети DeepMind WaveNet, используемой для озвучивания текста на многих языках в Google Assistant. Благодаря интеграции платформы Облачного КЦ и Google Text-to-Speech, заказчики КЦ получают возможность оказывать сервисы на более чем 30 языках, выбирая из нескольких синтезированных голосов. Использование технологии WaveNet помогает более естественному звучанию синтезированного текста, сокращая необходимость использования операторов.

«Интеграция Облачного КЦ и платформы синтеза речи от Google существенно облегчает создание интеллектуальных автоинформаторов (IVR)» – сказал Константин Кишинский, Президент и основатель компании BrightPattern.

«Возможности, предоставляемые Google и другими разработчиками систем синтеза речи помогают компаниям создавать все более совершенные сервисы самообслуживания, сокращая расходы контакт центров».

Интеграция с Google Cloud Text-to-Speech подтверждает направление на расширение интеграционных возможностей облачного сервиса, успешно реализуемое компанией BrightPattern в этом году.

CloudContact предоставляет сервис Облачного контакт центра на основе программной платформы ServicePattern компании BrightPattern. Используя сервис CloudContact, компании и организации могут существенно сократить расходы Контакт-центра, гарантируя предоставление качественно нового уровня обслуживания в сочетании с надежностью и безопасностью предоставляемых услуг.

AwesomeTTS (Google Cloud Text-to-Speech) [unofficial]

0.19MB. Updated 2020-10-20. Only supports Anki 2.1.x.

Description

This is an unofficial upload of the AwesomeTTS add-on with Google Cloud Text-to-Speech support added.

For more information about the AwesomeTTS add-on please see — https://ankiweb.net/shared/info/301952613

The main AwesomeTTS repository has a new maintainer now and a new AnkiWeb page with some changes and a few new services added, including Microsoft Azure — https://ankiweb.net/shared/info/1436550454

2020-10-20 About half a year ago Microsoft Azure added a number of high quality voices, e. g. en-GB-LibbyNeural. They might sound significantly better than Google Cloud Text-to-Speech. The free tier seems to be 0.5 million characters per month and $200 credit for the first 30 days.

https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/

https://azure.microsoft.com/en-us/pricing/details/cognitive-services/speech-services/

For Anki 2.1.20+ and AnkiMobile there’s also a built-in Text to Speech support — https://faqs.ankiweb.net/text-to-speech-support.html

Anki 2.1.29+ additionally includes cloze-only: template filter — https://changes.ankiweb.net/#/

> Add cloze-only: template filter, which can be combined with TTS to speak only the elided part.

For on-the-fly TTS on AnkiDroid see Text to Speech at https://docs.ankidroid.org/manual.html#_workarounds

If you’re doing your reviews on AnkiDroid or Anki 2.1, maybe consider replacing mp3 with ogg in the add-on’s source code.
> The quality of the encoding is considerably higher than MP3 while using approximately the same bitrate.
Please see the feedback from 09.03.2020 for how to do it.

HOW TO USE

1. Create an API key. It may look something like this:

1.1. Create a new project.
1.2. Add a valid payment method.
1.3. Create an API key.
1.4. Activate Google Cloud Text-to-Speech API.

For more information please see — https://cloud.google.com/docs/authentication/api-keys#creating_an_api_key

2. Paste it in the AwesomeTTS add-on.

ADDITIONAL INFORMATION

According to Pricing and Quotas & Limits, a monthly free tier for WaveNet voices is limited to 1 million characters (~23 hours). It looks like it can be temporarily increased via Google Cloud Platform Free Tier.

DEMO API KEY

The following API key can be still valid and can be used for testing as long as it doesn’t exceed 300 requests per minute and 1 million characters monthly free tier.

AIzaSyBm7NinfOuybtq-WWkcFMoiHHxMz60qxj0

With the latest update it’s also possible to use the Google API explorer key for a limited number of requests. For more information, please see https://github.com/kelciour/awesometts-anki-addon/pull/30

CHANGES

2019-02-20 Add Google Cloud Text-to-Speech
2019-07-09 Update the list of supported voices
2019-11-07 Add Mandarin Chinese to the list of supported voices
2019-11-07 Support 3-letter language code
2020-01-03 Fix «SSL: CERTIFICATE_VERIFY_FAILED» on macOS
2020-01-25 Fix on-the-fly TTS
2020-01-26 Add basic support for Anki 2.1.20 — https://apps.ankiweb.net/docs/beta.html
2020-02-03 Fix for Anki 2.1.20beta7
2020-02-04 Ignore AnkiDroid TTS tag — https://docs.ankidroid.org/manual.html#_workarounds (Text to Speech)
2020-02-23 Automatically populate the input field of the note editor dialog
2020-02-24 Switch from text to ssml
2020-04-11 Add audio device profile
2020-04-11 Fix Oxford Dictionary (thanks to @AntoineQ1)
2020-04-12 Fix service failed: ‘…’ attribute is required
2020-04-14 Preserve ‘config.db’ between the updates
2020-05-13 Tell which note failed to be processed (thanks to @evandrocoan)
2020-05-19 Disables the Anki progress bar before using our progress bar on Anki 2. 1.26 (thanks to @evandrocoan)
2020-05-25 Add missing parameters to fail= callback (thanks to @evandrocoan)
2020-05-31 Add support for Google API explorer key (thanks to @hieplpvip)
2020-06-08 Update Google Translate voices
2020-06-08 Update Google Text-to-Speech voices
2020-06-08 Fix «Error on my first review each time I flip the card» (thanks to @evandrocoan)
2020-07-05 Add «speed» option to Google Translate (thanks to @evandrocoan)
2020-07-12 Apply custom substitution rules before converting html to text
2020-09-17 Fix for Anki 2.1.28+
2020-10-18 Fix Wiktionary (No response for web request)
2020-10-20 Fix Wiktionary (Use ogg to find transcoded mp3 file)

SSML

For example, SSML can be used with cards that contain cloze deletions to add some silence or some sound instead of cloze deletion on the front side of the card by using «Tools — AwesomeTTS — Text — Handling … Text — Advanced» and replacing … with or https://actions.google.com/sounds/v1/alarms/beep_short.ogg»/> or with _____ to say «blank».

— https://i.imgur.com/nRnSBwX.png
— https://cloud.google.com/text-to-speech/docs/ssml#break
— https://cloud.google.com/text-to-speech/docs/ssml#audio
— https://developers.google.com/assistant/tools/sound-library/cartoon
— https://developers.google.com/assistant/tools/sound-library/#terms-and-conditions

ISSUES

Please submit any relevant issues here, by email or via GitHub — https://github.com/kelciour/awesometts-anki-addon/issues

NOTES

I was paid to make the initial version in 2019. All credit goes to Hieu who hired me and the AwesomeTTS team for all their work on the add-on and Krassowski in particular for updating the add-on for Anki 2.1.

This is pretty much a temporary upload for an easy install of AwesomeTTS add-on with Google Cloud TTS support.

2020-10-20 The above statement is no longer true. The add-on has a few existing issues that I’d like to fix someday, but it’s a lower priority at the moment, I’d need to figure out how to do it and it might take some time.

Nickolay

Download

As add-ons are programs downloaded from the internet, they are
potentially
malicious. You should only download add-ons you trust.

Supported Anki versions:

  • 2.1.0-2.1.26 (updated 2020-09-17)
  • 2.1.28-2.1.35+ (updated 2020-10-20)

To download this add-on, please copy and paste the following code
into Anki 2.1:

814349176

If you were linked to this page from the internet, please open Anki on
your computer, go to the
Tools menu and then Add-ons>Browse & Install to paste in the
code.

All Anki 2.1.x Add-Ons

Contact Author

Reviews


on
1612599392

Great!!!


on
1612423802

Cool!


on
1612382136
How can I remove the big icon?

I don’t remember any big icon in the add-on. Could you share a picture?

Maybe you installed a different add-on. Please go to Tools > Add-ons > AwesomeTTS and click View Add-on Page.


on
1612134189

Very useful


on
1611951614
Edit: Having disabled and reenabled the image resizer add-on it seems to work a treat now.

Thanks so much for this really awesome add on!

I’m a bit surprised that there’s a conflict with image resizer add-on, but either consider creating a new issue at https://github.com/kelciour/awesometts-anki-addon/issues with a little bit more information on what happens or the exact error message if it was shown, or reply here.


on
1611874415

Very good!!


on
1610703958

Was dreaming about this and here I found. Supper. Good work!!


on
1609270063

best


on
1608971832

Best add-on


on
1607243466

awesome thank you


on
1606709425
Uninstalled and reinstalled. Got the Patreon access key and still no sound plays. It worked on the old Anki update but not the new one. Not sure what happened but definitely doesn’t work for me.

— wrong add-on

Thank you for the downvote, but I think you’re talking about https://ankiweb.net/shared/info/1436550454

Though I do have my Patreon page — https://www.patreon.com/kelciour — created about a year and a half ago, but I didn’t post a link to it until now and didn’t share the API key through it. The only API key that I shared is listed on this very page and it’s only for Google Cloud Text-to-Speech.

I don’t use the above API key but its monthly free usage limit is limited and it might stop working at any moment, especially since it’d been posted quite a long time ago and might be used outside of the AwesomeTTS add-on. In the long run, it’s very much recommended to create your own API key if you have a regular (non-virtual) credit card. And by you I mean anyone.

Microsoft Azure service will be added later but I don’t know if I’ll share the API key for it too. Maybe not or maybe will do it temporarily through Patreon if I can limit it to monthly free usage :). But I’m not very interested to actively support or improve AwesomeTTS at the moment. I only did it because there was no other option. Though I’ll try to fix a few issues, once I could spare some free time, but it’s a very low priority.

About «no sound plays», I’m afraid I might not have enough information to identify where could be the problem. Maybe try to add some local audio file and play it with Anki. If you’re on Windows and there’s no sound, try to install the alternate Anki version. Maybe share a sample deck. Maybe try to use AwesomeTTS and preview some phrase in AwesomeTTS window. If you do hear some sound, maybe there’s a problem with the card template. If you use on-the-fly tts tags, maybe they’re not in the card template. If you use [sound:…] tags, for example, by batch generating from the card browser, maybe the field is not present in the card template.


on
1606615227

«To manually play on-the-fly <tts> tags, strike» option not working has been resolved. I used to assign the 5 and 6 on the numeric keypad to the front and back TTS playback respectively. However, 5,6 doesn’t seem to work, I assigned them to 8,9 and they played back correctly :)))


on
1606495739

I had a problem with short sounds. But now, I’ve realized it’s because of the wireless headset. I fixed it by playing a background sound when reviewing


on
1606438184

good


on
1606268575

muito melhor que o tradicional, nao tem mais palavras quebradas e robotizadas


on
1606093168

It really does well in adding audio.


on
1605815732

Great!


on
1605677721

nói chung xài được.tự động thêm audio


on
1605614407
thanks for this great add-on
but how can I get the playback on the back card instead of the front card?

Could you please elaborate a bit or contact my by email kelciour@gmail. com or by creating a new issue on https://github.com/kelciour/awesometts-anki-addon/issues

I don’t know if you’re aware of it, but https://ankiatts.appspot.com/usage might be helpful.

If you review on mobile, maybe mass generate audio from the card browser.
If you review on desktop, maybe enable on-the-fly playback.


on
1605582416
Thank you Nickolay for this wonderful add-on, would it be possible to update it with the spanish wavenet voice released recently? because it does not appear in the list 🙁

Thank you. It might take some time before the add-on will be updated. As for now, please either update or edit googletts.py with the following steps.

1. Anki > Tools > Add-ons > AwesomeTTS > View Files, go to the «awesometts\service» folder.

2. Save the following page as googletts.py and copy/replace it in the «awesometts\service» folder.

https://gist.githubusercontent.com/kelciour/bbf4346dfd4896884dfe15f86cda429d/raw/6b65824b22c0ca5b2696dd5b8437ec5d90ffa9bc/googletts.py

3. Restart Anki.

Alternatively, open «awesometts\service\googletts.py» in any text editor and replace or update _voice_list with

(«es-ES-Wavenet-B», «Spanish (es-ES-Wavenet-B)»),

while keeping the same number of spaces at the start of the line

https://gist.github.com/kelciour/bbf4346dfd4896884dfe15f86cda429d/revisions


on
1605258835
Unfortunately the pronunciations are British!!!
unbearable and nonsensical

Would you mind sharing a screenshot of your configuration?


on
1604315078
this add-on is awesome but can you add Microsoft azure??

Thank you. I added Microsoft Azure a few weeks ago locally so I could use en-GB-LibbyNeural voice, but it’s just some basic implementation without any extra options and https://ankiweb.net/shared/info/1436550454 already contains Microsoft Azure and might work just fine once you get the API key and there’s no need for me to update the add-on at the moment, but just let me know and I’ll upload it on GitHub and maybe will take some step-by-step screenshots on how to get the API key with the credit card.

It’s just I wanted to fix another issue before updating the add-on, I have some work to do and it’ll take some time before I’ll get back to AwesomeTTS and give it a try.


on
1604071030

Works very well. I added my Google Cloud Platform API key then generated the sound. Easy to use and implement if you are tech savvy.


on
1603978239
This is a wonderful addon. However, I’m struggling trying to configure AwesomeTTS and would appreciate some help. I would like the addon not to record certain words or signs. For example, if leter ‘f’ is alone it means for me that the word is feminine. Thus I would like the addon not to record and then not to read this ‘f’ letter that accompanies my note. However, I managed only to configure the program the way that it would remove all ‘f’ letters in a note, regarding whether it is alone or within a word. For instance, it won’t read ‘Female’ but ‘emale’. I don’t want to put unwanted words into brackets. I know doing it the way I want is possible because I managed to configure it that way a couple of years ago. Unfortunately, I’m unable to repeat my greatest IT achievement right now. Thanks for taking the time to read this.

EDIT: It works, thank you very, very much.

Try to replace \bf\b with nothing and check «regex». Here’s a picture — https://imgur.com/vD2dlD9

\b is a word boundary in regular expressions

https://ankiatts.appspot.com/config/text — Advanced Handling


on
1603188422
This is a really great addon! However, I am experiencing an issue with Wiktionary with «No response for web request» error. Is there any way to fix this?

Edit 18.10.2020: Thanks, it works with latest Anki update 2.1.35!

Edit 20.10.2020: Seems like it only works with English wiktionary. To reproduce: try using input ‘See’ with German wiktionary. The webpage has the audio file, but won’t add it. English, on the other hand, adds / plays the word just fine.

If you’re on Anki 2.1.28+, Wiktionary should work now.

Update 20.10.2020. Thank you for the example. The add-on was updated and should work with ‘See’ and German wiktionary


on
1603122678

good


on
1602884675
It looks good, I downloaded Anki application and AwesomeTTS addon but I couldn’t use.

I recommend https://text2speech.sysarticles.com/ , it can convert up to 140000 characters and download as mp3.

Best Regards


on
1602136992
https://ankiweb.net/shared/info/272311064

Awesome:: Remember ‘cloze:’ for any cloze fields.
Unrecognized [[c1::]] is Cloze

Can you identify [[c1 ::]] as Cloze so that you can just read the fill-in-the-blanks
Thank you. Just a suggestion.


on
1601287575

YOU ARE A GOD


on
1600732187

AwesomeTTS add-on allowed for different options and male/ female pronouciation on language studies, rather than just voice recording (as default I imagine). Thank you very much! I shall try it using it in the mobile app as well.


on
1600686236
I love the AwesomeTTS add-on, really appreciate the work being done to keep it running smoothly!

Recently, I’ve been having an issue, where I can’t use the ‘Ctrl+T’ shortcut to open the AwesomeTTS window while in the card editor in Anki. When I press ‘Ctrl+T’, the following message pops up;

Error
An error occurred. Please start Anki while holding down the shift key, which will temporarily disable the add-ons you have installed.
If the issue only occurs when add-ons are enabled, please use the Tools>Add-ons menu item to disable some add-ons and restart Anki, repeat until you discover the add-on that is causing the problem.
When you’ve discovered the add-on that is causing the problem, please report the issue on the add-ons section of our support site.
Debug info:
Anki 2.1.32 (dee7d45d) Python 3.8.0 Qt 5.14.1 PyQt 5.14.1
Platform: Windows 10
Flags: frz=True ao=True sv=1
Add-ons, last update check: 2020-09-17 11:57:33

Caught exception:
Traceback (most recent call last):
File «aqt\editor.py», line 342, in checkFocus
TypeError: launch() missing 1 required positional argument: ‘editor’

I have tested every single add-on that I use on anki by disabling them one by one, and restarting anki. However none of the addons seem to be causing the issue.

I am running Anki 2.1.33 (64 bit) on Windows 10.

EDIT: I think I had a previous version of the add-on installed. I uninstalled & re-installed. I don’t have the issue any more.

I can’t seem to reproduce the issue and can’t find any mentions of launch() in the code.

Maybe you’re using this version — https://ankiweb.net/shared/info/1436550454


on
1600220724

Love you so much hhh!!


on
1599994972

Thank you so much!


on
1599096020

Very useful!


on
1598976866
Hello, it is awesome that you made this feature. However, I get the following error when making a card:

Error
An error occurred. Please start Anki while holding down the shift key, which will temporarily disable the add-ons you have installed.
If the issue only occurs when add-ons are enabled, please use the Tools > Add-ons menu item to disable some add-ons and restart Anki, repeating until you discover the add-on that is causing the problem.
When you’ve discovered the add-on that is causing the problem, please report the issue on the add-on support site.
Debug info:
Anki 2.1.33 (3f403040) Python 3.8.0 Qt 5.14.2 PyQt 5.14.2
Platform: Mac 10.15.6
Flags: frz=True ao=True sv=1
Add-ons, last update check: 2020-09-01 17:40:50
Add-ons possibly involved: ⁨AwesomeTTS Google Cloud Text-to-Speech unofficial⁩

Caught exception:
Traceback (most recent call last):
File «/Users/roel/Library/Application Support/Anki2/addons21/814349176/awesometts/gui/templater.py», line 205, in accept
target = getattr(tform, now[‘templater_target’])
AttributeError: ‘Ui_Form’ object has no attribute ‘front’

Could you help me? Much appreciated!

I’m sorry, but I don’t know when the add-on will be updated with a fix. As a possible workaround, create a new preset and add it manually to the card template by using {{Front}} syntax. For more information, please see https://github.com/kelciour/awesometts-anki-addon/issues/40

It seems to be fixed in the official repository, but I haven’t tried it — https://github.com/AwesomeTTS/awesometts-anki-addon/issues/119 and https://ankiweb.net/shared/info/1436550454


on
1598653140

Very necessary!! Thank you!


on
1598554554

So awesome!!


on
1598464370

top


on
1598285630

Thaaaaaaaaaaaaaaaaaaank you!


on
1598202078

very helpful. thx!!


on
1598116507

You need to restart your program for this add-on to work


on
1597890860
I’d just like to know what happened with the feature whereby just clicking twice on a word and clicking again with the right button you could hear the selected word. and also I’m curious if there’s a way of stopping the autoplay on particular words and sentences.

It’s probably about the context menu. Be default, it’s probably hidden, but if you create a new preset, select a word and click the right mouse button, it’ll be there.

To add a new preset, open the AwesomeTTS window with a list of services, e.g. add a new note and press Ctrl+T or use Tools — AwesomeTTS — Manage Presets, select a service — and click Save

About the second question, the easiest way would be to generate audio using the AwesomeTTS and split a deck into two decks with a different options group. One with automatically play audio and another one without it.

Otherwise, I’d need a sample deck with a few cards in it and a bit of description what should be played and what should be skipped and it’s for Anki only or for AnkiMobile/AnkiDroid too. Maybe it’s something that can be done with JavaScript or maybe not.


on
1596980083

This add-on has literally saved me weeks of work manually adding audio. It took me a moment to get the settings right so it wouldn’t read my furigana and tildes and then to put the audio in the right field, but the end was perfect and only about 10 minutes of work. I highly recommend this to anyone wanting to add TTS to their cards.


on
1596796367

very good thanks


on
1596755173

Great add-on! Thank you so much!


on
1596739029
Thanks It’s Amazing thank you so much.
but there is problem .

Error
An error occurred. Please start Anki while holding down the shift key, which will temporarily disable the add-ons you have installed.
If the issue only occurs when add-ons are enabled, please use the Tools > Add-ons menu item to disable some add-ons and restart Anki, repeating until you discover the add-on that is causing the problem.
When you’ve discovered the add-on that is causing the problem, please report the issue on the add-on support site.
Debug info:
Anki 2.1.28 (7d8818f8) Python 3.8.0 Qt 5.15.0 PyQt 5.15.0
Platform: Windows 10
Flags: frz=True ao=True sv=1
Add-ons, last update check: 2020-08-06 09:23:46

Caught exception:
Traceback (most recent call last):
File «aqt\webview.py», line 35, in cmd
File «aqt\webview.py», line 121, in _onCmd
File «aqt\webview.py», line 536, in _onBridgeCmd
File «aqt\editor.py», line 412, in onBridgeCmd
File «C:\Users\ZBook\AppData\Roaming\Anki2\addons21\814349176\awesometts\gui\common. py», line 126, in _show
self._instance.show()
File «C:\Users\ZBook\AppData\Roaming\Anki2\addons21\814349176\awesometts\gui\generator.py», line 729, in show
super(EditorGenerator, self).show(*args, **kwargs)
File «C:\Users\ZBook\AppData\Roaming\Anki2\addons21\814349176\awesometts\gui\base.py», line 404, in show
dropdown = self.findChild(QtWidgets.QComboBox, ‘service’)
RuntimeError: wrapped C/C++ object of type EditorGenerator has been deleted

So far there’s no fix for it. If there’s a way to reproduce it, maybe post it on https://forums.ankiweb.net/t/awesometts-cause-an-error-when-used-in-a-new-note-form/921/5 or https://github.com/AwesomeTTS/awesometts-anki-addon/issues/102

At the moment, I can only suggest to not close the card browser, if you have it opened, while using the AwesomeTTS addon.


on
1596708065

sososososososo gooooood


on
1596118695

Very useful


on
1595774215
Thank you for absolutely great add-on. But the lastest version seem to have problem with Baidu translation. I could not add audio from baidu, other sources worked just fine.

I’m sorry, but I doubt I’ll be interested to do something about it anytime soon. I have a few delayed gigs on Fiverr that I need to finish first, but it’d take about a month or two for me to do, and a couple of Anki add-ons that I need to make too.

But if I’ll be paid, maybe it’s something that I can do in a few days or maybe a week.

I guess, it’s not about — https://fanyi.baidu.com — but — https://ai.baidu.com/tech/speech/tts_online

It won’t be a problem anymore to accept a pull request with a fix and update the add-on, but I don’t know if or when it’ll happen. In this case, maybe it’d be better to send it directly to the official AwesomeTTS repository — https://github.com/AwesomeTTS/awesometts-anki-addon

The official AwesomeTTS repository has an active maintainer now and a new AnkiWeb page and maybe it’s something that can be fixed. I suggest,
1. Disable or uninstall this add-on and install a new one from https://ankiweb.net/shared/info/1436550454
2. If it won’t work, it probably won’t work, create a new issue — https://github.com/AwesomeTTS/awesometts-anki-addon/issues


on
1595547277

muito bom


on
1595532895

Awesome


on
1595007911

Useful and worked fine on 2.1.26


on
1594743978

so nice!!


on
1594739714
Obrigado pela resposta. A ferramenta que você criou é muito útil e eu só tenho a lhe agradecer. Infelizmente as versões mais recentes do Anki e da Awesome TTS não funcionam no meu computador e eu tentei de tudo para fazer funcionar. Instalei o Anki 2.16 e o AwesomeTTS 16. Foi a única forma de conseguir que eles funcionem no meu computador. De toda maneira seu trabalho me ajuda muito. Obrigado.

It looks like the path to the Temp folder was changed by a different app and «C:\\Users\\Public\\Documents\\Wondershare\\CreatorTemp» doesn’t exist. I suggest to look up some tutorials online how to reset the location of the Windows TEMP directory, for example, https://answers.microsoft.com/en-us/windows/forum/all/reset-the-location-of-the-windows-temp-directory/c429e750-7796-4a33-87c7-a46fe2f4afe1
Maybe it’ll help.


on
1594225536
Very good work and a big THANK YOU!!!

The extension works very good and is very helpful.

Is it possible to make the Siri speeches of the various languages available in the drop-down menu? This would make it nearly perfect.

Update 2. Actually, the Anki manual is very likely the place where I read about Siri voices initially.

> On a Mac, you can customize the available voices:
> Open the System Preferences screen.
> …
> Some voices sound better than others, so experiment to choose the one you prefer. Please note that the Siri voice can only be used by Apple apps. Once you’ve installed new voices, you’ll need to restart Anki for the new voices to become available.
————————
Update. I forgot to mention the built-in TTS in Anki 2.1.20+ — https://docs.ankiweb.net/#/templates/fields?id=text-to-speech — but very likely the list of available voices will be the same on Mac.
————————
I don’t have Mac, but as far as I know, it may not be possible at the moment.

I suggest to open a new issue in the main AwesomeTTS repository — https://github. com/AwesomeTTS/awesometts-anki-addon/issues

This way you’ll be updated if it’ll be fixed in the future.

Just to clarify, I believe you’re talking about «OS X Speech Synthesis» or «say» — https://ankiatts.appspot.com/services/say

This comment from 2018 suggests that a few more voices can be added manually on Mac — https://gist.github.com/mculp/4b95752e25c456d425c6#gistcomment-2556766

> you can get the missing ones and more in Preferences > Accessibility > Speech, clicking the voice selector and in there Customize

but I have more faith in the recent StackOverflow post — https://stackoverflow.com/questions/61122378/make-the-say-terminal-utility-and-nsspeechsynthesizer-work-with-siri-voices

that says that

> there is hope this may eventually be implemented in a future version, which would be macOS Big Sur (11.0) at the earliest.


on
1593983423

perfectly! it works!


on
1593856937

it’s great, thanks !!!


on
1593505488

It’s a must-have if you are learning languages.


on
1593290094

This is just what I’ve been looking for


on
1593288439
This has been a great resource. Should we all switch to ATTS for 2.1 (1436550454) now though?

Yes, maybe, I don’t know. At the moment there’s no much difference aside from a few added or fixed services, but I’m not very interested in the add-on, won’t keep it in sync with the upstream repository (i.e. a new add-on), don’t want to spend free time on it and it’s unlikely the add-on will be updated in the near future. I wanted to add a few more commits and fix a few issues, but won’t have time to do it this month, it’s no longer a high priority and maybe it’ll be already fixed by the time I’ll be interested to spend time on it. If something got broken, though I doubt it’ll happen anytime soon, it should be possible for me to eventually fix it or accept a pull request.


on
1592586829

It’s very useful


on
1592572329

perfect


on
1592510452
Who is this new maintainer?
In Nickolay We Trust!

I don’t know. I’m mostly aware of him from a few his posts on Anki subreddit under username BakGikHung, at first about an year ago about AnkiReview that he’d developed as a companion app for AnkiDroid, then about half an year ago from a few posts about AwesomeTTS, and a bit later when he created a new issue — «will you merge back to AwesomeTTS?» — https://github.com/kelciour/awesometts-anki-addon/issues/8 — and a pull request — «Add Microsoft Azure Text To Speech service» — https://github. com/kelciour/awesometts-anki-addon/pull/7 — and about at the same time from the issue «Still active?» when he volunteered to be a new maintainer — https://github.com/AwesomeTTS/awesometts-anki-addon/issues/69

Back in 2019 I wasn’t interested in the AwesomeTTS add-on, but got hired to add Google Cloud Text-to-Speech and got paid more than I asked for. At that time, since the most work to update from Anki 2.0 to Anki 2.1 was already done by krassowski, I didn’t do much to update the AwesomeTTS codebase aside from a few minor changes and it wasn’t difficult to add a new service using the official API and by looking at other services as an example. It seemed to work fine for the majority of users and for about an year I wasn’t interested to improve it or fix a few issues and the add-on didn’t changed very much.

Everything changed in 2020, probably when AnkiWeb got updated to comply with the latest security standards, syncing stopped working for Anki 2.0 users and they switched to Anki 2. 1, and about at the same time Anki got updated to 2.1.20, the AwesomeTTS add-on got a bit broken and stopped working. The add-on was updated, I was interested to improve it a bit or fix some of the issues along the way, or some issues were easy to fix, and spent a bit of time doing it.

If it wasn’t me, considering the popularity of the add-on, maybe someone else would have updated the AwesomeTTS to keep it working and uploaded it on AnkiWeb. Or maybe everyone would have used the AwesomeTTS add-on maintained by lovac42 (awesometts-CCBC-addon) or maybe the built-in TTS that Damien added in Anki 2.1.20.

All in all, I think, it’s good that the AwesomeTTS repository has an active maintainer now, but I will try to keep the «unofficial» version updated every now and then, but aside from a few issues, that I’ll try to fix some time later, at the moment I’m not interested to fix broken or add new services, and for the most part it’ll be just updates for the list of available voices or bugfixes for existing issues or if something stops working, though I doubt it’ll happen anytime soon. And at the moment it’s unlikely I’ll be interested to keep it in sync with the upstream repository and the add-on won’t be updated if a new service will be added or something got fixed in the upstream repository.

In the end, thank you very much for the kind words and very positive feedback! I feel honored to receive it and I’m very happy. You made my day! Thank you again 🙂


on
1591913594

Auto explicativo


on
1591814650

I appreciate your effort in keeping this up-to-date. Thank you


on
1591656716

Thank you very much for this addon!


on
1591522659
Great , Duden doesn’t work, would be awesome to be replaced by dict. cc

Sorry, I won’t be interested to add more services anytime soon. The current support is pretty much limited to updating Google Text-to-Speech voices once in a while and unlikely will be changed anytime soon.

The official AwesomeTTS add-on has a new maintainer now and the add-on has a new AnkiWeb page — https://ankiweb.net/shared/info/1436550454

Maybe consider creating a new issue on https://github.com/AwesomeTTS/awesometts-anki-addon/issues


on
1591501094

To get the audio files to OGG please remember to: Tools > Check media > Delete unused files and then to clear the cache of AwesomeTTS: Tools > AwesomeTTS > Advanced > Caching > Delete files


on
1591425601
Thanks for your amazing work.

By the way, the instructions given by a previous comment in order to change from MP3 to OGG do work! However, the file extension is NOT changed to .ogg. But you’ll see a great improvement in the quality of the audio. Note that in old Android devices which cannot play OGG files this won’t work. You could still use AnkiWeb though.


on
1591177802
Dear developer,
This add-on is really beneficial and user-friendly. I appreciate for your efforts to keep it updated.
it would be a good idea if you can add IBM TTS to this add-on as well.
Best regards,
Amir

https://text-to-speech-demo.ng.bluemix.net/

Sorry, I don’t have much free time to spare and won’t be interested to add more services anytime soon. The current support is pretty much limited to updating Google Text-to-Speech voices once in a while and unlikely will be changed anytime soon.

The official AwesomeTTS add-on has a new maintainer now and the add-on has a new AnkiWeb page — https://ankiweb.net/shared/info/1436550454

Maybe consider creating a new issue on https://github.com/AwesomeTTS/awesometts-anki-addon/issues


on
1591063868

Thank you very much for the effort Exellent


on
1590998155
A bug?

The following problems were encountered:
— No speakable text is present
— The input file to transcode to an MP3 could not be found. Please report this problem if it persists.


on
1590995481

Thank you for bringing awesomeTTS to anki 2.1. It first prompted me to install mpv player to get the playback work, everything after that is all fine.
Also I have to thank you a lot for the API key.


on
1590814128

Please make the speech pause whenever there is a paragraph break or bullet points. At the moment everything is read out without pause, like it’s one long never-ending sentence, making comprehension of lists in notes difficult. But great add-on for single word pronunciation etc.


on
1590741588

awesome


on
1590442604

Google cloud text to speech option stopped to work, it keep returning me an error «Cannot preview the input phrase with these settings API key required to access googletts»


on
1590316431

Very good, without these addons my anki does not work.


on
1590248480

Excelente!


on
1590044430
Got a bug.

—————————
Anki
—————————
Cannot record the input phrase with these settings.

[Errno 2] No such file or directory: ‘C:\\Users\\Administrator\\AppData\\Roaming\\Anki2\\addons21\\814349176\\awesometts\\.cache\\youdao-d113d1b8-880e927d-5d75e3aa-e6c3f267-8701ce1d.mp3’
—————————
OK
—————————


on
1590031883

very good


on
1589892214

Ajuda a ouvrir frases e compreender outros idiomas


on
1589753174

sehr gute!


on
1589717576

Perfect !


on
1589528085

fabulous


on
1589417483
Hello Moderator,
How to find «config. db»?
Where is it located?

The add-on creates «config.db» with the default settings on the first run, i.e. after installing the add-on and restarting Anki. Usually, after opening the add-on’s source folder (Anki — Add-ons — AwesomeTTS — View Files), config.db could be found in «awesometts» subfolder, but on the latest version of the add-on config.db can be found in «user_files» subfolder.


on
1589404068

works very good


on
1589377771

Worked! Thanks!!


on
1589367216

Muito bom!!!


on
1589358735

So great, b/c adding sound can be automated.


on
1589115506

awesome indeed.


on
1588848395

Totally worth the effort of setting it up, best addon.


on
1588633196

it’s ok


on
1588610124

Top


on
1588005200

It’s awesome!!


on
1587851038

So good!


on
1587822509

Very very powerful ! thanks a bunch


on
1587637554

good


on
1587538124

good


on
1587466923

This add-ons may be useful. But when I use it to append voice to my new words(English,Japanese). There are some errors happened. Like ‘request got andio/x-bd-bv Content-Type for web request; wanted audio/mp3’


on
1587447140

jjjjj


on
1587216800
I love this addon, it helps me so much while learning Korean and English. Unfortunately, since the last updated, I lost my preset voice and more importantly, I get this message

‘Cannot preview the input phrase with these settings.
‘API Key required to access googletts»

when I try to record a word or sentence.

Someone could help me with this, please.

I’m sorry about the voices, it’s been fixed and shouldn’t happen again.

If you didn’t sign up for an API key last time and didn’t take a photo of your credit card, you probably added the API key that is listed on the add-on’s page.


on
1587157926
Magnificent…

Have also made my cards alternate between voices, male/female and A/C B/D

Feels so great, so much better than all other TTS I’ve seen

THANK YOU!


on
1587134047

This is what I was looking for. Thank you!


on
1587018418

Good!


on
1586899591

Perfect. This add-on should become new «official»


on
1586880404

Works excellent. Thank you


on
1586853561

Best add-on in the world!!!


on
1586793971
it works on Mac OS Catalina version 10. 15.4 but the shortcut Cmd T still not working

I can’t test the add-on on Mac OS but maybe you have another add-on with the same Cmd+T shortcut. Maybe try to disable all add-ons except this one to see if it helps or not.


on
1586784253
Awesome and I’m so pleased to have the opportunity to learn with this module since google tts is a game changer.

Unfortunately I experiened an inconvenience: today and two days ago AwesomeTTS was updated and I lost my AwesomeTTS service presets after the updates.

I’m sorry about that. I’ve added a quick fix for it and updated the add-on. The following updates should keep the settings but unfortunately not this time. As a workaround, before updating the add-on open Tools — Add-ons — AwesomeTTS . .. — View Files — open ‘awesometts’ folder, i.e. 814349176\awesometts, and copy ‘config.db’ on your desktop, then use Tools — Add-ons — Check for Updates to update the add-on, after that close Anki and copy ‘config.db’ from your desktop to ‘..\user_files’, i.e. 814349176\user_files, then open Anki.


on
1586763573

It does work


on
1586747017

It works


on
1586735471

It’s super useful and besides it works flawlessly!


on
1586723043

I’ve been looking for add-ons to enhance my experience and this is the most useful out of those I’ve tried


on
1586707484

really beneficial!


on
1586644676

Easy to install easy to use!


on
1586192599

Works great, thank you 🙂


on
1586013750

Vote for this new «official» one!


on
1585976512

Very useful for me. Tks bro.


on
1585149297

worked with mac, put it on the OS sound synthesis voice. Had to configure the service.


on
1585000975

good add-on


on
1584516165

easy to use


on
1584316070

2.1 버전에서 사용해본 결과 아주 만족스럽습니다.


on
1584291214

excellent!! works perfectly with the updated anki and has multiple languages and multiple voices very very good, so happy I found this


on
1583951050

awesome~
works with latest version


on
1583908813

Helpful for language review and studying audio-only!


on
1583707217
I would like to suggest a change that’s will make the quality of the sound much much better and even will make the mp3 file less size.
(changing the audioEncoding type)
in this file «googletts.py» which is in this path «\Anki2\addons21\814349176\awesometts\service»
we are going to change this line
«audioEncoding»: «MP3»
to
«audioEncoding»: «OGG_OPUS»

TA-DA….done

Thanks! I’ve added it in the description. Unfortunately, I can’t make it a default one since iPhone still doesn’t officially support OGG yet and AnkiMobile can’t play it too.


on
1583692383

very good


on
1583629863

Thank you! It’s so cool!


on
1583304539

Awesome, thanks!


on
1583261719

This is a game changer for making anki cards


on
1582884448

Works great, except ImTranslator.
I think ImTranslator stopped working about a month ago, on any version of AwesomeTTS.
Shows: «unable to fetch page from ImTranslator even after multiple attempts.» Can you fix this?


on
1582767496

muito bom


on
1582429423

Toll!


on
1582072447
Works so well!

Any idea of how I would systematically replace all audio in a deck with AwesomeTTS?

I’m using the Domino Chinese deck, it’s great but it’s all old computer generated, and the updated voices would be brilliant.
Any tools or add-ons you can recomend to make that happen? thanks

Sorry for the late reply. I guess, it can be done without any extra tools just using the add-on from the card browser by overwriting the destination field with media filename if it contains only sound tags — https://ankiatts. appspot.com/usage/browser — or by removing existing sound tags before generating new audio — https://ankiatts.appspot.com/usage/removing


on
1582048857
The add-on works great! Thank you.
The only thing I can’t figure out for myself ( and I’m an inexperienced user 🙂 is to apply this great add-on for my little project.
I need to place in the question field of the card a sentence from an English book. And I want it to be read by ttc when the card is opened
I’ve tried to add {{tts en_US:Field}} as per Anki manual to the top field of the card’s template, but for some reason Windows 10 TTS didn’t work for me when opening the card.
I tried different kinds of cards template with the same negative result. I thought then, that maybe I could record the voice from Awesome TTS, but couldn’t do it either. Maybe you could advise me of any solution.
Thank you !

Sorry for the late reply. If you’re on Anki 2.1.20, maybe you don’t have any voices installed. It can be done using Win -> Speech settings -> Manage voices — Add voices.

About Awesome TTS, I’m afraid, I need more information, but usually it can be done by opening the card browser, selecting a few cards, clicking on menu AwesomeTTS — Add Audio to Selected — https://ankiatts.appspot.com/usage/browser

As a side note, if an English book has an audiobook read by a native speaker, I might have a few Anki add-ons in a few weeks that will allow to split text by sentences and add audio from the audiobook.


on
1581861860

Very useful addon!


on
1581836943

Thank you so much for your effort. Love it 😊


on
1581744119

Awesome applicability!
I might be missing something, but in past add-ons (this was a few years ago), there was a way to automatically add (and bulk-add) the TTS to the card. This one is working great, but I have to individually add the audio each time. Is there a way to work around this? (EDIT: I figured it out by clicking command + T in the browser, which allowed bulk adds. Thanks again for the tool!)


on
1581621954

Working perfectly with 2.1.20


on
1581545908
I started using your add-on yesterday, but I noticed that a feature from my old AwesomeTTS is not working: «AwesomeTTS will automatically populate the input field of the note editor dialog with whatever was already in the active note field when you opened the dialog. »

Thank you. It’s been fixed. Please use Tools — Add-ons — Check for Updates and restart Anki.


on
1580725545
The pre-record function works well but on-the-fly still doesn’t work on Mac.

Is there any error or something? It seems to work fine on Windows & Ubuntu, but it was just one line change and maybe there’s something else that needed to be updated.

As an alternative, since you’re on Mac, maybe try Anki 2.1.20 with built-in on-the-fly TTS support — https://apps.ankiweb.net/docs/beta.html

> You can now use {{tts en_US:Field}} on your card templates to use the text to speech support built into Windows and macOS, changing the language code as necessary.
> You can specify the voices you’d prefer — the first available one will be used. Eg. {{tts ja_JP voices=Apple_Otoya,Microsoft_Haruka:Field}}. The voices you specify must match the language.
> Adding {{tts-voices:}} to your template will show all available voices.


on
1580424953

Excellent plugin for Anki! Thank you for your efforts.


on
1580146368
Thank you. It was very helpful.
However, audio is not played on synchronized smartphones. What should I do to shed it?

I assume it’s not about on-the-fly TTS tags since I doubt they’ll work on mobile without some modifications to the card template and it’s about [sound:…] tags that were added for example from the Add or Edit window or by using AwesomeTTS — Add Audio to Selected in the card browser. In this case, everything should work fine on mobile if it works on desktop, all devices are in sync and media were synced too, i.e. Anki 2.1 — Tools — Preferences — Network — «Synchronize audio and images too» and AnkiDroid — Preferences — «Fetch media on sync» or AnkiMobile — Preferences — «Sync Sounds & Images» weren’t manually disabled and Anki 2.1 — Tools — Check Media doesn’t report any missing files in the collection.media folder.


on
1579777540

good


on
1579571401

Works great with wavenet. Code changes look reasonable too. Some things are still broken in 2.1.x but I’ll send PRs if I need anything.


on
1579446794

for a few hours, I get it and make it successful.
Thank a lot for your effort. I was upset when awesomeTTS ( google translate) does not work with the newer anki until I read this instruction


on
1579432116

This is one of the best Anki add-ons I have used.
and support from the developer is very good and fast.
Thank you for your great work man.


on
1579367759

Thanks!


on
1579292478

Thanks very much , this is the only app I can found that can do this job ( Google Cloud TTS) , not only that it do the job very well and also free !! thanks so much man , Keep the good work , I didn’t know any thing about Ankiweb or the application only when I found this addson at Google search .


on
1579287600

Most valuable thing on the addon list.


on
1579182664
Hello,
is it possibe to add https://www.dict.cc/ to Awesome TTS addon, here is how I get the audio manually from the site:
1-I clich «Optionen» under the search square or on this link https://www.dict.cc/dict/options.php
2-I scroll down from the left menu, under «Sprachausgabeformat» I choose «wav» instead of «mp3» and then click «Optionen Speichern»
3-After that I search the words I need and I can download the audio manually using «internet Download Manager»

Thank you for asking but I can’t do it. Everything is possible but it takes time and at the moment I can’t spend time on anything that of no interest to me.


on
1579020152

Works OK on Windows 10 and Ubuntu. Thanks for your efforts.


on
1578668278
5 of the 12 notes you selected were processed. During processing, 4 notes were successfully updated, but 1 note failed while processing.
The following problem was encountered:
HTTPSConnectionPool(host=’texttospeech.googleapis.com’, port=443): Max retries exceeded with url: /v1/text:synthesize? key=AlzaSyBm7NinfOuybtq-WWkcFMoiHHxMz60qxjO (Caused by SSLError(SSLE0F£rror(8, ‘EOF occurred in violation of protocol (_ssl.c: 847)’),)) (1 time)
You aborted processing. If you want to rollback the changes to the notes that were already processed, use the Undo AwesomeTTS Batch Update option from the Edit menu.

thank you very much:) appreciate your work


on
1578240717
This is amazing! Still has some bugs (regular OSX Speech doesn’t seem to work for me), but as this is new, completely understandable.

The add-on’s been updated and OSX Speech I guess should work now too. In addition, Anki 2.1.20 comes with built-in TTS support.

> Changes in 2.1.20beta3 (95b497cc)
> You can now use {{tts en_US:Field}} on your card templates to use the text to speech support built into Windows and macOS, changing the language code as necessary.

For more information please see — https://apps.ankiweb.net/docs/beta.html


on
1578069750
I am sorry ı got thıs eror durıng google translate ın my Mac.

Cannot record the input phrase with these settings.

<urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:847)>

but ı works wtıh the apı above ın google cloud speech. Can you help about thıs ıssue. Today I delet thıs app accıdentally and reınstall ıt. After reınstall ı get thıs message. Thank you very much.

03-01-2020 thank you very much after update it is working now- Thanks again

Firstly, it’s okay to use the provided API key if it works. My credit card is no longer valid but somehow the API key is still working. Secondly, I’ve updated the add-on. It should work now but maybe I missed something. Please go to Tools — Add-ons — Check for Updates, restart Anki and let me know if it works or not. And lastly, thank you for not using the downvote button to report about the issue!


on
1577070950

In my installation under Linux works great. Thanks for adapting it to 2.1


on
1576225439

Very helpful for languages


on
1575765468
I get the following error. Also, I no longer see the field where I am to put the API_Key. Any thoughts on why I get this error? Do we still need to manually input the API Key? I don’t see where in Anki we do this?

Thanks for your advice …

Doug

==== Error ===
<urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:847)>

Please make sure that Google Cloud Text-to-Speech is selected, not Google Translate or any other TTS service, the API Key field should be there.
—————
The add-on had been updated and it should work now with Google Translate too.


on
1575745660

It’s working!


on
1575073858

Google Cloud Text-to-Speech is absolutely better. I wholeheartedly wish this addon become Official!! Thanks for making it!!


on
1574829075
Anki 2.1.11 (3cf770c7) Python 3.6.7 Qt 5.12.1 PyQt 5.11.3
Platform: Windows 10
Flags: frz=True ao=True sv=1

Caught exception:
File «C:\Users\BryantJialu\AppData\Roaming\Anki2\addons21\814349176\awesometts\gui\templater.py», line 201, in accept
tform = self._card_layout.tab[‘tform’]
<class ‘AttributeError’>: ‘CardLayout’ object has no attribute ‘tab’

It took a while but the add-on finally has been updated and it’s been fixed. In addition, Anki 2.1.20 comes with built-in TTS support.

> Changes in 2.1.20beta3 (95b497cc)
> You can now use {{tts en_US:Field}} on your card templates to use the text to speech support built into Windows and macOS, changing the language code as necessary.

For more information please see — https://apps.ankiweb.net/docs/beta.html
—————
Thanks for the report! I don’t know when it’ll be fixed and at the moment can only suggest to generate audio using the browser window.


on
1574571597

Great!


on
1574534085

very good


on
1574279282

ready


on
1573938180

great, thank you!


on
1573211401

非常好用的tts插件,让我的例句有了十分优质的发音,感谢您!!!


on
1572439138

Amazing !!!!!!!!!!!!!


on
1572196088

excellent


on
1571900664

works awesome!! thank you mate


on
1570963133

very nice!


on
1570555624

Funciona !!


on
1570445710

muito bom


on
1569744874

I love it.


on
1569659811

awesome! thank you!


on
1568441690
For those who want to make this work with Chinese, go to /addons/awesometts/service/googletts.py

And add these elements in _voice\_list array:

(«cmn-CN-Standard-A», «Mandarin Chinese, China (cmn-CN-Standard-A)»),
(«cmn-CN-Standard-B», «Mandarin Chinese, China (cmn-CN-Standard-B)»),
(«cmn-CN-Standard-C», «Mandarin Chinese, China (cmn-CN-Standard-C)»),
(«cmn-CN-Wavenet-A», «Mandarin Chinese, China (cmn-CN-Wavenet-A)»),
(«cmn-CN-Wavenet-B», «Mandarin Chinese, China (cmn-CN-Wavenet-B)»),
(«cmn-CN-Wavenet-C», «Mandarin Chinese, China (cmn-CN-Wavenet-C)»),
And then change the number 5 to 6 in this line:

«languageCode»: options[‘voice’][:6],

I’m not a python programmer so this solution is kinda dirty. But that’s just because the design isn’t perfect. The reason why you need to add 1 is that it’s parsing the string based on the first 5 characters of the voice name like en-us for example but for Chinese it’s cmn-CN, which is a character longer. Maybe someone can make this dynamic.


on
1568425189

Let’s make this the official AwesomeTTS version and deprecate others please. Also my understanding is that this is the repository: https://github.com/kelciour/awesometts-anki-addon


on
1567958679

Very useful, great for language learning decks, with all the available languages that Google offers


on
1567673314

Awesome, thanks so much for sharing this.
U r the life saver.


on
1567604392

Perfect!


on
1567354667

Useful addition.


on
1566820707

good!!!!


on
1566755925

Thank you. Seems to be working fine for me so far 🙂


on
1566153678

It’s very helpful


on
1565826431

Really good!


on
1565571912

Just added audio to 5000 french cards using Google Text-to-Speech, with a nice sounding WaveNet voice 🙂


on
1565518265

nice


on
1565271465

excellent, works perfectly


on
1565195707

Ctrl + T works!
I LOVE YOU!


on
1564106493

Works really well, and the WaveNet voices are amazing!


on
1563925519

ty


on
1563728752

I’ve been waiting for properly working text to speech add-on for Anki 2. 1 for so long. This work like a charm. Thank you for your work.


on
1561147306

Great!


on
1560808254

good


on
1559905855

Great, thanks!


on
1559206223

Works perfectly with the given API key


on
1558511459

thanks


on
1558428411
No instructions for getting to step 2; configuration???? WTF

Please be more specific. As far as I can remember, I went to this page https://cloud.google.com/text-to-speech/ and clicked on «Try It Free» to get an API key.


on
1557030693

Would it be possible to add Google Cloud support/this add-on support for Anki 2.0.x? Many of the japanese voices (like naver translate, etc) have stopped working and the remaining ones sound like robots.
Can’t shift to 2.1 as there are many important add-ons.


on
1556536390

Very good!!


on
1556495783

Works great!


on
1555582949

Большое спасибо!


on
1555507852

I don’t use Anki 2.1, but I’m giving a thumbs up because someone took the time to make this port and upload it for free. Also I might just download Anki 2. 1 because there is support for the Google Cloud TTS.


on
1555316497

Only this version of AwesomeTTS could be installed in my pc and still works fine with my newly installed anki 2.1.1. And so far, except some errors popup occasionally and some of the dictionary datasets are not accessible, all is fine.


on
1554643324

Works great, thank you!


on
1554498264

I need this plugin. Thank you for making it available.
[update] — Is it possible to have volume option?


on
1554025771

Lifesaver!! thanks! Hope chinese will be released!


on
1553502096
Nice and better than the other one for Anki 2. 1. But 2 bugs I found for now:

• CTRL+T doesn’t work when selecting a one card in the browser. Works with several cards selected (at least 2).
• The groups fail to display presets in submenu. All the presets are shown at the top of the context menu instead and the group entries are shown in the bottom of the same menu.

It’s an awesome and useful addon for languages learning. Thanks for this improvement and update.


on
1552803767

Perfectly work!


on
1551372364

its so great


on
1550898332

It woks perfectly. Thank you for this cool job.


on
1550846957

Good things got better!
Really useful!
Thank you for your work 🙂


on
1550703611
Cannot preview the input phrase with these settings.

403 Client Error: Forbidden for url: https://texttospeech.googleapis.com/v1/text:synthesize?key=AIzaSyBoJ_L_E-A_ …

Make this -> https://cloud.google.com/iam/docs/understanding-roles#primitive_role_definitions

And
it is necessary to activate Api for this error: https://cloud.google.com/text-to-speech/docs/quickstart-protocol

It looks like Google Cloud Text-to-Speech API haven’t been enabled for a project associated with this API key.
———————
It looks like it’s not possible to enable Google Cloud Text-to-Speech API without providing a valid payment method, i.e. you need to create a billing account and maybe sign up for GCP Free Tier — https://cloud.google.com/free/docs/gcp-free-tier
«Even though you set up a billing account, you won’t be charged unless you upgrade to a paid account.»

My billing account had been closed, it’s not valid anymore, but it looks like it’s still possible to continue to use Google Cloud Text-to-Speech API if it’s already been activated. I’ve updated this page and added an API key that I’ve used for testing.


on
1550626106
Google Cloud TTS makes a huge difference. The app turns from «great» to «magnificent». Thank you very much!!!

No problem, but that’s not entirely my doing as I’ve been paid to make this happen sooner than later and AwesomeTTS team have done an amazing work to make it so much easier to add any new TTS service without knowing anything about how Anki works.

Как настроить синтезатор речи Google на Android

В то время как Google фокусируется на Помощнике, владельцы Android не должны забывать о функции синтеза речи (TTS). Она преобразует текст из Ваших приложений для Android, но Вам может потребоваться изменить его, чтобы речь звучала так, как Вы этого хотите.

Изменение синтеза речи легко сделать из меню настроек специальных возможностей Android. Вы можете изменить скорость и тон выбранного Вами голоса, а также используемый голосовой движок.

Синтезатор речи Google — это голосовой движок по умолчанию, который предварительно установлен на большинстве устройств Android. Если на Вашем Android-устройстве он не установлен, Вы можете загрузить приложение Синтезатор речи Google из Google Play Store.

Цена: Бесплатно

Изменение скорости речи и высоты тона

Android будет использовать настройки по умолчанию для Синтезатора речи Google, но Вам может потребоваться изменить скорость и высоту голоса, чтобы Вам было легче его понять.

Изменение скорости речи и высоты тона TTS требует, чтобы Вы попали в меню настроек специальных возможностей Google. Шаги для этого могут незначительно отличаться, в зависимости от Вашей версии Android и производителя Вашего устройства. В данной статье используется устройство Honor 8 lite, работающее на Android 8. 0.

Чтобы открыть меню специальных возможностей Android, перейдите в меню «Настройки» Android. Это можно сделать, проведя пальцем вниз по экрану для доступа к панели уведомлений и нажав значок шестеренки в правом верхнем углу, или запустив приложение «Настройки» в своем списке приложений.

В меню «Настройки» нажмите «Управление», а оттуда «Специальные возможности».

Выберите «Синтез речи».

Отсюда Вы сможете изменить настройки преобразования текста в речь.

Изменение скорости речи

Скорость речи — это скорость, с которой будет говорить синтезатор речи. Если Ваш TTS движок слишком быстрый (или слишком медленный), речь может звучать искаженно или плохо для понимания.

Если Вы выполнили вышеуказанные действия, Вы должны увидеть слайдер под заголовком «Скорость речи» в меню «Синтез речи». Проведите пальцем вправо или влево, чтобы повысить или понизить скорость.

Нажмите кнопку «Прослушать пример», чтобы проверить новый уровень речи.

Изменение высоты тона

Если Вы чувствуете, что тон преобразованного текста в речь слишком высок (или низок), Вы можете изменить это, следуя тому же процессу, что и при изменении скорости речи.

Как и выше, в меню настроек «Синтез речи» отрегулируйте ползунок «Тон» в соответствии с желаемой высотой тона.

Когда Вы будете готовы, нажмите «Прослушать пример», чтобы попробовать новый вариант.

Продолжайте этот процесс, пока Вы не будете довольны настройками скорости речи и высоты тона, или нажмите «Сбросить скорость речи» и/или «Сбросить настройки тона», чтобы вернуться к настройкам TTS по умолчанию.

Выбор голоса синтезатора речи

Вы можете не только изменить тон и скорость своего речевого движка TTS, но и изменить голос. Некоторые языковые пакеты, включенные в стандартный движок Синтезатор речи Google, имеют разные голоса, которые звучат как мужской, так и женский.

Если Вы используете Синтезатор речи Google, нажмите кнопку «i» рядом названием.

В меню «Настройки» нажмите «Установка голосовых данных».

Нажмите на выбранный Вами язык.

Вы увидите различные голоса, перечисленные и пронумерованные, начиная с «Голоса I». Нажмите на каждый, чтобы услышать, как он звучит. Вы должны убедиться, что на Вашем устройстве включен звук.

Выберите голос, который Вас устраивает в качестве Вашего окончательного выбора.

Ваш выбор будет автоматически сохранен, хотя, если Вы выбрали другой язык по умолчанию для Вашего устройства, Вам также придется изменить его.

Переключение языков

Если Вам нужно переключить язык, Вы можете легко сделать это из меню настроек Синтеза речи. Возможно, Вы захотите сделать это, если Вы выбрали язык в Вашем движке TTS, отличный от языка Вашей системы по умолчанию.

Вы должны увидеть опцию «Язык». Нажмите, чтобы открыть меню.

Выберите свой язык из списка, нажав на него.

Сторонние движки синтезатора речи

Если Синтезатор речи Google Вам не подходит, Вы можете установить альтернативные варианты.

Их можно установить из Google Play Store или установить вручную. Примеры движков TTS, которые Вы можете установить, включают Acapela и eSpeak TTS, хотя доступны и другие.

Цена: Бесплатно Цена: Бесплатно

После установки из Google Play Store эти сторонние движки TTS появятся в Ваших настройках синтезатора речи.

Изменение движка синтезатора речи

Если Вы установили новый движок преобразования текста в речь и хотите его использовать, перейдите в меню настроек «Синтезатор речи».

Вверху Вы должны увидеть список доступных Вам движков TTS.

Нажмите на предпочитаемый Вами движок.

Выбрав новый движок TTS, нажмите «Прослушать пример», чтобы проверить его.

Для большинства пользователей стандартный текстовый движок Google будет предлагать лучшее звучание речи, но сторонние приложения могут лучше работать для других языков, где движок по умолчанию не подходит.

Как только Ваш движок и язык выбраны, Вы можете свободно использовать его с любым приложением для Android, которое его поддерживает.

Text-to-Speech (TTS) Engine Search for Android




Text-to-Speech (TTS) Engine Search for Android



Несколько поставщиков предоставляют речевые синтезаторы (двигатели TTS) для
системы Android, и каждый из них может поддерживать разные языки с
различными качествами голоса.

Ниже приведен список имен генератора речи и ссылки, которые мы знаем на
момент написания этой статьи.
Пожалуйста, посетите их страницы, чтобы узнать, какие языки они поддерживают,
цены и т. Д.


  • Google TTS

    Установите сначала, если он отсутствует
    на вашем устройстве.



    Бесплатно, теперь предварительно установленный на большинстве устройств
    или доступен для загрузки из Google Play.
    Среднее качество, если не используется генерация сетевой речи.

  • Vocalizer TTS


    Хорошие качественные голоса, вам нужно купить каждый голос, который вы хотите
    использовать в долгосрочной перспективе, но они позволяют вам
    пробовать каждый голос бесплатно в течение 1 недели, прежде чем
    принимать решение о покупке.

    Включает хорошие русские голоса.


  • Acapela

    Бесплатное приложение,
    голоса для покупки.


    Среднее качество, включает русские голоса.



  • RHVoice


    Бесплатный двигатель TTS и голоса. В настоящее время поддерживаются
    языки (в будущем их будет больше): Английский (США), эсперанто,
    грузинский, кыргызский, португальский (Бразилия), русский, татарский и
    украинский. Самые качественные голоса в RHVoice на русском языке.

  • CereProc TTS


    Голоса хорошего качества доступны в Google Play.


  • SVOX Classic

    Бесплатное приложение,
    голоса для покупки. Хорошее качество.


  • eSpeak Free
    Очень
    плохое качество, «голос
    робота»,
    но может
    говорить очень быстро, если
    вы научитесь понимать его.
    Более чем 40 языков


  • Hear2Read

    Предоставляет бесплатные голоса TTS для индийских языков (каннада,
    телугу, пенджаби, тамильский, гуджарати, маратхи, санскрит,
    может
    быть, больше в будущем).



    Хорошее
    качество.


  • Eloquence TTS


    Для покупки. Роботизированный звук, но ценен для некоторых людей, потому
    что он может говорить очень быстро. 10 языков включены с одной покупкой.


  • SpeechLab (Только
    болгарский язык, для покупки)
    SpeechLab
    2.0 является высокое качество
    болгарского текста
    в речь, разработанной
    Болгарской Ассоциации компьютерной лингвистики.


  • Aharon Hebrew TTS


    Бесплатная демоверсия ивритского голоса, актуальный продукт для покупки.
  • Samsung TTS

    Поставляется только с
    устройствами Samsung. От среднего до хорошего качества.
  • IVONA


    Больше не доступно
    в Google Play.


    Amazon купила компанию Ivona и удалила продукты из Google Play.
    Был бесплатным во
    время бета-тестирования.
    Превосходное качество.
  • Pico TTS Engine by SVOX

    Бесплатный,
    приходит только с некоторыми
    версиями Android, например,
    CyanogenMod, или
    искайте

    в Интернете.

    Среднее качество.

    Языки:
    английский,
    французский,
    немецкий, итальянский, испанский

 Если вы
знаете еще
другие
двигателя

генераторов
речи для Андроида
(Text To Speech Engines, TTS Engines),
не перечисленные здесь,
пожалуйста, напишите нам по
адресу, указанному на нашем
цтранице
«Контакты».



Deploying Google-Cloud-TTS-Rails with Heroku

 

 

Google Cloud Text-to-Speech Rails supports select TEXT or SSML, and three conversion formats:

  1. MP3 (MPEG Audio Layer III)
  2. WAV (LINEAR16)
  3. OGG (OGG_OPUS).

Languages Google Cloud Text-to-Speech Rails supports:

  • Dansk (Danmark)
  • Deutsch (Deutschland)
  • English (Australia)
  • English (Great Britain)
  • English (India)
  • English (United States)
  • Español (España)
  • Français (Canada)
  • Français (France)
  • Italiano (Italia)
  • Nederlands (Nederland)
  • Polski (Polska)
  • Português (Brasil)
  • Português (Portugal)
  • Suomi (Suomi)
  • Ελληνικά (Ελλάδα)
  • Русский (Россия)
  • Українська (Україна)

 

 

In order to deploy to Heroku, you need to have an account with them. If you haven’t, click here to sign up. Before you can deploy to Heroku, Git and Heroku toolbelt should have already installed.

Now you need to get a JSON file that contains your key to access API Google Cloud Text-to-Speech.
Follow these instructions.

Then:

git clone https://github.com/cmirnow/Google-Cloud-TTS-Rails.git
cd Google-Cloud-TTS-Rails

Ok, put YOUR_KEY_NAME.json into the root of the directory Google-Cloud-TTS-Rails now.

Next:

git add .   
git commit -m "my first commit"
heroku create
git push heroku master
heroku run rake db:migrate

Go to Heroku.com administration panel, YOUR_NEW_APPLICATION -> ‘Settings’ -> ‘Reveal Config Vars’ and add a new key/value lines:

key: GOOGLE_APPLICATION_CREDENTIALS
value: YOUR_KEY_NAME.json

key: DOMAIN_NAME
value: YOUR_HEROKU_DOMAIN ### i.e 'https://***************.herokuapp.com' without quotes.

key: GMAIL_USER_NAME
value: YOUR_GMAIL_LOGIN

key: GMAIL_PASSWORD
value: YOUR_GMAIL_PASSWORD ### (An App Password is a 16-digit passcode that gives an app or device restricted access to your Google Account without having to divulge your personal password and complete access to your Google Account). 

Everything working? Great. Now open your new application in a browser and click ‘Sign Up’. Register and you can start converting text to sound.


 

Paid support service

This article contains a comprehensive list of steps required to deploy Google-Cloud-TTS-Rails to Heroku. However, if you fail, I can do it for you.

The cost of the service is 5€. Please transfer this amount to my paypal (Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.), then send me:

  • Access to your Heroku account.
  • JSON file that contains your key to access API Google Cloud Text-to-Speech.
  • Your email.

Thank you for your interest!
Yours truly,
Aleksei

 

google-tts-api — npm

Google TTS (преобразование текста в речь) для node.js

Установка

 $ npm install --save google-tts-api
$ npm install -D typescript @ types / node # Только для TypeScript 

История изменений

См. ИЗМЕНЕНИЕ.

Использование

Метод Опции (все опционально) Тип возврата Обработка длинного текста
getAudioUrl язык , медленный , хост строка
getAudioBase64 lang , slow , host , timeout Обещание <строка>
getAllAudioUrls lang , slow , host , splitPunct {shortText: строка; url: строка; } []
getAllAudioBase64 lang , slow , host , timeout , splitPunct Обещание <{shortText: string; base64: строка; } []>

Опции (все по желанию)

Опция Тип По умолчанию Описание
язык строка en-US Смотрите весь доступный языковой код на https: // cloud. google.com/speech/docs/languages
медленная логическое ложь Используйте медленную скорость звука, если установлено slow true
хост строка https://translate.google.com Вы можете изменить хост , если хост по умолчанию не может работать в вашем регионе (например, https://translate.google.com.cn).
таймаут номер 10000 (мс) (Только для getAudioBase64 и getAllAudioBase64 ) Установите время ожидания для HTTP-запроса.
сплит-трубка строка (Только для getAllAudioUrls и getAllAudioBase64 ) Установите пунктуацию, чтобы разделить длинный текст на короткий. (например, «,、。»)

Примеры

1.

getAudioUrl (текст, [параметр])

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

// получаем URL аудио
const url = googleTTS.getAudioUrl ('Hello World', {
  lang: 'en-US',
  медленно: ложь,
  хост: 'https://translate.google.com',
});
console.log (URL); // https: //translate.google.com/translate_tts? ... 

2.

getAudioBase64 (текст, [опция])

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

// получаем текст в формате base64
googleTTS
  .getAudioBase64 ('Привет, мир', {
    lang: 'en-US',
    медленно: ложь,
    host: 'https: // translate.google.com ',
    таймаут: 10000,
  })
  .then (console.log) // текст в формате base64
  .catch (console.error); 

3.

getAllAudioUrls (текст, [параметр]) (для текста длиной более 200 символов)

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

const results = googleTTS. getAllAudioUrls ('LONG_TEXT _...', {
  lang: 'en-US',
  медленно: ложь,
  хост: 'https://translate.google.com',
  splitPunct: ',.?',
});
консоль.журнал (результаты);
// [
// {shortText: '...', url: '...'},
// {shortText: '...', url: '...'},
// ...
//]; 

4.

getAllAudioBase64 (текст, [параметр]) (для текста длиной более 200 символов)

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

googleTTS
  .getAllAudioBase64 ('LONG_TEXT _...', {
    lang: 'en-US',
    медленно: ложь,
    хост: 'https://translate.google.com',
    таймаут: 10000,
    splitPunct: ',.? ',
  })
  .then (console.log)
  // [
  // {shortText: '...', base64: '...'},
  // {shortText: '...', base64: '...'},
  // ...
  //];
  .catch (console.error); 

Другие примеры

Лицензия

MIT

Google Cloud Text-to-Speech — Voices

Google Cloud TTS Service использует платный Google Cloud Text-to-Speech API для преобразования текста или ввода языка разметки синтеза речи (SSML) в аудиоданные естественной человеческой речи.
Он предоставляет несколько голосов, доступных на разных языках и в разных вариантах, и применяет новаторские исследования DeepMind в WaveNet и мощных нейронных сетях Google.Реализация кэширует преобразованные тексты, чтобы снизить нагрузку на API и ускорить преобразование.
Вы можете найти их в папке $ OPENHAB_USERDATA / cache / org.openhab.voice.googletts .
Имейте в виду, что использование этой услуги может повлечь за собой расходы на вашу учетную запись Google Cloud.
Вы можете найти информацию о ценах на странице документации (открывается в новом окне).

Оглавление

Получение учетных данных

Прежде чем вы сможете интегрировать эту службу с вашим синтезатором речи Google Cloud, у вас должен быть проект консоли Google API:

  • Выберите или создайте проект GCP.ссылка (открывается в новом окне)
  • Убедитесь, что для вашего проекта включен биллинг. ссылка (открывается в новом окне)
  • Включить Cloud Text-to-Speech API. ссылка (открывается в новом окне)
  • Настроить аутентификацию:
    • Перейдите на страницу «API и службы» -> «Учетные данные» в консоли GCP и в своем проекте. ссылка (открывается в новом окне)
    • В раскрывающемся списке «Создать учетные данные» выберите «Идентификатор клиента OAuth.
    • Выберите тип приложения« ТВ и ограниченный ввод »и введите имя в поле« Имя ».
    • Щелкните «Создать». Появится всплывающее окно, показывающее ваш «идентификатор клиента» и «секрет клиента».

Конфигурация службы

Использование вашего любимого пользовательского интерфейса конфигурации для редактирования Настройки / Другие службы — Синтезатор речи Google Cloud и установите:

  • Client Id — Google Cloud Platform OAuth 2.0-Client Id.
  • Секрет клиента — секрет клиента OAuth 2.0 облачной платформы Google.
  • Код авторизации — Код авторизации — это одноразовый код, необходимый для получения необходимых кодов доступа из Google Cloud Platform. Перейдите в свой браузер … https://accounts.google. com/o/oauth3/auth?client_id=&redirect_uri=urn:ietf:wg:oauth:2.0:oob&scope=https://www.googleapis. com / auth / cloud-platform & response_type = code (открывается в новом окне) (замените на свой идентификатор клиента)
    … чтобы сгенерировать код авторизации и вставить его сюда .
    После первоначальной авторизации этот код больше не нужен.
    После этого рекомендуется очистить этот параметр конфигурации.
  • Высота — Высота выбранного голоса до 20 полутонов.
  • Volume Gain — Громкость выходного сигнала от 16 дБ до -96 дБ.
  • Скорость речи — Скорость речи может быть в 4 раза быстрее или медленнее обычной.
  • Purge Cache — Очищает кеш, например после тестирования различных параметров конфигурации голоса.

При включении кеш очищается один раз.
Не забудьте снова отключить этот параметр, чтобы кеш оставался неизменным после перезапуска.

Конфигурация голоса

Использование пользовательского интерфейса вашей любимой конфигурации:

  • Перейдите к Настройки .
  • Редактировать Системные службы — Голос .
  • Установить Google Cloud как Преобразование текста в речь по умолчанию .
  • Выберите предпочитаемый тембр по умолчанию для вашей настройки.

gTTS · PyPI

Описание проекта

gTTS ( Google Text-to-Speech ), библиотека Python и инструмент командной строки для взаимодействия с API преобразования текста в речь Google Translate.
Записать озвученные данные mp3 в файл, объект, подобный файлу (байтовая строка) для дальнейшей обработки звука, или stdout .Или просто предварительно сгенерируйте URL-адреса запроса TTS Google Translate для передачи во внешнюю программу.
http://gtts.readthedocs.org/

Особенности

  • Настраиваемый токенизатор предложений для речи, который позволяет читать неограниченную длину текста, сохраняя при этом правильную интонацию, сокращения, десятичные дроби и многое другое;
  • Настраиваемые препроцессоры текста, которые могут, например, исправлять произношение;

Установка

  $ pip install gTTS
  

Быстрый старт

Командная строка:

  $ gtts-cli 'hello' - вывод привет. mp3
  

Модуль:

  >>> из gtts import gTTS
>>> tts = gTTS ('привет')
>>> tts.save ('hello.mp3')
  

См. Http://gtts.readthedocs.org/ для документации и примеров.

Заявление об ограничении ответственности

Этот проект не связан с Google или Google Cloud. Прерывательные изменения в восходящем направлении могут происходить без уведомления. Этот проект использует недокументированную речевую функцию Google Translate и на отличается от от Google Cloud Text-to-Speech.

пр.

Лицензия

Лицензия MIT (MIT) Авторские права © 2014-2021 Pierre Nicolas Durette & Contributors

Скачать файлы

Загрузите файл для своей платформы. Если вы не уверены, что выбрать, узнайте больше об установке пакетов.

Файлы для gTTS, версия 2.2.2
Имя файла, размер Тип файла Python версии Дата загрузки Хеши
Имя файла, размер

gTTS-2.2.2-py3-none-any.whl

(25,2 кБ)

Тип файла
Колесо
Версия Python

py3

Дата загрузки
Хеши

Вид

Имя файла, размер

gTTS-2.2.2.tar.gz

(28,2 кБ)

Тип файла
Источник
Версия Python

Никто

Дата загрузки
Хеши

Вид

Параметры облачного TTS: преобразование текста в речь Google

В этой серии блогов, состоящей из трех частей, посвященной преобразованию текста в речь (TTS), мы исследуем трех основных игроков в облачной TTS: Google, Microsoft и Amazon.Мы подробно рассмотрим услуги, предлагаемые каждой из этих платформ, и опишем конкретные критерии выбора, используемые для их сравнения. В этом блоге мы сосредоточимся конкретно на вариантах TTS, предлагаемых Google Text to Speech.

Критерии выбора для TTS

Чтобы предоставить общий критерий для обзора трех основных поставщиков облачных услуг, мы будем использовать следующие рекомендации:

  1. Простота использования
    1. Насколько легко вы можете войти в приложение и заставить его работать?
    2. Какие технические навыки вам понадобятся для этого?
  2. Покрытие
    1. Какие голоса и параметры голоса доступны?
    2. Какие варианты и пол доступны?
  3. Доступны специальные дополнения и технологии
    1. Neural TTS [высокое качество]?
    2. Специальные теги разметки или другие функции?
  4. Общее качество
    1. Качество TTS очень субъективно, поэтому важно иметь четко определенную цель, чтобы вы могли оценить качество при сравнении вариантов.
    2. Например, если вам нужен финский язык, у вас может быть только один выбор: женский голос от Microsoft. Но в некоторых случаях, например во французском, у вас может быть до 10 вариантов между всеми тремя поставщиками с разными полами и акцентами. Ваша оценка качества будет напрямую соответствовать поставленным вами первоначальным целям.

Параметры TTS, предлагаемые Google Text to Speech

Компания Google, несомненно, вложила немало талантов и опубликовала самые передовые исследования по созданию наиболее естественно звучащего нейронного текста в речь (NTTS).Они немного медленнее делают свои продукты доступными для коммерческого использования, но у них есть набор голосов WaveNet, которые используют их нейронный текст для исследования речи. Однако обратите внимание, что это исследование было проведено в 2016 году. Когда мы говорим о бэк-энде опций TTS, предлагаемых Google Text to Speech, это все «бэкэнд». Пользователям нужен ключ API, аутентифицированный пользователь службы, некоторые токены, разрешения и немного кода, чтобы начать работу. Это предлагается как инструмент разработчика, а не как оптимизированная платформа, ориентированная на пользователя.Если вы не умеете программировать или у вас есть кто-то, кто знает, это запрещено обычным пользователям.

Демонстрационная версия не должна использоваться в производственных целях [вопреки Условиям обслуживания], но она показывает основы того, как звучит звук и какие голоса доступны.

  1. Простота использования: Именно здесь в нашем обзоре как Google, так и Microsoft самая резкая критика по сравнению с удобным интерфейсом от Amazon. Его просто не существует.Демо-пространство больше всего похоже на интерфейс для сэмплирования голосов, что я рекомендую для сэмплирования. В идеале я хочу скопировать + вставить образец текста, чтобы увидеть, стоит ли в него вкладывать средства с точки зрения охвата и качества.
  2. Охват: Google имеет 32 языка и 187 голосов. Они перечисляют их здесь, на своей справочной странице. Есть смесь WaveNet [Neural] и обычных голосов. Разница в качестве между ними очевидна. Также стоит отметить, что стоимость WaveNet на 400% больше, чем обычных голосов.Опять же, голоса WaveNet доступны не для всех, и на эту дату / время у всех одна женщина, но охват варьируется.
  3. Специальные надстройки Google: Все дополнительные функции связаны с добавлением мультимедиа к воспроизведению, что может быть интересно в тех случаях, когда у вас есть фоновые аудио / видео элементы и вы хотите микшировать треки. Но использовать инструмент редактирования аудио, вероятно, проще для большинства пользователей — этот тип микширования на основе кода может быть полезен для тех, кто хочет масштабировать подсказки или другие автоматические сообщения.
  4. Качество: Google WaveNet очень хорошо принимается на нескольких языках, и 95 голосов поддерживаются для всех языков, кроме испанского. Европейский язык, что кажется странным, поскольку испанский язык является вторым наиболее часто используемым языком в настоящее время.

Если вы хотите узнать больше о TTS, голосовых услугах, локализации и услугах перевода, Global eLearning широко считается лидером в TTS, особенно в сфере обучения и развития. Свяжитесь с нами сегодня чтобы начать!

Обязательно посмотрите наши сравнения двух других основных провайдеров TTS в других блогах: Amazon Polly и Microsoft Azure.

Гилберт Сегура — технический директор Global eLearning. Узнайте больше о Гилберте!

chrome.tts — Разработчики Chrome

Обзор #

Chrome обеспечивает встроенную поддержку речи в Windows (с использованием SAPI 5), Mac OS X и Chrome OS, используя возможности синтеза речи, предоставляемые операционной системой. На всех платформах пользователь может установить расширения, которые регистрируют себя как альтернативные речевые механизмы.

Генерация речи #

Позвоните по телефону говорите () со своего расширения или из приложения Chrome, чтобы говорить.Например:

  chrome.tts.speak ('Привет, мир.');  

Чтобы немедленно прекратить разговор, просто позвоните по номеру stop () :

  chrome.tts.stop ();  

Можно предоставить параметры, управляющие различными свойствами речи, такими как скорость, высота тона и т. Д. Например:

  chrome.tts.speak ('Hello, world.', {'Rate': 2.0});  

Также рекомендуется указать язык, чтобы был выбран синтезатор, поддерживающий этот язык (и региональный диалект, если применимо).

  chrome.tts.speak ('Привет, мир.', {'Lang': 'en-US', 'rate': 2.0});  

По умолчанию каждый звонок на speak () прерывает любую текущую речь и немедленно говорит. Чтобы определить, будет ли вызов прерывать что-либо, вы можете вызвать isSpeaking () . Кроме того, вы можете использовать опцию enqueue , чтобы это высказывание было добавлено в очередь высказываний, которые будут произнесены, когда текущее высказывание закончится.

  хром.tts.speak («Сначала скажи это»); 
chrome.tts.speak (
'Говорите следующим образом, когда закончится первое предложение.', {'Enqueue': true});

Полное описание всех опций можно найти в tts.speak ниже. Не все речевые движки поддерживают все параметры.

Чтобы поймать ошибки и убедиться, что вы вызываете speak () правильно, передайте функцию обратного вызова, которая не принимает аргументов. Внутри обратного вызова проверьте runtime.lastError , чтобы увидеть, были ли ошибки.

  chrome.tts.speak (
высказываний,
параметров,
функция () {
if (chrome.runtime.lastError) {
console.log ('Ошибка:' + chrome.runtime.lastError.message);
}
}
);

Обратный вызов возвращается сразу, до того, как механизм начал генерировать речь. Цель обратного вызова — предупредить вас о синтаксических ошибках при использовании TTS API, а не уловить все возможные ошибки, которые могут возникнуть в процессе синтеза и вывода речи.Чтобы отловить и эти ошибки, вам необходимо использовать прослушиватель событий, описанный ниже.

Прослушивание событий #

Чтобы получать больше информации в реальном времени о состоянии синтезированной речи, передайте прослушиватель событий в параметрах speak () , например:

  chrome.tts.speak (
utterance ,
{
onEvent: функция (событие) {
console.log ('Event' + event.type + 'at position' + event.charIndex);
if (event.type == 'error') {
console. log ('Ошибка:' + event.сообщение об ошибке);
}
}
},
обратный вызов
);

Каждое событие включает в себя тип события, индекс символа текущей речи относительно высказывания, а для событий ошибок — дополнительное сообщение об ошибке. Типы событий:

  • 'start' : Двигатель начал произносить фразу.
  • «слово» : достигнута граница слова. Используйте event.charIndex , чтобы определить текущую позицию речи.
  • «предложение» : предел предложения достигнут.Используйте event.charIndex , чтобы определить текущую позицию речи.
  • «маркер» : достигнут маркер SSML. Используйте event.charIndex , чтобы определить текущую позицию речи.
  • "конец" : Двигатель закончил произносить фразу.
  • «прервано» : это высказывание было прервано другим вызовом speak () или stop () и не было завершено.
  • «отменено» : это высказывание было поставлено в очередь, но затем отменено другим вызовом speak () или stop () и никогда не начиналось говорить.
  • «ошибка» : Произошла специфическая ошибка двигателя, и это высказывание невозможно произнести. Дополнительные сведения см. В event.errorMessage .

Четыре типа событий — «конец» , «прервано» , «отменено» и «ошибка» конечный . После того, как одно из этих событий получено, это высказывание больше не будет говорить, и никаких новых событий из этого высказывания не будет.

Некоторые голоса могут не поддерживать все типы событий, а некоторые голоса могут вообще не отправлять какие-либо события.Если вы не хотите использовать голос, если он не отправляет определенные события, передайте требуемые события в члене requiredEventTypes объекта параметров или используйте getVoices () , чтобы выбрать голос, который соответствует вашим требованиям. Оба описаны ниже.

Разметка SSML #

Высказывания, используемые в этом API, могут включать разметку с использованием языка разметки синтеза речи (SSML). Если вы используете SSML, первым аргументом для speak () должен быть полный документ SSML с заголовком XML и тегом верхнего уровня, а не фрагмент документа.

Например:

  chrome.tts.speak (
'' +
'' +
' second ' +
' слово этого предложения было подчеркнуто. '+
'
'
);

Не все речевые механизмы будут поддерживать все теги SSML, а некоторые могут вообще не поддерживать SSML, но все механизмы должны игнорировать любой SSML, который они не поддерживают, и по-прежнему озвучивать основной текст.

Выбор голоса #

По умолчанию Chrome выбирает наиболее подходящий голос для каждого высказывания, которое вы хотите произнести, в зависимости от языка.В большинстве систем Windows, Mac OS X и Chrome OS функция синтеза речи, обеспечиваемая операционной системой, должна обеспечивать озвучивание любого текста как минимум на одном языке. Однако некоторым пользователям могут быть доступны различные голоса из их операционной системы и из речевых механизмов, реализованных другими расширениями Chrome. В таких случаях вы можете реализовать собственный код, чтобы выбрать подходящий голос или предоставить пользователю список вариантов.

Чтобы получить список всех голосов, вызовите getVoices () и передайте ему функцию, которая получает массив из объектов TtsVoice в качестве аргумента:

  chrome.tts.getVoices (функция 
(голоса) {
for (var i = 0; i console.log ('Voice' + i + ':');
console.log ('name : '+ voices [i] .voiceName);
console.log (' lang: '+ voices [i] .lang);
console.log (' extension id: '+ voices [i] .extensionId);
console .log ('типы событий:' + голоса [i] .eventTypes);
}
}
);

zlargon / google-tts: Google TTS (преобразование текста в речь) для node.js

Google TTS (преобразование текста в речь) для узла.js

Установка

 $ npm install --save google-tts-api
$ npm install -D typescript @ types / node # Только для TypeScript 

История изменений

См. ИЗМЕНЕНИЕ.

Использование

Метод Опции (все опционально) Тип возврата Обработка длинного текста
getAudioUrl язык , медленный , хост строка
getAudioBase64 lang , slow , host , timeout Обещание <строка>
getAllAudioUrls lang , slow , host , splitPunct {shortText: строка; url: строка; } []
getAllAudioBase64 lang , slow , host , timeout , splitPunct Обещание <{shortText: string; base64: строка; } []>

Опции (все опции)

Опция Тип По умолчанию Описание
язык строка en-US Смотрите весь доступный языковой код на https: // cloud.google.com/speech/docs/languages ​​
медленная логическое ложь Используйте низкую скорость звука, если установлено slow to true
хост строка https://translate.google.com Вы можете изменить хост , если хост по умолчанию не может работать в вашем регионе (например, https://translate.google.com.cn).
таймаут номер 10000 (мс) (Только для getAudioBase64 и getAllAudioBase64 ) Установите время ожидания для HTTP-запроса.
сплит-трубка строка (Только для getAllAudioUrls и getAllAudioBase64 ) Установите пунктуацию, чтобы разделить длинный текст на короткий. (например, «,、。»)

Примеры

1.

getAudioUrl (текст, [параметр])

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

// получаем URL аудио
const url = googleTTS.getAudioUrl ('Hello World', {
  lang: 'en-US',
  медленно: ложь,
  хост: 'https://translate.google.com',
});
console.log (URL); // https: //translate.google.com/translate_tts? ... 

2.

getAudioBase64 (текст, [опция])

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

// получаем текст в формате base64
googleTTS
  .getAudioBase64 ('Привет, мир', {
    lang: 'en-US',
    медленно: ложь,
    host: 'https: // translate.google.com ',
    таймаут: 10000,
  })
  .then (console.log) // текст в формате base64
  .catch (console.error); 

3.

getAllAudioUrls (текст, [параметр]) (для текста длиной более 200 символов)

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

const results = googleTTS.getAllAudioUrls ('LONG_TEXT _...', {
  lang: 'en-US',
  медленно: ложь,
  хост: 'https://translate.google.com',
  splitPunct: ',.?',
});
консоль.журнал (результаты);
// [
// {shortText: '...', url: '...'},
// {shortText: '...', url: '...'},
// ...
//]; 

4.

getAllAudioBase64 (текст, [параметр]) (для текста длиной более 200 символов)

 import * as googleTTS from 'google-tts-api'; // ES6 или TypeScript
const googleTTS = require ('google-tts-api'); // CommonJS

googleTTS
  .getAllAudioBase64 ('LONG_TEXT _...', {
    lang: 'en-US',
    медленно: ложь,
    хост: 'https://translate.google.com',
    таймаут: 10000,
    splitPunct: ',.? ',
  })
  .then (console.log)
  // [
  // {shortText: '...', base64: '...'},
  // {shortText: '...', base64: '...'},
  // ...
  //];
  .catch (console.error); 

Другие примеры

Лицензия

MIT

аудиосэмплов из «Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions»

аудиосэмплов из «Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions»

Авторы: Джонатан Шен, Руоминг Панг, Рон Дж.Вайс, Майк Шустер, Навдип Джайтли, Цзунхенг Ян, Чжифэн Чен, Ю Чжан, Юйюань Ван, Р.Дж. Скерри-Райан, Риф А. Саурус, Яннис Агиомирджаннакис, Юнхуэй Ву

Abstract: В этой статье описывается Tacotron 2, архитектура нейронной сети для
синтез речи прямо из текста. Система состоит из
сеть прогнозирования повторяющихся признаков от последовательности к последовательности, которая
отображает вложения символов в спектрограммы мел-шкалы, за которыми следует
модифицированная модель WaveNet, действующая как вокодер для синтеза временной области
осциллограммы из этих спектрограмм.Наша модель достигает
средняя оценка мнений (MOS) 4,53, сравнимая с MOS 4,58 для
профессионально записанная речь. Чтобы подтвердить свой выбор дизайна, мы
представить исследования абляции ключевых компонентов нашей системы и оценить
влияние использования мел-спектрограмм в качестве входных данных для WaveNet вместо
лингвистических характеристик, продолжительности и F0. Мы далее демонстрируем
что использование компактного акустического промежуточного представления позволяет
значительное упрощение архитектуры WaveNet.

Tacotron 2 хорошо работает со сложными словами вне домена.

«Генеративная состязательная сеть или вариационный автокодировщик».
«Базилярная мембрана и отоларингология не являются автокорреляциями».

Tacotron 2 изучает произношение на основе семантики фраз.

(Обратите внимание, как Tacotron 2 произносит слово «прочитано» в первых двух фразах.)

«Он все прочитал».
«Он читает книги».
«Не бросай меня здесь, в пустыне!»
«Он подумал, что пришло время сделать подарок».

Tacotron 2 в некоторой степени устойчив к орфографическим ошибкам.

«Это действительно ужасно.”

Tacotron 2 чувствителен к пунктуации.

(Обратите внимание, как запятая в первой фразе меняет просодию.)

«Это ваш личный помощник, Google Home».
«Это ваш личный помощник Google Home».

Tacotron 2 разучивает ударение и интонацию.

(Говорящему предлагается делать ударение на словах с заглавной буквы в
Обучающий набор.Таким образом, простое использование заглавных букв изменит общий
интонация.)

«Автобусы не проблема, они на самом деле предлагают решение».
«Автобусы — это не ПРОБЛЕМА, они на самом деле являются РЕШЕНИЕМ».

Tacotron 2 изменяется при превращении утверждения в вопрос.

«Быстрая коричневая лисица перепрыгивает через ленивую собаку.»
« Быстрая коричневая лисица перепрыгивает через ленивую собаку? »

Такотрон 2 хорош на скороговорках.

«Питер Пайпер сорвал кусочек маринованного перца. Сколько маринованных перцев собрал Питер Пайпер? »
«Она продает ракушки на берегу моря. Я уверен, что ракушки, которые она продает, — это морские ракушки.

Дополнительные образцы

«Талиб Квели подтвердил AllHipHop, что он выпустит альбом в следующем году.
«Голубая лагуна — это девятнадцатилетний американский романтический приключенческий фильм».
«Аэропорт Тадзима обслуживает Тойока».

Такотрон 2 или человек?

В следующих примерах один генерируется Tacotron 2, а другой — запись человека, но что именно?

«Эта девушка сняла видео о помаде из« Звездных войн ».
1
2
«Она получила степень доктора социологии в Колумбийском университете».
1
2
«Джордж Вашингтон был первым президентом Соединенных Штатов».
1
2
«Я слишком занят для романтики.”
1
2

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *