Содержание
- 1 1. Скачайте Balabolka
- 2 2. Преобразуйте текст
- 3 3. Смените голос
- 4 4. Сохраните запись речи
- 5 5. Используйте закладки
- 6 6. Корректируйте произношений
- 7 7. Попробуйте скорочтение
- 8 8. Синхронизируйте текст
- 9 Добавление голоса для преобразования текста в речь на компьютере
- 10 Что такое транскрибация
- 11 1 Сайт speechpad.ru
- 12 2 Сервис dictation.io
- 13 3 RealSpeaker
- 14 4 Speechnotes
- 15 5 Dragon Dictation
- 16 Расшифровка аудио и видео в текст на биржах фриланса
- 17 Преобразование речи в текст непосредственно в Word
- 18 Превращаем речь в текст с помощью Speak a Message
- 19 Преобразуем речь в текст без специальных программ
- 20 Преобразование речи в текст через приложение
Превратите любой текст в речь.
Раньше у программ, преобразовывавших текст в речь было два основных недостатка: их цена и неестественный результат работы. Но к счастью технологии продвинулись настолько, что теперь нам доступны превосходные решения по преобразованию текста в речь абсолютно бесплатно.
Причин, по которым может возникнуть необходимость преобразовать текст в речь может быть много: от дислексии до проблем со зрением. Такие программы также могут помочь изучающим иностранные языки, ведь так легче понять произношение. Или можно просто озвучить какую-нибудь аудиокнигу.
Какая бы ни была причина, Balabolka – это отличный инструмент для работы. Программа понимает почти любой текстовый формат и у нее есть богатый набор редакторских возможностей, позволяющих сразу перейти к определенной части текста.
1. Скачайте Balabolka
Скачайте программу и разархивируйте содержание файла balabolka.zip в предпочитаемую паку на вашем ПК, затем два раза щелкните по значку установки, чтобы ее запустить. Выберите язык, и нажмите «Далее». После завершения установки, щелкните на «Запустить Balabolka сейчас» и затем на «Готово».
2. Преобразуйте текст
Balabolka выглядит как простой текстовый редактор и самый кратчайший путь ознакомиться с работой программы – это вставить в нее текст. Поставьте курсор на начало текста и нажмите на кнопку «Play». По умолчанию текст будет озвучен одним из голосов Windows. Из самой программы также можно открыть любой тип документа, как и вставлять текст из буфера обмена.
3. Смените голос
Если вам не нравиться голос, установленный по умолчанию, то вы можете посмотреть какие еще варианты доступны на вашем ПК, во всплывающем меню над текстовым полем. При помощи ползунков снизу можно настроить скорость, высоту и громкость речи. Настроить скорость бывает очень к месту, ведь стандартная озвучка очень медленная.
4. Сохраните запись речи
Одна из лучших функций программы – это возможность сохранить преобразованный речь как звуковой файл, которые позднее можно прослушать. Нажмите «Файл» и затем «Сохранить аудио файл». Пользователю доступны сразу несколько популярных форматов, включая MP3, WAV, OGG и WMA. Также можно сохранить текст как аудиокнигу. Конечно, результат будет далек от совершенства, но ведь это бесплатно.
5. Используйте закладки
Balabolka имеет функционал с закладками, который делит документ на части и таким образом становится намного легче ориентироваться. Это особенно удобно при работе с большими файлами. Наведите курсор на текст и затем нажмите на «Закладки» > «Добавить закладку» и введите для нее имя. Они не видны, но переключаться между ними можно нажимая на правую кнопку мыши и затем на «Перейти к закладке».
6. Корректируйте произношений
Если Balabolka не может произнести какое-то слово, то нажмите на кнопку «Панель словарей» в верхнем меню и выберите «sample.bxd». Теперь щелкните по слову правой кнопкой мыши и нажмите на «Произношение». Щелкните текстовое поле рядом с надписью «как здесь» и введите приблизительное фонетическое произношение слова. Используйте значок динамика, чтобы проверить, как это звучит. Если все нормально, нажмите кнопку «0К», а затем «сохранить».
7. Попробуйте скорочтение
8. Синхронизируйте текст
Некоторые медиаплееры могут отображать текст во время воспроизведения песни. Точно также можно настроить ваши файлы. Просто нажмите «Файл» > «ID3-тег»”, установите флажок на «установить ID3-теги для аудиофайлов», перейдите на вкладку «Текст» и выберите «Добавить текст в MP3-файлы». Теперь при воспроизведении экспортированного MP3-файла слова будут синхронизированы с произнесенным звуком.
В следующей таблице поясняется, какие языки и голоса преобразования текста в речь (TTS) доступны в последней версии Windows.
Язык, страна или регион |
Мужской голос TTS |
Женский голос TTS |
---|---|---|
Арабский |
Неприменимо |
Хода (Hoda) |
Арабский (Саудовская Аравия) |
Найиф (Naayf) |
Неприменимо |
Болгарский |
Иван (Ivan) |
Неприменимо |
Каталанский |
Неприменимо |
Херена (Herena) |
Китайский (упрощенное письмо) |
Кангканг (Kangkang) |
Зихао, Яояо (Zihao, Yaoyao) |
Кантонский (традиционное письмо, Гонконг (САР)) |
Дэнни (Danny) |
Трейси (Tracy) |
Китайский (традиционное письмо, Тайвань) |
Живей (Zhiwei) |
Йатинг, Ханхан (Yating, Hanhan) |
Хорватский |
Матей (Matej) |
Неприменимо |
Чешский (Чешская Республика) |
Якуб (Jakub) |
Неприменимо |
Датский |
Неприменимо |
Гелла (Helle) |
Нидерландский |
Франк (Frank) |
Неприменимо |
Английский (Австралия) |
Джеймс (James) |
Катрин (Catherine) |
Английский (Канада) |
Ричард (Richard) |
Линда (Linda) |
Английский (Соединенное Королевство) |
Джордж (George) |
Хейзл, Сьюзен (Hazel, Susan) |
Английский (Индия) |
Рави (Ravi) |
Хеера (Heera) |
Английский (Ирландия) |
Шон (Sean) |
Неприменимо |
Английский (США) |
Дэвид, Марк (David, Mark) |
Зира (Zira) |
Финский |
Неприменимо |
Хайди (Heidi) |
Фламандский (бельгийский нидерландский) |
Барт (Bart) |
Неприменимо |
Французский (Канада) |
Клод (Claude) |
Каролина (Caroline) |
Французский (Франция) |
Пол (Paul) |
Гортензия, Джулия (Hortence, Julie) |
Французский (Швейцария) |
Гийом (Guillaume) |
Неприменимо |
Немецкий (Австрия) |
Михаэль (Michael) |
Неприменимо |
Немецкий (Германия) |
Стефан (Stefan) |
Хедда, Катя (Hedda, Katja) |
Немецкий (Швейцария) |
Карстен (Karsten) |
Неприменимо |
Греческий |
Стефанос (Stefanos) |
Неприменимо |
Иврит |
Асаф (Asaf) |
Неприменимо |
Хинди (Индия) |
Хемант (Hemant) |
Калпана (Kalpana) |
Венгерский (Венгрия) |
Сабольч (Szabolcs) |
Неприменимо |
Индонезийский (Индонезия) |
Андика (Andika) |
Неприменимо |
Итальянский |
Косимо (Cosimo) |
Эльза (Elsa) |
Японский |
Ичиро (Ichiro) |
Аюми, Харука (Ayumi, Haruka) |
Малайский |
Ризван (Rizwan) |
Неприменимо |
Норвежский |
Джон (Jon) |
Неприменимо |
Польский (Польша) |
Адам (Adam) |
Паулина (Paulina) |
Португальский (Бразилия) |
Дэниэл (Daniel) |
Мария (Maria) |
Португальский (Португалия) |
Неприменимо |
Хелия (Helia) |
Румынский (Румыния) |
Андрей (Andrei) |
Неприменимо |
Русский (Россия) |
Павел |
Ирина |
Словацкий (Словакия) |
Филип (Filip) |
Неприменимо |
Словенский |
Ладо (Lado) |
Неприменимо |
Корейский |
Неприменимо |
Хеами (Heami) |
Испанский (Испания) |
Пабло (Pablo) |
Элена, Лаура (Helena, Laura) |
Испанский (Мексика) |
Рауль (Raul) |
Сабина (Sabina) |
Шведский |
Бенгт (Bengt) |
Неприменимо |
Тамильский |
Валлувар (Valluvar) |
Неприменимо |
Тайский (Таиланд) |
Паттара (Pattara) |
Неприменимо |
Турецкий |
Толга (Tolga) |
Неприменимо |
Вьетнамский |
Ан (Ан) |
Неприменимо |
Добавление голоса для преобразования текста в речь на компьютере
Чтобы использовать один из этих голосов, добавьте его на компьютер:
-
В разделе Настроить голос экранного диктора выберите Добавить дополнительные голоса. Откроется страница параметров голоса.
-
В разделе Управление голосами нажмите Добавление голосов.
-
Выберите язык, для которого вы хотите установить голоса, и нажмите Добавить. Новые голоса будут скачаны и готовы к использованию в течение нескольких минут, в зависимости от вашей скорости скачивания из Интернета.
-
После скачивания голосов для новых языков перейдите в параметры экранного диктора и выберите предпочитаемый голос в разделе Настроить голос экранного диктора > Выберите голос.
Далее: Приложение Б. Список сочетаний клавиш и сенсорных жестов для экранного диктора
Вернуться к содержанию
Содержание: 1. Транскрибация – что это 2. О проблемах, связанных с переводом речи в текст
3. Сайт speechpad.ru 4. Сервис dictation.io
5. RealSpeaker 6. Speechnotes
7. Dragon Dictation 8. Биржи фриланса для расшифровки аудио и видео в текст
Что такое транскрибация
Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.
Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.
Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.
Перевод речи в текст вручную или с помощью специальной программы полезен
- студентам для перевода записанных аудио- или видео-лекций в текст,
- блогерам, ведущим сайты и блоги,
- писателям, журналистам для написания книг и текстов,
- инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
- фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
- людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
- другие варианты.
О проблемах автоматического перевода речи в текст
Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.
Речь у всех людей разная:
- настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
- с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
- с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.
В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.
В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.
В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.
Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.
1 Сайт speechpad.ru
Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.
https://speechpad.ru/
Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».
Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.
Рис. 3. Сервис speechpad
Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.
Список видео-уроков по работе с speechpad:
https://speechpad.ru/help.php
Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:
Видео «Транскрибирование аудио»
Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.
Рекомендую: Голосовой ввод в Гугл Документах для перевода речи в текст
2 Сервис dictation.io
Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.
Рис. 4. Сервис dictation.io
1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.
Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.
Перейти на сервис: https://dictation.io/
Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.
Подробнее о том, как работать с этим онлайн-сервисом показываю и рассказываю в видео:
3 RealSpeaker
Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.
Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:
https://realspeaker.net/
Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:
В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, с 2018 года такой возможности нет. Вероятно для того, чтобы транскрибированный файл был недоступен всем пользователям для скачивания, необходимо наличие галочки напротив “Сделать файл неудачным в течение 24 часов”.
На сайте есть онлайн-чат. Кнопка, чтобы начать чат, находится в правом нижнем углу сайта.
4 Speechnotes
Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:
https://play.google.com/store/apps/details?id=co.speechnotes.speechnotes&hl=ru
Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества. Есть платная премиум-версия.
5 Dragon Dictation
Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.
Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.
Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.
Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы.
Только так можно будет получить безукоризненный текст без ошибок.
Расшифровка аудио и видео в текст на биржах фриланса
Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.
Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ – задание на транскрибацию.
Для своего заказа на бирже можно выбрать исполнителя – человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.
Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.
Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.
Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.
Две биржи фриланса
Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:
Рис. 5. (кликните для увеличения)
Биржа фриланса weblancer.net
https://www.weblancer.net/jobs/transkribatciya-97/
Другая биржа, где можно заказать расшифровку аудио/видеозаписей – freelance.ru
Биржа фриланса freelance.ru
https://freelance.ru/projects/?cat=124&spec=612
Дополнительные материалы:
1. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер
2. При просмотре роликов на ноутбуке заикается звук
3. Как всегда открывать видео удобным плеером в Windows 10
4. Программы для создания электронной книги
5. Оповещения Google Alerts – зачем и как пользоваться, примеры использования
Распечатать статью
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик. Уже более 3.000 подписчиков
.
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.
31 августа 2019
Мы нашли несколько хороших программ, которые умеют автоматически распознавать речь и преобразовывать ее в связный текст. С их помощью вы можете надиктовывать письма или длинные тексты, а не печатать их вручную.
Представляем четыре способа преобразовать речь в текст, используя бесплатные программы и приложения.
Преобразование речи в текст непосредственно в Word
С помощью Microsoft Dictate вы можете диктовать и даже переводить текст прямо в Word.
- Скачайте и установите бесплатную программу Microsoft Dictate.
- Затем откройте Word – в нем появится вкладка Dictation. Кликнув на нее, вы увидите значок микрофона с командой Start.
- Рядом находится выбор языка. Выберите русский язык и начните запись. Старайтесь произносить слова максимально четко, и они появятся прямо в документе.
Превращаем речь в текст с помощью Speak a Message
Бесплатная программа Speak A Message записывает произнесенный текст, а затем расшифровывает его. Основные языки программы — английский, немецкий, испанский и французский, но есть и мультиязычная версия.
- Установите программу и нажмите кнопку «Запись». Произнесите весь текст, а затем кликните «Стоп».
- Под кнопкой записи рядом с записанными файлами вы найдете функцию «Транскрипция» — «Речь в текст».
- Скопируйте готовый текст и вставьте его в нужный текстовый редактор. Но не забудьте проверить то, что записала программа — иногда она допускает ошибки.
Преобразуем речь в текст без специальных программ
В операционной системе Windows 8 и 10 вам не требуется дополнительное программное обеспечение для преобразования голоса в текст.
- Нажмите на клавишу Windows и введите «Распознавание речи». Затем откройте совпадающий с запросом результат и следуйте указаниям программы.
- После завершения настройки запустите приложения и диктуйте текст прямо в документе Word. Для этого просто нажмите на кнопку микрофона и начните говорить.
Преобразование речи в текст через приложение
Если вы хотите диктовать тексты и получать их в напечатанном виде прямо на ходу, используйте специальные приложения.
- Android и iOS уже интегрировали в свои системы функцию распознавания речи. Когда вы открываете приложение для создания заметок и начинаете набирать текст, используйте значок микрофона, чтобы запустить распознавание голоса.
- Есть и другие приложения для аналогичной цели, например Dragon Dictation, доступное для Android и iOS.
Читайте также:
Фото: компания-разработчик
Поделиться ссылкойИспользуемые источники:
- https://oshibka-reshenie.ru/how-to-convert-text-to-speech-using-free-software
- https://support.microsoft.com/ru-ru/help/22805/windows-10-supported-narrator-languages-voices
- https://www.compgramotnost.ru/programmy/perevod-rechi-v-tekst
- https://ichip.ru/sovety/diktuem-tekst-luchshie-besplatnye-programmy-dlya-preobrazovaniya-rechi-217372