Программы для расшифровки аудиозаписей в текст

Сразу нужно сказать — программы, автоматически распознающей и переводящей речь в текст, не существует. Во всяком случае, пока. Поэтому расшифровка записей в текст на данный момент производится только ручками) В этой статье представлен обзор программ, помогающих сделать этот нелегкий процесс более удобным, быстрым и качественным.

RSplayer  V1.4 Данная программа имеет много возможностей по обработке аудиофайлов, но здесь мы рассмотрим только использование ее для расшифровки аудио.

Для удобства расшифровки аудиофайлов в программе предусмотрен простой текстовый редактор, в верхней части окна которого размещается аудиоплейер. Существуют следующие комбинации клавиш: левый Alt – курсорная стрелка вниз – остановка воспроизведения, левый Alt – курсорная стрелка вверх – возобновление воспроизведения с позиции минус пять секунд от позиции остановки воспроизведения (очень удобная функция для расшифровщика). Эти же комбинации клавиш действуют из всех программ Windows, что позволяет использовать для расшифровки, например, Microsoft Word.

Программа проста в использовании, все, что вам необходимо сделать для работы — это загрузить запись в программу, запустить воспроизведение и набивать текст, используя для остановки и возобновления указанные выше комбинации клавиш.

Программа для обработки и расшифровки аудиозаписей в текст RSplayer  V1.4 распространяется бесплатно; скачать ее, а также получить более подробную информацию о ней можно на сайте разработчика http://www.recsound.org/rsplayer.html

Dragon Dictate — это американская программа для распознавания речи (естественно, английской), используется для перевода речи в текст, а также для передачи голосовых команд компьютеру. На Dragon Dictate были основаны отечественные версии «Диктант»,"Комбат", "Горыныч", «Диктограф».

Прямо скажем, все отечественные программы оставляют желать лучшего.С настройкой программ придется изрядно повозиться — настроить их на тембр собственной речи, занести новые слова в словарь. Впрочем, чем больше работаешь в этих программах, тем больше они «привыкают» к голосу и понимают вас, но для этого нужно время, и немалое.

Вряд ли хоть одну из них можно считать полноценной программой для транскрипции речи в текст.  Даже в идеальных условиях, при отсутствии шумов, при четком произношении — ошибок масса. Кроме того, приходится постоянно отвлекаться на просмотр вводимого текста, постоянно исправлять неточности. В итоге скорость расшифровки раза в 2 ниже, чем при вводе вручную с клавиатуры.

Что касается расшифровки интервью, семинаров, конференций пр., то названные программы для подобной работы не подходят совершенно, так как понимают речь только своего «хозяина». Желающие поближе познакомиться с различными "горынычами" найдут в Интернете большое количество бесплатных версий этих программ.

Транскрайбер «Цезарь» от Центра Речевых Технологий. Удобная программа, легкая в эксплуатации, работа ведется в редакторе Microsoft Word (в 2003 и в 2007), есть функция шумоочистки и замедления голоса, что иногда очень спасает при расшифровке «сложных» записей.

Для тех, у кого большой опыт расшифровки и хорошая скорость печати, наоборот, есть функция ускорения записи. Управление воспроизведением осуществляется как автоматически на панели транскрайбера, так и с помощью специальной ножной педали, которая предоставляется в комплекте с программой. Есть автоматическая проверка орфографии, что позволит избежать ошибок и опечаток.

Очень удобно то, что заранее можно задать имена участников и потом вводить их одним нажатием клавиши, что также ускоряет работу. "Цезарь" поддерживает расшифровку звука во всех распространенных форматах. Минус у этой программы только один — она платная.

Узнать более подробную информацию о программе можно на сайте Центра Речевых Технологий http://www.speechpro.ru/product/transcription/cesar

Вместо «Цезаря» можно не менее успешно использовать проигрыватель AIMP — отличный бесплатный вариант, скачать можно на официальном сайте http://www.aimp.ru/.

В настройках отрегулируйте функции «Немного перейти назад» и «Немного перейти вперед» — они нужны, чтобы заново прослушать последний фрагмент или перейти на фрагмент вперед.

Вызвав эквалайзер, можно уменьшить значение Speed и увеличить значение Pitch. При этом скорость воспроизведения замедлится, но высота голоса (если правильно подобрать Pitch) — не изменится. Постарайтесь так подобрать эти два параметра, чтобы можно было практически синхронно со звуком набирать текст, только иногда останавливая запись. Если все удобно и правильно настроить, то набор будет занимать гораздо меньше времени.

Программу для расшифровки аудио Express Scribe легко бесплатно скачать в Интернете. Поддерживает огромное количество форматов записи, имеет интеграцию с Microsoft Word. Доступна отмотка назад по нажатию одной кнопки, интервал отмотки в секундах можно настраивать любой.

Также изменяется скорость проигрывания, есть функция шумоочистки. Программа хорошая, легкая в освоении, несмотря даже на то, что интерфейс на английском языке, так что можно смело рекомендовать ее для работы. TextService активно использует эту программу для расшифровки интервью, круглых столов, конференций, семинаров, и др.

Надеемся, статья пригодится и поможет в выборе программ для расшифровки аудиозаписей. Учитывая черепашью скорость развития анализаторов речи, похоже, что работа стенографисток, машинисток и операторов будет актуальна еще очень долгое время. И может это и к лучшему, ведь ни одна программа не сможет до конца понять человеческую речь, верно интерпретировать речевые и эмоциональные акценты. Плюс к этому стенографистки-машинистки сохранят свою работу — борьба с безработицей)

Image Gallery

Политика конфиденциальности

Мы обязуемся ни при каких условиях не разглашать, не воспроизводить и не распространять документы, материалы или иные виды информации, которые имеют отношение к деятельности Заказчика. По желанию Заказчика возможно подписание соглашения о конфиденциальности.

Контакты

Работаем без выходных с 9:00 до 21:00 textservice@mail.ru

тел. 8-915-249-57-77

Яндекс.Метрика