Преобразование голоса в текст

Независимо от того, насколько быстро мы научились вводить текст с клавиатуры, этот способ никогда не  сможет работать так быстро, как быстро мы можем произносить слова. К счастью, современные технологии не стоят на месте и преобразование голоса в текст затрагивает все больше и больше областей в нашей жизни. Потенциал и возможности голосового ввода, способны сделать запись, диктуя текст, намного быстрее.

Возьмем, к примеру, ShoutOUT , приложение для iPhone доступное на App Store. Оно, использует огромные достижения в технологии “голос в текст”, чтобы сделать набор SMS сообщений на iPhone намного легче, особенно для тех, кто делает это на ходу. ShoutOUT использует вычислительные и коммуникационные возможности вашего iPhone для отправки SMS . Программа позволяет пользователям наговорить текст сообщения, а затем отправить преобразованную в текст речь, в сообщении тому, кому вы укажете.

Но то, что интересно в ShoutOUT, так это то, что эту же технологию развивают такие компаний, как Jott , Dial2Do , и даже Google – с помощью голоса, решать задачи, которые требуют не только текстового ввода но и обратного преобразования. Будь то чтение новостей, заметок или даже отправка электронной почты, все это можно сделать быстрее с помощью голоса. Не говоря уже о всех удобствах использования такого преобразования, когда вы за рулем, или даже прогуливаетесь пешком. Вы получаете возможность работать  на улице и хотите услышать качественный голос диктора.

Основная проблема всех этих приложений, от  Dragon Dictation у Jott до Google Voice – это огромная сложность в обучении приложения. В зависимости от окружающих звуков или эмоционального состояния  ваш голос звучит по-разному и его невозможно использовать должным образом, так что часто приложения просто не работают. Некоторые программы не понимают, знаки препинания, и вы должны сказать что-то вроде: “Я пошел на работу сегодня утром запятая так как было запланировано три встречи восклицательный знак”. Это не совсем естественный способ говорить. Но некоторые пользователи привыкли и вполне успешно используют его.

В ближайшее время мы станем свидетелями серьезной конкурентной борьбы в области продвижения технологий преобразования голоса в текст. Чей алгоритм окажется лучше – покажет время.




Дополнительные материалы:

  • MapsWithMe В App Store имеется огромное количество различных приложений-навигаторов и картографических сервисов. Даже в iOS по умолчанию встроено приложение Google Maps. Эти программы, в […]
  • Auto-Lock (Автоблокировка) Как вы уже, наверное, заметили, iPhone автоматически блокируется при переходе в режим ожидания (путем нажатия кнопки Sleep/Wake). Он также блокируется после нескольких минут вашего […]
  • Как скрыть фотографии на iPhone Есть ли у вас фотографии на вашем мобильном помощнике iPhone (или iPad), которые вы хотите скрыть от членов семьи или кого либо еще, когда они случайно листают ваш фотоальбомы на […]
  • Snapseed для iPhone В App Store представлено огромное количество приложений для редактирования фотографий. Одно из лучших — Snapseed — продвинутый iOS-фоторедактор с широким набором инструментов, который […]
Share This

Поделитесь!

Если статья показалась Вам полезной.