Преобразование голоса в текст

Независимо от того, насколько быстро мы научились вводить текст с клавиатуры, этот способ никогда не  сможет работать так быстро, как быстро мы можем произносить слова. К счастью, современные технологии не стоят на месте и преобразование голоса в текст затрагивает все больше и больше областей в нашей жизни. Потенциал и возможности голосового ввода, способны сделать запись, диктуя текст, намного быстрее.

Возьмем, к примеру, ShoutOUT , приложение для iPhone доступное на App Store. Оно, использует огромные достижения в технологии «голос в текст», чтобы сделать набор SMS сообщений на iPhone намного легче, особенно для тех, кто делает это на ходу. ShoutOUT использует вычислительные и коммуникационные возможности вашего iPhone для отправки SMS . Программа позволяет пользователям наговорить текст сообщения, а затем отправить преобразованную в текст речь, в сообщении тому, кому вы укажете.

Но то, что интересно в ShoutOUT, так это то, что эту же технологию развивают такие компаний, как Jott , Dial2Do , и даже Google — с помощью голоса, решать задачи, которые требуют не только текстового ввода но и обратного преобразования. Будь то чтение новостей, заметок или даже отправка электронной почты, все это можно сделать быстрее с помощью голоса. Не говоря уже о всех удобствах использования такого преобразования, когда вы за рулем, или даже прогуливаетесь пешком. Вы получаете возможность работать  на улице и хотите услышать качественный голос диктора.

Основная проблема всех этих приложений, от  Dragon Dictation у Jott до Google Voice — это огромная сложность в обучении приложения. В зависимости от окружающих звуков или эмоционального состояния  ваш голос звучит по-разному и его невозможно использовать должным образом, так что часто приложения просто не работают. Некоторые программы не понимают, знаки препинания, и вы должны сказать что-то вроде: «Я пошел на работу сегодня утром запятая так как было запланировано три встречи восклицательный знак». Это не совсем естественный способ говорить. Но некоторые пользователи привыкли и вполне успешно используют его.

В ближайшее время мы станем свидетелями серьезной конкурентной борьбы в области продвижения технологий преобразования голоса в текст. Чей алгоритм окажется лучше — покажет время.




Share This

Поделитесь!

Если статья показалась Вам полезной.