Многие существующие технологии распознавания речи по мимике используют в качестве исходных данных видеоизображение. Однако для этого необходимо, чтобы перед лицом пользователя постоянно находилась видеокамера, а это не всегда удобно и безопасно.
Поэтому сотрудники Корнельского университета из США решили применить вместо видеокамер эхолокацию. Таким образом появилась технология EchoSpeech, которая позволяет бесконтактным образом с помощью ультразвуковых волн отслеживать небольшие движения губ и кожи лица во время шепота.
Разработанный прототип устройства представляет собой обычные очки. В нижней части оправы с одной стороны расположена пара звуковых динамиков, которые излучают непрерывные частотно-модулированные ультразвуковые сигналы. Отраженные от различных участков кожи лица и губ, затем сигналы попадают на установленную с противоположной стороны очков пару микрофонов и далее анализируются нейросетью ResNet-18.
Таким образом, очки, в оправу которых встроены два миниатюрных эхолокатора, получающих информацию о малейших движениях губ и кожи лица, и алгоритм машинного обучения предсказывает произнесенные слова с человеческой точностью в 95 процентов.
Разработчики протестировали устройство в нескольких реальных сценариях. Например, они использовали прототип в качестве дополнительного устройства ввода при взаимодействии с программами на смартфоне и планшете, а также для управления музыкальным плеером, запуская и переключая треки, меняя уровень громкости с помощью шепота.
На первый взгляд новинка выглядит как очередной забавный девайс, но в действительности системы распознавания речи на основе мимики человека имеют большой потенциал практического применения. Они могут использоваться не только людьми с нарушениями речи, но и в тех случаях, когда говорить вслух становится невозможно, например, из-за сильного окружающего шума или в социально неприемлемых ситуациях.
Когда речь заходит об уборке, большинство людей вспоминают кухню, прихожую или ванную комнату. Но на…
В Лондоне проходит турнир категории WTA 500 HSBC Women's World Championships. Во втором круге соревнований…
Приветствуя Марлена Маматалиева, Касым-Жомарт Токаев подчеркнул особую значимость его первого официального визита в Казахстан для…
В Штутгарте проходит турнир категории АТР 250 BOSS Open. В четвертьфинале соревнований казахстанец Александр Бублик…
Касым-Жомарт Токаев заслушал доклад Габита Сыздыкбекова о социально-экономическом развитии города, сообщает пресс-служба Акорды. Как сообщил…
Президенту Касым-Жомарту Токаеву была представлена информация о внедрении системных мер по защите прав детей, сообщает…