Categories: Технологии

Инженеры научили очки читать речь по губам

Многие существующие технологии распознавания речи по мимике используют в качестве исходных данных видеоизображение. Однако для этого необходимо, чтобы перед лицом пользователя постоянно находилась видеокамера, а это не всегда удобно и безопасно.

Поэтому сотрудники Корнельского университета из США решили применить вместо видеокамер эхолокацию. Таким образом появилась технология EchoSpeech, которая позволяет бесконтактным образом с помощью ультразвуковых волн отслеживать небольшие движения губ и кожи лица во время шепота.

Разработанный прототип устройства представляет собой обычные очки. В нижней части оправы с одной стороны расположена пара звуковых динамиков, которые излучают непрерывные частотно-модулированные ультразвуковые сигналы. Отраженные от различных участков кожи лица и губ, затем сигналы попадают на установленную с противоположной стороны очков пару микрофонов и далее анализируются нейросетью ResNet-18.

Таким образом, очки, в оправу которых встроены два миниатюрных эхолокатора, получающих информацию о малейших движениях губ и кожи лица, и алгоритм машинного обучения предсказывает произнесенные слова с человеческой точностью в 95 процентов.

Где нужны такие очки?

Разработчики протестировали устройство в нескольких реальных сценариях. Например, они использовали прототип в качестве дополнительного устройства ввода при взаимодействии с программами на смартфоне и планшете, а также для управления музыкальным плеером, запуская и переключая треки, меняя уровень громкости с помощью шепота.

На первый взгляд новинка выглядит как очередной забавный девайс, но в действительности системы распознавания речи на основе мимики человека имеют большой потенциал практического применения. Они могут использоваться не только людьми с нарушениями речи, но и в тех случаях, когда говорить вслух становится невозможно, например, из-за сильного окружающего шума или в социально неприемлемых ситуациях.

Ярослав Литвинов

Recent Posts

КХЛ. «Барыс» в гостях разгромил «Амур» (видео)

«Барыс» провел четвертый из шести выездных матчей. Астанчане сыграли в Хабаровске с «Амуром». Счет в…

4 дня ago

Президент Казахстана осудил ракетные обстрелы и атаки иранских беспилотников на ОАЭ

Касым-Жомарт Токаев осудил ракетные обстрелы и атаки беспилотников с иранской территории на Объединенные Арабские Эмираты…

4 дня ago

Трагедия в Атырауской области: подозреваемый признался в убийстве четырех человек (видео)

В Атырауской области раскрыто особо тяжкое преступление, связанное с исчезновением семьи из села Жангельдин, сообщает…

5 дней ago

Легкость в теле и спокойствие в голове: практик из Астаны рассказал, почему люди выбирают цигун

В Казахстане всё больше людей интересуются древними восточными практиками - цигун и тайцзи. Как проходят…

5 дней ago

Развивая интеллектуальный образ жизни: Xiaomi представляет новую волну AI-решений Human × Car × Home на MWC 2026

Вернувшись на MWC 2026, глобальный лидер в области инноваций и технологий Xiaomi продолжает демонстрировать свою…

5 дней ago

Рыбакина вышла в четвертый круг топ-турнира в Индиан-Уэллс (видео)

В Индиан-Уэллс (США) проходит один самых престижные турниров мирового тенниса BNP Paribas Open (WTA 1000,…

5 дней ago