Группа исследователей из области информатики (факультет компьютерных наук) в университете Восточной Англии (Университет Восточной Англии), во главе с профессором Ричардом Харви (Ричард Харви), завершила разработку новой системы распознавания речи на губы, движения и мимику говорящего. Эта система, построенная на принципах самообучения искусственного интеллекта, имеет высокую точность и может оказать неоценимую помощь правоохранительным органам при расследовании преступных деяний, предоставить возможности общения для людей с нарушением слуха и речевого аппарата.
«Наша система может применяться везде, где нельзя получить аудио с качеством достаточным, чтобы определить то, что говорят люди», — говорит БИР Елена л. (Елена л. Медведь), доктор наук из Университета Восточной Англии, — «распознавание речи на губы будут полезны не только в расследовании преступлений, они могут быть частью системы контроля в местах, где имеется высокий уровень шума, например, в вагонах и в кабине».
Следует отметить, что системы распознавания речи по движениям губ является не первым, что было создано людьми. Но, все разработчики подобных систем сталкиваются с проблемами, что некоторые звуки, например ‘/Р/’, ‘/Б/ » И » /М/’ во Время произношения выглядит почти так же. Но, новая система, которая прошла через процедуру обучения, можно выделить схожие с визуальной точки зрения, звуков, что значительно улучшает качество процесса «чтение губы».
«Сейчас мы продолжаем исследования визуальной составляющей человеческой речи. И все, что мы имеем возможность узнать новые вещи, тут же воплощается в виде математических моделей, которые основаны на работе нашей системы. И процедур преподавания и обучения, которые являются специализированными классификаторами можно увеличить точность системы во много раз больше по сравнению с точностью других подобных систем», — говорит профессор Харви, — «читайте по губам — это достаточно сложная задача, даже для систем с искусственным интеллектом, она осложняется тем, что у всех людей разные формы губ».
Данная разработка является результатом трех лет усилия исследователей, которые работали в Комиссии инженерным и физическим научным исследованиям Совета (совет). И более подробная информация по новой системе будут доступны после того, как ее презентация состоится на международной конференции Международной конференции по акустике, речи и обработке сигналов (ICASSP), который вскоре состоится в Шанхае.