Бaрaбaны, oбщeствeннoгo вoды, шeлeст листьeв и другиe звуки, кoтoрыe сaундтрeк к видeo, и вы смoжeтe услышaть в ближaйшeм будущeм, oн нe мoжeт быть пoлнoстью прирoднoгo прoисxoждeния. «Автор» этих звуков может быть компьютерная система искусственного интеллекта, которая достаточно умна, чтобы понять, что происходит в ролике, и чтобы гарантировать, что все соответствующие саундтрек. И, в некоторых случаях, система делает это так хорошо, что кажется наиболее реалистичным и естественные звуки, другими словами, компьютер-это своего рода аудио-версию теста Тьюринга.
Создание системы искусственного интеллекта, специалисты из лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института начали тренироваться на примеры простых процедур, таких как, стуча палкой по книге. Кроме того, программа находится «над головой» видео с естественным звуком, который показал, как шелестят листья на ветру, грохот падающих камней, и многие, многие другие. Всего в рамках программы было пропущено через тысячи видео, аудио треке, в котором приняли участие около 46 тысяч различных звуков.
Алгоритм извлекает из видео ключевую информацию в той форме, что есть объекты, материала, из которого они сделаны, их движение и т. д.», — говорит Эндрю Оуэнс (Эндрю Оуэнс) — «все это согласуется со звуками песни и храниться в базе данных.
При получении суммы в базе данных, программа искусственного интеллекта РАН по алгоритму т.н. глубокое изучение. В результате искусственный интеллект обрел способность идентифицировать объекты на видео и что происходит с ними, плюс алгоритм тесно связанных объектов, мероприятий и явлений, отдельных звуков.
После процесса самообучения система искусственного интеллекта была способна выразить его загрузка видео без песни. И эксперты, участвующие в оценке работы искусственного интеллекта, в среднем два раза из четырех выбрал песню искусственного происхождения, при прохождении аудио-версию теста Тьюринга. Но, в то время как искусственный интеллект, как правило, не в том, в некоторых случаях, особенно если объект на видео движется неравномерно, а рывками, что приводит к навязыванию видео не совсем подходящий звук.
Исследователи надеются, что дальнейшее обучение система искусственного интеллекта, на основе более сложной и различной видео, позволит существенно уменьшить количество совершаемых ошибок системы. И тогда он может быть успешно использован для «озвучивания» фильмов, телепередач, театральных постановок и т. д. Еще одной областью применения новой системы может стать виртуальная реальность, где искусственный интеллект, вероятно, будет в состоянии сформулировать все, что происходит в виртуальном мире.