ИИ воссоздает лица людей на основе их голоса

Наша жизнь полна безликих голосов. И хотя большинство из нас довольствуется созданием ментального образа этих бестелесных ораторов, будь то голос называющий станции в метро или диктора за кадром, группа исследователей из Массачусетского технологического института пошла еще дальше, создав систему искусственного интеллекта, которая может реконструировать лица людей, просто слушая их голос.

Приложение, называемое Speech2Face, представляет собой нейронную сеть, которая была обучена распознавать корреляцию между голосами и чертами лица, наблюдая за миллионами видеороликов на YouTube.

При этом ИИ научился связывать различные аспекты звуковой волны с возрастом, полом и этнической принадлежностью говорящего, а также с некоторыми особенностями черепа, такими как форма головы и ширина носа.

Когда исследователи затем загружали в систему аудиозаписи голосов людей, она была в состоянии генерировать изображение лица каждого говорящего с большой точностью.

Очевидно, что такие характеристики, как прическа, волосы на лице и некоторые другие элементы внешнего вида невозможно предсказать по голосу человека, поэтому разработчики настаивают на том, что их целью было “не предсказать узнаваемый образ точного лица, а скорее захватить доминирующие черты лица человека, которые коррелируют с входной речью”.

Оригинал earth-chronicles.ru