Ученые из Университета Осло провели исследование, которое показало, что человеческий мозг способен отличать настоящие голоса от синтезированных с помощью искусственного интеллекта (ИИ). Результаты были представлены на конференции Federation of European Neuroscience Societies (FENS) Forum 2024.
В ходе эксперимента приняли участие 43 человека, которым предлагались записи настоящих и искусственных голосов с различными эмоциональными оттенками — нейтральной интонацией, злобой, страхом, радостью и удовольствием. При этом участники должны были определить, какая из записей была синтезирована, а также ученые фиксировали реакцию мозга с помощью функциональной магнитно-резонансной томографии (ФМРТ).
Исходя из результатов исследования, люди правильно определяли человеческую речь только в 56 процентах случаев, тогда как синтезированные голоса ИИ успешно идентифицировались лишь в 50,5 процентах случаев. Однако оказалось, что мозг человека отличает настоящую речь от искусственной с большей точностью, чем это предполагалось. Появление человеческих голосов вызывает более активную реакцию в областях мозга, связанных с памятью и эмпатией, тогда как голоса ИИ активируют области, отвечающие за обнаружение ошибок и регуляцию внимания.
Ученые сделали вывод о том, что человеческие голоса могут вызывать у людей чувство родства, в то время как голоса ИИ — нет. Ранее британские исследователи разработали метод, позволяющий точно определить, когда чат-боты на основе искусственного интеллекта лгут, основываясь на статистической неопределенности.
Этот результат может иметь важные последствия для развития технологий взаимодействия между человеком и компьютером. Например, создание более реалистичных голосовых помощников может потребовать разработки алгоритмов, которые способны имитировать эмоциональную интонацию человеческих голосов, чтобы обеспечить более естественное общение с пользователями.