Голос выдаёт настроение, даже если человек молчит — новая нейросеть слышит то, что скрыто за словами
Российские специалисты из СПбГЭТУ "ЛЭТИ" совместно с учеными Цзянсийского аграрного университета разработали нейросетевую модель SONANCE, способную распознавать человеческие эмоции по голосу с рекордной точностью. Система имитирует работу слуховых центров мозга и эффективно справляется с выделением речевых маркеров даже в условиях сильного акустического шума. Тестирование показало результат 86,17%, что превосходит показатели существующих мировых аналогов.
Архитектура нейросети состоит из трех модулей, которые последовательно очищают сигнал, анализируют смысл высказываний и классифицируют эмоциональные оттенки. SONANCE безошибочно различает восемь состояний: от ярости и страха до спокойствия и удивления. Как сообщает Газета.Ru, разработку планируют внедрять в системы мониторинга психического здоровья, онлайн-образование и интерфейсы "умных" автомобилей.
"Мы вдохновлялись способностями человеческого мозга: слуховая система человека обладает значительной шумоустойчивостью и высокоэффективным механизмом декодирования эмоций, которые мозг надежно различает даже в сложной шумовой обстановке. На основе принципов биологических систем построена и наша нейросетевая модель SONANCE", — отметил в интервью доцент кафедры САПР СПбГЭТУ "ЛЭТИ" Сергей Кузьмин.