Исследователи из Университета Карнеги – Меллон научили нейросеть распознавать людей по вздохам между словами. В работе использовалась нейросеть с долгой краткосрочной памятью. В нее закачали больше 100 часов выпусков новостей на английском языке. На основе этой информации нейросеть натренировалась распознавать речь, а затем и отдельные фонемы.
Позже ученые отделили из общего потока звуки между словами. Один из авторов исследования Рита Сингх пояснила, что вздохи отличаются от других речевых компонентов тем, что их намного сложнее контролировать и намного сложнее подделать. Использование нейросети для их распознавания позволило заметно повысить точность распознавания человека.
Другой способ распознавания по вздохам – через супервекторы. Ученые обратились к методике, которая распознающей супервекторы признаков (методика используется в большинстве систем по распознаванию голоса). Способ позволяет преобразовать отдельные фрагменты речи в векторы. Среди них ищут области со сгущениями (супервекторы). Затем эти данные анализируется с помощью классификаторов.
В ходе эксперимента ученые установили, что распознавание личности при помощи супервекторов не такое точное, как с использованием нейросети. Результат у первого способа – 72–74%, а у второго – больше 91%.