Методы обнаружения ложных голосовых сигналов
Аннотация
Дата поступления статьи: 04.05.2025В статье анализируются различные подходы к генерации и обнаружению аудиодипфейков. Особое внимание уделяется предобработке акустических сигналов, выделению параметров голосовых сигналов и классификации данных. В работе рассмотрены три группы классификаторов: метод опорных векторов, метод K-ближайших соседей и нейронные сети. Для каждой группы были выделены эффективные методы, и на основе общего анализа определены наиболее результативные подходы. В ходе работы было выявлено два подхода, демонстрирующих высокую точность и надежность: детектор на основе временных сверточных сетей, анализирующим MFCC-кепстрограмму показал метрику EER = 0.07%, тогда как метод опорных векторов с ядром в виде радиальной базисной функции достиг метрики EER = 0.5%, а также показал следующие значения метрик на наборе данных ASVspoof 2021: Accuracy = 99.6%, F1-score = 0.997, Precision = 0.998 и Recall = 0.994.
Ключевые слова: аудиодипфейки, предобработка акустических сигналов, метод опорных векторов, метод K-ближайших соседей, нейронные сети, временные сверточные сети, обнаружение дипфейков
2.3.6 - Методы и системы защиты информации, информационная безопасность
.