Применение современных языковых моделей для автоматической транскрибации и анализа аудиозаписей телефонных разговоров сотрудников отдела продаж с клиентами
Аннотация
Дата поступления статьи: 07.06.2025Статья посвящена изучению возможностей автоматической транскрибации и анализа аудиозаписей телефонных разговоров сотрудников отдела продаж с клиентами. Актуальность исследования связана с ростом объема голосовых данных и потребностью в их быстрой обработке в организациях, деятельность которых тесно связана с продажей своих продуктов или услуг клиентам. Автоматическая обработка аудиозаписей позволит провести проверку качества работы сотрудников call-центров, определяя допущенные нарушения в скриптах разговоров с клиентами. Предложенное программное решение основано на использовании модели Whisper для распознавания речи, библиотеки pyannote.audio для диаризации спикеров, а также библиотеки RapidFuzz для организации нечёткого поиска при проведении анализа строк. В ходе экспериментального исследования, проведенного на базе разработанного программного решения, было подтверждено, что использование современных языковых моделей и алгоритмов позволяет добиться высокой степени автоматизации обработки аудиозаписей и может использоваться в качестве инструмента предварительного контроля без участия специалиста. Полученные результаты подтверждают практическую применимость используемого авторами подхода для решения задач контроля качества в отделах продаж или call-центрах.
Ключевые слова: call-центр, аудиофайл, распознавание речи, транскрибация, диаризация спикеров, классификация реплик, обработка аудиозаписей, Whisper, pyannote.audio, RapidFuzz
1.2.2 - Математическое моделирование, численные методы и комплексы программ
.