ISSN 1991-3087

Свидетельство о регистрации СМИ: ПИ № ФС77-24978 от 05.07.2006 г.

ISSN 1991-3087

Подписной индекс №42457

Периодичность - 1 раз в месяц.

Вид обложки

Адрес редакции: 305008, г.Курск, Бурцевский проезд, д.7.

Тел.: 8-910-740-44-28

E-mail: jurnal@jurnal.org

Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

Идентификация и верификация пользователя в системах распознавания диктора по голосу

 

Панченко Евгения Юрьевна,

магистрант Московского государственного технологического университета «Станкин».

 

Задача распознавания диктора по его голосу была поставлена более 40 лет назад и исследования в этой области все еще продолжаются. Решение этой задачи может найти применение в криминалистике, радиоразведке, контрразведке, антитерростическом мониторинге, обеспечении безопасности доступа к физическим объектам, информационным и финансовым ресурсам.

Распознавание диктора подразделяется на два направления: идентификацию и верификацию. При верификации пользователь предъявляет в том или ином виде свой идентификатор и система распознавания должна подтвердить или отвергнуть этот идентификатор [1].

При идентификации диктор не указывает своего идентификатора и система распознавания должна установить, принадлежит ли речевой сигнал голосу одного из дикторов, прошедших обучение. Важный случай идентификации состоит в определении того, принадлежат ли два речевых сигнала голосу одного и того же диктора.

Типичная схема верификации представлена на рисунке 1.

 

Рис. 1. Схема верификации диктора.

Аккумулятор для гироскутера

Доставка по регионам, гарантия. Аккумуляторы для любых видов гироскутеров

two-v.pro

 

Роль процедуры параметризации – выделить наиболее информативные характеристики речи, получив компактное описание речевого сигнала.

Обучение системы распознавания дикторов заключается в создании базы данных эталонных моделей, которые составляются на основе параметров, извлеченных из речевого образца диктора. Верификация производится вычислением меры близости (сходства) речевых параметров неизвестного пользователя и эталонных параметров пользователей, известных системе распознавания. В качестве меры близости очень часто используется евклидово расстояние, которое представляет собой геометрическое расстояние в многомерном пространстве [2]:

В целом система верификации может быть охарактеризована двумя вероятностями: ошибки первого рода (захват ложной цели – принятие злоумышленника за зарегистрированного пользователя) и ошибки второго рода (пропуск цели – отказ признать зарегистрированного пользователя). Ошибки одного рода могут быть уменьшены за счет увеличения ошибок другого рода путем изменения порога принятия решения [3].

Чистая идентификация подразумевает разделение допущенных пользователей в ограниченной и строго контролируемой группе пользователей системы. При поступлении речевого сигнала на вход системы определения индивидуальных речевых характеристик эта система должна определить, кто из пользователей в настоящий момент вступает в речевой контакт с системой ограниченного доступа. В этом случае исключена ситуация возможного злоумышленника. Типичная схема идентификации представлена на рисунке 2.

 

Рис. 2. Схема идентификации дикторов.

 

На практике ситуация чистой идентификации возникает достаточно редко. Примерами могут быть анализ и протоколирование переговоров экипажей, выявление каналов утечки информации при контроле телефонных разговоров и т.п.

В большинстве приложений возникает ситуация, так называемой открытой идентификации. В этом случае ситуация аналогична описанной выше верификации, но отличается тем, что пользователь не объявляет свою индивидуальность (фамилию, PIN-код или другой индекс индивидуальности) и система должна сверить поступивший речевой сигнал со всеми речевыми эталонами зарегистрированных пользователей. Таким образом, задача открытой идентификации совпадает с задачей многократной верификации.

 

Литература

 

1.                  В.Н.Сорокин, В.В.Вьюгин, А.А.Тананыкин «Распознавание личности по голосу: аналитический обзор» Информационные процессы, Том 12, №1, стр. 1-30, 2012 г.

2.                  Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов Москва: Изд. «Радио и связь», 2004. 164 с.

3.                  Матвеев Ю.Н. «Технологии биометрической идентификации личности по голосу и другим модальностям» Вестник МГТУ. Приборостроение, №4, 2011 г.

 

Поступила в редакцию 11.02.2013 г.

2006-2018 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.