ISSN 1991-3087

Свидетельство о регистрации СМИ: ПИ № ФС77-24978 от 05.07.2006 г.

ISSN 1991-3087

Подписной индекс №42457

Периодичность - 1 раз в месяц.

Вид обложки

Адрес редакции: 305008, г.Курск, Бурцевский проезд, д.7.

Тел.: 8-910-740-44-28

E-mail: jurnal@jurnal.org

Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

Идентификация и верификация пользователя в системах распознавания диктора по голосу

 

Панченко Евгения Юрьевна,

магистрант Московского государственного технологического университета «Станкин».

 

Задача распознавания диктора по его голосу была поставлена более 40 лет назад и исследования в этой области все еще продолжаются. Решение этой задачи может найти применение в криминалистике, радиоразведке, контрразведке, антитерростическом мониторинге, обеспечении безопасности доступа к физическим объектам, информационным и финансовым ресурсам.

Распознавание диктора подразделяется на два направления: идентификацию и верификацию. При верификации пользователь предъявляет в том или ином виде свой идентификатор и система распознавания должна подтвердить или отвергнуть этот идентификатор [1].

При идентификации диктор не указывает своего идентификатора и система распознавания должна установить, принадлежит ли речевой сигнал голосу одного из дикторов, прошедших обучение. Важный случай идентификации состоит в определении того, принадлежат ли два речевых сигнала голосу одного и того же диктора.

Типичная схема верификации представлена на рисунке 1.

 

Рис. 1. Схема верификации диктора.

Стрижка гражданский

стрижка гражданский

salonbrooklyn.ru

Аккумулятор для гироскутера

Доставка по регионам, гарантия. Аккумуляторы для любых видов гироскутеров

two-v.pro

 

Роль процедуры параметризации – выделить наиболее информативные характеристики речи, получив компактное описание речевого сигнала.

Обучение системы распознавания дикторов заключается в создании базы данных эталонных моделей, которые составляются на основе параметров, извлеченных из речевого образца диктора. Верификация производится вычислением меры близости (сходства) речевых параметров неизвестного пользователя и эталонных параметров пользователей, известных системе распознавания. В качестве меры близости очень часто используется евклидово расстояние, которое представляет собой геометрическое расстояние в многомерном пространстве [2]:

В целом система верификации может быть охарактеризована двумя вероятностями: ошибки первого рода (захват ложной цели – принятие злоумышленника за зарегистрированного пользователя) и ошибки второго рода (пропуск цели – отказ признать зарегистрированного пользователя). Ошибки одного рода могут быть уменьшены за счет увеличения ошибок другого рода путем изменения порога принятия решения [3].

Чистая идентификация подразумевает разделение допущенных пользователей в ограниченной и строго контролируемой группе пользователей системы. При поступлении речевого сигнала на вход системы определения индивидуальных речевых характеристик эта система должна определить, кто из пользователей в настоящий момент вступает в речевой контакт с системой ограниченного доступа. В этом случае исключена ситуация возможного злоумышленника. Типичная схема идентификации представлена на рисунке 2.

 

Рис. 2. Схема идентификации дикторов.

 

На практике ситуация чистой идентификации возникает достаточно редко. Примерами могут быть анализ и протоколирование переговоров экипажей, выявление каналов утечки информации при контроле телефонных разговоров и т.п.

В большинстве приложений возникает ситуация, так называемой открытой идентификации. В этом случае ситуация аналогична описанной выше верификации, но отличается тем, что пользователь не объявляет свою индивидуальность (фамилию, PIN-код или другой индекс индивидуальности) и система должна сверить поступивший речевой сигнал со всеми речевыми эталонами зарегистрированных пользователей. Таким образом, задача открытой идентификации совпадает с задачей многократной верификации.

 

Литература

 

1.                  В.Н.Сорокин, В.В.Вьюгин, А.А.Тананыкин «Распознавание личности по голосу: аналитический обзор» Информационные процессы, Том 12, №1, стр. 1-30, 2012 г.

2.                  Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов Москва: Изд. «Радио и связь», 2004. 164 с.

3.                  Матвеев Ю.Н. «Технологии биометрической идентификации личности по голосу и другим модальностям» Вестник МГТУ. Приборостроение, №4, 2011 г.

 

Поступила в редакцию 11.02.2013 г.

2006-2018 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.