Технология идентификации по голосу Voice Key

Вид работы:

Курсовая работа (т)
Предмет:

Информатика, ВТ, телекоммуникации
Язык:

Русский
,
Формат файла:
MS Word

1,45 Мб
Опубликовано:

2013-03-31

Все курсовые работы по информатике

Скачать курсовую работу Читать текст online Заказать курсовую
*Помощь в написании! Посмотреть все курсовые работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Технология идентификации по голосу Voice Key

Содержание

1. Технико-экономическое обоснование проекта VoiceKey

.1 Технология идентификации по голосу

.2 Преимущества биометрических систем аутентификации

2. Краткий обзор состояния рынка речевых технологий

.1 Обоснование актуальности технологии VoiceKey

. Обоснование предлагаемого проектного решения

3.1 Состояние рынка биометрических технологий

.2 Характеристика современных систем голосовой биометрии

.3 Голосовая биометрия в России

. Характеристика предлагаемой технологии

.1 Техническая характеристика технологии VoiceKey

. Содержание выполняемых работ

.1 Сроки исполнения и финансирование по этапам

. Область возможного использования

.1 Голосовая биометрия

.2 Использование голосовой биометрии в различных областях

.3 Состояние рынка систем идентификации в настоящее время

.4 Системы голосовой аутентификации различных компаний

.5 Перспективы голосовой биометрии

. Оценка стоимости работы

. Планируемые объемы производства

. Анализ рынков сбыта и прогноз реализации

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. ТЕХНИКО-ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ПРОЕКТА VOICEKEY

.1 Технология идентификации по голосу

Технология идентификации по голосу Voice Key - это программный модуль, реализующий технологию биометрической верификации человека по произнесенной фразе.

Биометрическая голосовая аутентификация является эффективным средством и широко используется в корпоративном и государственном секторе с целью предотвращения несанкционированного доступа к данным. Технология Voice Key - одна из ключевых речевых разработок ЦРТ - нацелена на борьбу с такими актуальными угрозами информационной безопасности, как:

· «Хищение личности» или «identity theft»: использование злоумышленником персональных данных человека, полученных из клиентских баз данных с целью приобретения товаров и услуг, получения кредитов и совершения других неправомерных действий. Ущерб несут как сами клиенты и их материальная обеспеченность (платежеспособность), так и репутация (а, следовательно, и доходы) компании-владельца базы данных

· Хищение ценной корпоративной информации сотрудниками компании или внешними злоумышленниками посредством несанкционированного доступа к корпоративным данным. Нанесенный компании ущерб может быть огромен: утраченные ноу-хау и технологии, информация о состоянии дел, а также клиентские базы и данные о ключевых сотрудниках - теперь уже бывшие источники денежных потоков компании и ее финансовой стабильности.

1.2 Преимущества биометрических систем аутентификации

Биометрические системы аутентификации обладают существенными отличиями от традиционных СКУД, использующих в качестве идентификаторов личности символьные пароли и электронные ключи. Биометрическая аутентификация производится по действительно индивидуальным признакам личности, а не по ассоциированному с личностью материальному носителю или коду. Биометрия практически исключает возможность несанкционированных действий как следствие потери, кражи или передачи пароля третьим лицам.

Преимущества системы голосовой биометрической аутентификации VoiceKey:

В основе технологии голосовой аутентификации лежит постулат об уникальности физиологического строения речевого тракта каждого человека.

Ключевое преимущество VoiceKey перед биометрическими СКУД на основе анализа папиллярных узоров или сетчатки глаза состоит в возможности получения и передачи в удостоверяющий центр биометрических данных без применения специализированных и дорогостоящих съемников биометрической информации: достаточно иметь телефон или микрофон, подключенный к компьютеру.

Так как эта технология является одним из перспективных направлений в области компьютерной безопасности, то привлечь средства для дальнейшего финансирования и продвижения на рынок технологий данного проекта будет несложно. Этот проект является перспективным и финансово устойчивым, следовательно, инвестиции вложенный проект окупятся за относительно быстрый срок. Ориентировочная сумма инвестиций вложенных в проект составляет около 20 миллионов рублей. Из них 40% будет вложено из местного бюджета, 50% из инвестиционной компании, которая заинтересована в реализации данного проекта, 20% собственные средства центра.2. КРАТКИЙ ОБЗОР СОСТОЯНИЯ РЫНКА РЕЧЕВЫХ ТЕХНОЛОГИЙ

.1 Обоснование актуальности Технологии VoiceKey

На сегодняшний день отмечается рост рынка речевых технологий, инвестиции в них растут из года в год. Использование речевых технологий становятся все более эффективным средством снижения затрат и решением, позволяющим повысить качество работы компании.

Сегодня доступны частичные решения с применением речевых технологий с возможностью их дальнейшего преобразования, имеется возможность использования речевых технологий в качестве встроенных решений, например, мобильные телефоны с использованием голосовых функций, а также имеются полностью готовые решения.

Решения с применением речевых технологии (синтеза, распознавания речи, идентификации, верификации и др.) разрабатываются с учетом специфики работы компании, её потребностей и условий работы. Они различаются по функционалу, но все нацелены на повышение эффективности работы заказчика.

Существует несколько разновидностей биометрических технологий: технологии верификации по чертам лица, по голосу, по отпечаткам пальцев и по радужной оболочке. Следующая Таблица №1 позволяет наглядно оценить преимущества речевых технологий перед остальными:

Таблица №1. Преимущества речевых технологий

Наименование	Отпечаток пальца	Голос	Радужная оболочка глаза	Лицо
Уровень равной ошибки (EER)	2-3.3%	0.1 - 0.86%	4.1-4.6%	4.1%
Отказ в регистрации	4%	2%	7%	~0%
Вероятность захвата ложной цели	2.5%	0.75%	6%	4%
Вероятность пропуска цели	0.1%	0.75%	0.001%	10%
Стоимость системы	Высокая	Низкая	Очень высокая	Высокая

Технология Voice Key основана на уникальности голоса человека, который несет индивидуальную информацию в силу акустических особенностей речи. Они отражают как особенности физиологического строения артикуляторного аппарата, так и приобретенные привычки. Именно поэтому в последнее время компании-разработчики биометрических систем используют голос для определения личности говорящего.

Данная технология имеет ряд преимуществ по сравнению с остальными:

· Низкая стоимость внедрения и владения - не требуются специальные дорогостоящие средства ввода биометрической информации

· Совмещение процедуры коммуникации и идентификации

· Высокая надежность верификации, сопоставимая с верификацией по отпечаткам пальцев

· Идентификация в телефонном канале

· Независимость от национального языка или диалекта

Таким образом, технология позволяет значительно облегчить труд людей в определенных областях деятельности, а наличие отличительных характеристик делает ее привлекательным объектом для инвестирования.

3. ОБОСНОВАНИЕ ПРЕДЛАГАЕМОГО ПРОЕКТНОГО РЕШЕНИЯ

.1 Состояние рынка биометрических технологий

Объем мирового рынка биометрических технологий достиг в 2006 году $2 млрд. Из них примерно половина приходится на технологию Fingerprint (верификация-идентификация по отпечатку пальцев), а другая половина разными долями распределяется между технологиями верификации по чертам лица, голосу и радужной оболочке.

Специалистами отрасли прогнозируется дальнейший рост рынка биометрических технологий с изменением пропорций в пользу голосовой биометрии. Уже в 2006 году на каждые три доллара, вложенные в Fingerprint, приходится один доллар, вложенный в системы идентификации-верификации по голосу. Более того, к 2012 году прогнозируется изменение этого соотношения до 2/1 с опережающим ростом доли, занимаемой голосовой биометрии (до $1,4 млрд).

Существуют объективные причины для увеличения роли голосовой верификации в биометрических системах: речь - основной вид коммуникации во всех областях человеческой деятельности; речь позволяет совместить процедуры верификации и коммуникации; личность автора звучащей речи может быть определена без непосредственного контакта с ним; голос практически невозможно забыть дома или “потерять”, как паспорт или обычный ключ; для верификации по голосу не требуется сложных специальных технических средств ввода. Более того, материалы сравнительного анализа существующих биометрических систем, проведенного различными авторитетными в этой области организациями: Opus Research; University of Canberra; European Commission Joint Research Centre, An Efficient One-Dimensional Fractal Analysis for Iris Recognition; FVC2004: Third Fingerprint Verification Competition; Preliminary Report on Development and Evaluation of MultiBiometric Fusion using the NIST BSSR1 517-Subject Dataset, демонстрируют очевидное преимущество систем, основанных на использовании голоса, как по надежности работы, так и по стоимости. Важно отметить, что только 2% лиц не смогли зарегистрироваться в системе верификации по голосу, в то время как доля отказов в регистрации для “отпечатка пальцев” составила 4%, а по радужной оболочке глаза - уже 7%.

Области использования голосовой биометрии сегодня постоянно расширяются. Еще 10 лет назад все ограничивалось криминалистической идентификацией, а сегодня даже такие консервативные учреждения, как крупные банки, не боятся использовать голос для верификации своих клиентов. Например, представитель банка ABN.AMRO (Голландия) следующим образом проиллюстрировал результаты внедрения системы голосовой верификации клиентов: из 35 млн. обращений клиентов по обычным телефонным линиям только пятую часть пришлось обрабатывать вручную, то есть они не были верифицированы как клиенты банка. Очевидно, что ни одна другая система верификации не сможет продемонстрировать такую эффективность (надежность + быстродействие) без использования каких-либо специальных технических средств ввода и обработки (анализа) информации.

В правоохранительной деятельности еще не накоплен опыт использования голосовой биометрии в таких масштабах. Но весьма впечатляют результаты, полученные при использовании системы “Трал” (ЦРТ) (один из аналогов VoiceKey) в системе фонового учета МВД Республики Беларусь. На поиск интересующего лица с помощью обычного (настольного) ПК среди 10 тыс. образцов система затрачивает до 2 часов. В то же время эксперту-криминалисту только на прослушивание речевого материала потребовалось бы около пяти месяцев работы (с учетом средней продолжительности фонограммы 5 минут).

3.2 Характеристика современных систем голосовой биометрии

В настоящее время используются как текстозависимые, так и текстонезависимые системы. Первые нашли свое применение в системах контроля доступа: для верификации необходимо произнести в микрофон парольную фразу, которая сравнивается с хранящимися в системе эталонами произнесения для каждого зарегистрированного пользователя.

Текстонезависимые системы используются, как правило, при решении полицейских задач: скрытая идентификация, криминалистическая идентификация, фоновые учеты. Для верификации или идентификации в таких системах может использоваться практически любой фрагмент свободно звучащей речи достаточной длины.

В Центре речевых технологий разработаны технологии верификации-идентификации обоих типов. Так, например, VoiceKey позволяет авторизовать пользователя по парольной фразе длиной 3 секунды с вероятностью ошибки не более 1%. В данной технологии реализован спектрально-формантный метод выделения и сравнения положения и динамики изменения трех и более формант.

Практика применения различных технологий верификации-идентификации в реальных условиях показала зависимость надежности работы систем голосовой биометрии от качества сигнала: уровня широкополосных помех и искажений, вносимых в сигнал при передаче по каналам связи. В связи с этим специалистам ЦРТ пришлось решать еще ряд сложных задач по снижению уровня широкополосных шумов, удалению длительных неречевых фрагментов сигнала (в том числе технических сигналов), “нормализации на канал” (компенсация канальных искажений АЧХ).

В 2006-2007 годах был реализован метод верификации на основе СГР (смеси Гауссовых распределений). Использование данного метода позволяет существенно повысить надежность верификации на коротких фрагментах речи. Но на практике данный метод демонстрирует высокую эффективность только в отношении речевых сигналов высокого качества при отношении сигнал/шум выше 20 дБ.

.3 Голосовая биометрия в России

Несмотря на имеющийся положительный опыт внедрения и использования голосовой биометрии в сфере безопасности, Россию нельзя считать лидером в этой области. Традиционно тон на рынке новых технологий задают США, а также компании из Западной Европы и Израиля.

На территории бывшего СССР наиболее активную позицию по масштабному внедрению технологий голосовой биометрии сегодня занимает МВД Республики Беларусь. Началась реализация программы по созданию фоновых учетов в Республике Казахстан. Несмотря на отставание, у России есть реальный шанс в ближайшее время наверстать упущенное и стать одним из мировых лидеров в области биометрии.

Создано и все активнее работает Русское биометрическое общество, начата разработка биометрических стандартов, все больше государственных заказов на выполнение ОКР, связанных с разработкой систем голосовой биометрии, размещаются в научных институтах и коммерческих компаниях. Если раньше ЦРТ приходилось бороться за каждый такой заказ, то сейчас компания вынуждена отказываться от некоторых по причине большой загруженности.

Данный проект решает задачи создания российского программного обеспечения направленного на защиту безопасности данных, как на уровне страны, так и на уровне отдельно взятых пользователе заинтересованных в защите своей информации. В течение 14 месяцев планируется провести предварительные расчеты, изготовление макетов и испытания, патентные исследования и заключительные действия, направленные на доработку конструкторской и эксплуатационной документации.

. ХАРАКТЕРИСТИКА ПРЕДЛАГАЕМОЙ ТЕХНОЛОГИИ

.1 Техническая характеристика технологии VoiceKey

Технология идентификации по голосу Voice Key основана на уникальности геометрии речевого тракта каждого человека. В Voice Key используется спектрально-формантный метод, базирующийся на различных спектральных характеристиках речи разных людей. Спектрально-формантный метод основан на анализе поведения трех и более формант (спектральных максимумов), отражающих уникальность геометрии речевого тракта индивида.

Наиболее явно различие спектральных характеристик проявляется в соположении формант в вокализованных отрезках речи. Пример формантного представления речи двух разных людей при произнесении фразы «Голосовой поиск» приводится на рисунке №1 ниже (по вертикальной оси - частота сигнала в Гц, по горизонтальной - время звучания в секундах, степень зачернения отражает концентрацию энергии).

Рисунок №1. Пример формантного представления речи двух разных людейИспользуемый в Voice Key спектрально-формантный метод основан на выделении и сравнении положения и динамики поведения трех и более формант. Используется несколько десятков параметров, характеризующих формантную структуру речи.

Принцип работы включает 4 основных этапа:

· Создание шаблона - сведения о физиологической или поведенческой характеристике преобразуются в форму, доступную компьютерным технологиям, и сохраняются в память биометрической системы

· Выделение - из вновь предъявленного идентификатора выделяются уникальные признаки, анализируемые системой

· Сравнение - сопоставляются сведения о вновь предъявленном и ранее зарегистрированном идентификаторе

· Решение - вносится заключение о том, совпадают или не совпадают вновь предъявленный и ранее зарегистрированный идентификатор

Заключение о совпадении/несовпадении идентификаторов затем транслируется другим системам (контроля доступа, защиты информации и т.д.), которые далее действуют в зависимости от полученной информации.

Важнейшим элементом успешного распознавания дикторов является выбор информативных признаков (речевых параметров), способных эффективно представлять информацию об особенностях речи конкретного диктора.

К ним предъявляются следующие требования:

эффективность представления информации об особенностях речи конкретного диктора;

простота измерения;

стабильность во времени;

частое и естественное появление в речи;

невосприимчивость к имитации.

В качестве уникального вектора признаков можно использовать одномерный частотный вектор кепстральных коэффициентов, а также вектор, составленный из его производных.

Кепстральные коэффициенты определяются в соответствии со схемой, представленной на Рисунке №2:

Рисунок №2 - Общая схема кепстрального анализа сигнала (FFT - блок быстрого преобразования Фурье сигнала, LOG - блок логарифмирования спектра, IFFT - блок обратного быстрого преобразования Фурье)

В качестве вектора признаков можно использовать коэффициенты отражения. Физический смысл коэффициентов отражения состоит в определении величины волны, отраженной на границе двух акустических труб.

Коэффициенты отражения рассчитываются путем преобразования вектора коэффициентов предсказывающего фильтра a в коэффициенты отражения соответствующей решетчатой структуры по следующему рекурсивному алгоритму:

(n)=an(n) (1.1)

(1.2)

Данные формулы основаны на рекурсивном алгоритме Левинсона. Для его реализации в цикле перебираются элементы вектора a, начиная с последнего и заканчивая вторым.

Иногда используются также функции от коэффициентов отражения - логарифмические отношения площадей (Log-Area Ratio - LAR):

(1.3)

где ki - коэффициенты отражения.

Еще одним признаком являются площади поперечных сечений акустических труб. Голосовой тракт можно представить в виде последовательности р акустических труб одинаковой длины и различных диаметров, имеющие площади поперечных сечений Ai. Представление голосового тракта в виде последовательности труб изображено на Рисунке №3.

Площади поперечных сечений Ai акустических труб вычисляется через коэффициенты отражения:

(1.4)

где р - порядок линейного предсказателя,- коэффициенты отражения.

(A2 ,..., Ap+1) - вектор признаков, основанный на площадях акустической трубы.

Рисунок №3- Представление голосового тракта в виде последовательности труб

Коэффициенты отражения определяют соотношение площадей соседних секций. Таким образом, площади поперечного сечения не определяются абсолютно точно, но все-таки эти площади часто бывают сходными с конфигурацией голосового тракта, используемого человеком при речеобразовании.

В настоящее время на мировом рынке существуют аналоги данной системе. Это технологии STC Grid ID, Veri Speak, BioLink AMIS, VOCORD VoicelD, Трал Лаб и М ID.

Отличительные особенности каждой из систем представлены в таблице №2.

Таблица №2

Наименование основных параметров (характеристик) продукции		Сравнительные значения зарубежных аналогов продукции			Сравнительные значения отечественных аналогов продукции			Рассматриваемая технология
		STC Grid ID	Veri Speak	BioLink AMIS	VOCOD VoicelD	Трал Лаб	М ID	Voice Key
Использование технологий шумоочистки речевых сигналов	1)BABBLE NOISE	+	+	+	+	+	+	+
	2) MUSIC NOISE	+	+	-	-	+	-	+
	3)NONSTATIONARY NOISE	+	-	+	+	-	+	-
	4) PULSE NOISE	+	+	+	-	+	+	-
	5)TONAL NOISE	+	-	+	+	+	-	-
	6)WIDEBAND NOISE	+	+	+	+	+	-	+
	7) GSM HINDRANCE	+	-	+	+	-	+	-
	8)CLIPPING	+	+	-	+	+	-	+
	9)REVERBERATION & NOISE	+	-	+	-	+	-	+
10) Объем базы данных ( образцов голосов)		1 200000	800 000	1 000000	800 000	600 000	500 000	600 000
11) Пиковая производительность2 (сравнений за минуту)		300 000	400 00	250 000	200 000	300 000	350 000	300 000
12) Возможность удаленной работы3		Полноценная	Полноценная	Ограниченная	Полноценная	Ограниченная	Ограниченная	Ограниченная
13) Платформо-независимость4		Полноценная	Ограниченная	Полноценная	Полноценная	Полноценная	Ограниченная	Ограниченная
Комбинации с другими биометрическими методами5	14)VERILOOK	+	+	-	-	+	-	-
	15)VERIFINGER	-	+	-	-	-	+	-
	16)VERIEYE	-	+	-	-	+	-	-
17) Макс, общая емкость СУБД (млн. записей)		300	200	200	150	100	100	150
18) Длительность аудиозаписи6 (сек)		90	60	60	80	60	60	70
19) Отношение сигнал/шум7 (Дб)		12	12	10	14	14	12	14

.Технологии шумоочистки речевых сигналов:

) BABBLE NOISE - технология подавления шума толпы

) MUSIC NOISE - технология подавления шума музыки

) NONSTATIONARY NOISE - технология подавления нестационарных шумов

) PULSE NOISE - технология подавления импульсных шумов

) TONAL NOISE - технология подавления тональные помех

) WIDEBAND NOISE - технология подавления широкополосных шумов

) GSM HINDRANCE - технология подавления наводки мобильных телефонов

) CLIPPING - клиппирование сигнала - обрезание пороговых значений.

) REVERBERATION & NOISE - реверберация

. Пиковая производительность - максимальна возможная скорость работы системы.

. Возможность удаленной работы - поддерживаемые браузеры и типы Веб-интерфейса в совокупности с защищенными протоколами передачи данных.

. Платформонезависимость - определяет, в какой степени система совместима со всеми существующими операционными системами, что позволяет подстраиваться под IT-инфраструктуру Заказчика.

. Комбинации с другими биометрическими методами:

) VERILOOK - идентификация лица, отпечатков пальцев и ладони

) VERIFINGER - идентификация отпечатков пальцев и ладони

) VERIEYE - идентификация радужной оболочки

. Длительность аудиозаписи - длительность аудиозаписи для корректного получения индивидуальных особенностей голоса диктора, используемых при построении «дикторской» карточки.

. Отношение сигнал/шум - в таблице указаны минимальные значения параметра.

Проанализировав данную таблицу можно сказать, что технология Voice Key является конкурентоспособной благодаря оптимальному соотношению цены и функциональности. Данная система поддерживает основные технологии шумоочистки речевых сигналов, а значения основных параметров не уступают существующим аналогам. Также, технология Voice Key имеет два уровня защиты (сравнение биометрических данных и проверка пароля) и может работать в зашумленных условиях. Все это позволяет предположить, что данная технология сможет успешно позиционировать себя на мировом рынке.

5. СОДЕРЖАНИЕ ВЫПОЛНЯЕМЫХ РАБОТ

.1 Сроки исполнения и финансирование по этапам

Перечень документов, разрабатываемых на этапах выполнения НИР, сроки исполнения и стоимость работ приведены в календарном плане.

ПРОЕКТ КАЛЕНДАРНОГО ПЛАНА

выполнения работ по ОКР

«_______________________________________»

№ п/п	Наименование этапов	Содержание выполняемых работ	Перечень документов, разрабатываемых на этапах	Срок исполнения	Стоимость этапов (рубли)
1	2	3	4	5	6
	Этап 1. Техническое предложение	предварительные расчеты; изготовление и испытания макетов; проведение патентных исследований; разработка отчетной документации.	Ведомость ТП; Пояснительная записка к ТП; Схема функциональной структуры;	3 месяца	500 000 рублей
	Этап 2. Эскизный проект:	исследование, обоснование и формулировка назначения, области применения и основных технических характеристик VoiceKey; проведение ориентировочных расчетов по показателям работоспособности надежности изделия	3 месяца	1 млн.
	Этап 3. Технический проект	разработка конструктивных решений VoiceKey и его составных частей; выполнение необходимых VoiceKey расчетов;	Руководящие указания по конструированию изделия; Справка о выполнении требований по стандартизации и унификации; Чертеж общего вида.	4 месяцев	3 млн.
	Этап 4. Разработка рабочей конструкторской документации	Разработка конструкторской документации на VoiceKey; разработка проектов ТУ и эксплуатационной документации	Проектно-сметная документация; Приказ по проведению предварительных испытаний;	4 месяцев	1 млн.
ИТОГО				14 месяцев	4,5 млн. рублей

6. ОБЛАСТЬ ВОЗМОЖНОГО ИСПОЛЬЗОВАНИЯ

.1 Голосовая биометрия

Голосовая биометрия - одна из технологий, которая развивается очень быстро и позволяет разным компаниям использовать ее решения для идентификации заказчиков. В биометрической системе для определения или подтверждения личности используют индивидуальные поведенческие, психологические и некоторые другие характеристики. Имеется множество биометрических измерений, включая сканирование радужной оболочки глаза, отпечатков пальцев, распознавание лица, голоса, подписи и т. д. Голосовая биометрия позволяет, исследуя голосовые характеристики человека, идентифицировать клиента. Она представляет собой относительно простой и экономичный способ решения ряда практических проблем.

Голосовая биометрия и речевые технологии - это высокоразвитая технология, которая может быть использована для повышения качества услуги в такой степени, чтобы заказчик мог ощутить это улучшение. Предприятие должно предоставить заказчику автоматизированный сервис, и речевые технологии способны в этом помочь. Клиента никто не заставляет ждать, не переадресовывает и не предлагает пользоваться меню. Голосовые коммуникации являются удобными для заказчика.

Система понимает клиента и способна проверить его слова. Он может даже не помнить пароль или число. Голосовая биометрия, которая используется в процессе разговора, позволяет установить, кто звонит. Это сокращает время разговора. Так что клиенту не надо представляться и называть пароль. Его пароль - его голос. При этом он чувствует, что его звонок важен и компания сразу принимает решение.

Компания RNCOS (Индия) опубликовала в марте 2011 года краткосрочный прогноз развития мирового биометрического рынка. Индийские эксперты подтвердили оптимистические оценки перспектив этого рынка и полагают теперь, что среднегодовые темпы его роста составят в 2011 - 2013 гг. 23% (ранее аналитики говорили максимум о 20-22%). На долю трех грандов биометрии (технологий идентификации по отпечаткам пальцев, лицу и голосу) к концу 2013 г. году будет приходиться 84% от общего объема отраслевого рынка. Как полагают авторы прогноза, это объясняется растущей популярность упомянутых биометрических технологий в финансовом секторе (включая широкое распространение биометрических АТМ), ритейле, системах паспортов нового поколения и системах пограничного контроля.

Особенно перспективной является развитие технологий идентификации по отпечаткам пальцев, поскольку эти технологии были и остаются самыми распространенными и привычными для подавляющего большинства пользователей. Аналитики RNCOS также полагают, что в ближайшие 3 года расширится применение технологий биометрии в целях обеспечения безопасности электронной коммерции и дистанционных платежей.

Диаграмма №1. Оценка рынка биометрической продукции

Диаграмма №2. Оценка доли биометрических технологий

.2 Использование голосовой биометрии в различных областях

Наиболее широко технология применяются в банковском секторе, в страховых компаниях, в телекоме. Авиакомпании проявляют значительный интерес. Перспективным является также рынок мобильных приложений для сотовых телефонов, где речевые технологии востребованы в полной мере. В автомобилестроении голосовые системы позволяют использовать навигационные приборы в пути, способны включить музыку, кондиционер, помогают, не отвлекаясь от управления машиной, записать и отправить SMS и т. д.

В медицине речевые технологии используются для записи информации о клиентах, создания электронных карт пациентов. Это позволяет оптимизировать работу врачей и создает явные преимущества для клиентов. Врач не использует клавиатуру компьютера, он просто диктует медицинские показатели и диагноз. Система распознавания речи переводит голос в текст и записывает его.

Банковские контакт-центры успешно применяют голосовые технологии. Если клиенту нужна базовая информация, то она предоставляется ему свободно. Но если он хочет провести финансовую операцию или какую-то операцию со своим счетом, то его [статус] нужно проверить. Голосовая биометрия - это один из видов проверки клиента, с помощью которой возможно идентифицировать, живой ли это человек, или транслируется запись речи.

Система голосовой биометрии может выявить необходимость дополнительной проверки клиента. Можно также создать «черный список» отпечатков голосов клиентов, замеченных в мошенничестве или в попытках несанкционированного доступа к счетам других клиентов. Это позволяет обеспечить безопасность банковских операций.

Система голосовой биометрии более удобна для заказчика, чем использование PIN-кодов и паролей. Но можно также сказать, что голосовая биометрия более надежна, так как пароль может быть подслушан и украден в течение разговора. Да и PIN является большой проблемой всех контакт-центров, ведь операторы сами могут воспользоваться этими сведениями. Пароль и PIN нетрудно украсть, такая информация может уйти на чёрный рынок, но голос всегда останется при человеке. А вот комбинация голосовой биометрии и вопросов o персональной информации о вашей жизни в комбинации позволяют добиться высокой степени надежности.

Разнообразие областей использования продукта представлены в следующей таблице:

Таблица №3.Разнообразие использования системы VoiceKey

Область использования	Варианты использования продукта
Службы безопасности	Безопасность зданий и сооружений Информационная безопасность
Контакт-центры	Управление качеством обслуживания Управление производительностью обслуживания
Медицинские учреждения	Для амбулаторного лечения Для стационарного лечения Для медицинских учреждений всех профилей Для профилактических мероприятий и дистанционной медицины
Жилищно-коммунальное хозяйство	Повышение ресурсоэффективности ЖКХ
Системы образования	Инновации в области дистанционного обучения
Государственные предприятия и ведомства	Сотрудничество в области инновационных разработок и НИОКР
Энергетические предприятия	Безопасность зданий и сооружений энергосистемы Контроль и управление диспетчерскими переговорами
Автомобилестроение	Дистанционное управление электронным устройствами в машине

Далее рассмотрим некоторые из этих областей более подробно.

) Использование голосовой биометрии в контакт-центрах.

Контакт-центры не успевают отвечать на запросы, не хватает операторов. В этом случае используются автоматические устройства интерактивного речевого ответа IVR. Но клиенты не всегда хотят работать с IVR, они предпочитают дождаться отклика оператора и теряют время обслуживания контакт-центра.

Заказчик звонит в центр обработки вызовов, мы спрашиваем его, как ему помочь. Он в свободной форме отвечает на вопрос. С помощью системы распознавания речи мы понимаем его просьбу и решаем, куда надо обратиться. Эту информацию мы или транслируем в систему самообслуживания, или направляем звонок оператору. В то же время мы можем идентифицировать клиента с помощью голосовой биометрии. Применяя данные меры, мы сберегаем очень много времени по сравнению с традиционными методами, ведь IVR не отвечает на вопросы.

В Восточной Европе и России голосовая биометрия практически не используется. А в Западной Европе и США данная технология уже широко применяется. Такая ситуация конечно изменится в ближайшие год-два. Операторские центры будут использовать речевые технологии, такие как голосовая биометрия, предоставляя лучшие по качеству услуги для всех клиентов контакт-центров.

Например, один из российских банков хочет внедрить голосовую биометрию для поддержки системы кредитных карт для всех своих клиентов. Это позволит идентифицировать пользователей. Технология инсталляции голосовой биометрии не сложная. Но заказчики должны знать о наличии нового сервиса, это важный элемент его продвижения.

В начале каждого проекта мы рассчитываем экономическую эффективность и срок возврата инвестиций. В зависимости от пожеланий клиента, проект может делаться на базе числа портов IVR, или на базе количества отпечатков голоса, используемых в системе. Если голосовое решение хорошо отлажено, то время одного разговора может быть уменьшено на 20-40 с, а возврат инвестиций происходит за шесть-девять месяцев.

Рынок голосовой биометрии существует как в рамках контакт-центров, так и вне их. Причем каждый операторский центр может использовать голосовую биометрию. Сегодня голосовыми решениями занимаются почти все гиганты ИТ-индустрии, такие как Google и Microsoft. Но кроме call-центров есть и другие возможности использования голосовой биометрии, например для управления мобильными устройствами, предоставления безопасного доступа в определенные помещения или к определенному оборудованию, в сфере медицины и пр.

)Использование голосовой биометрии в медицине.

В медицине распознавание речи помогает высвобождению медперсонала. Разработаны приложения для диктовки и транскрипции, улучшающие качество записи, обработки и использования данных о пациенте. Это позволяет создавать медицинские архивы с голосовым управлением, которые значительно снижают эксплуатационные издержки и улучшают качество обслуживания пациентов. Использование таких систем повышает доходность лечебных учреждений за счет сокращения средней продолжительности выполнения задачи и одновременного повышения эффективности предоставления услуги.

)Использование голосовой биометрии в сфере противодействия терроризму.

В современном мире проблемы терроризма и преступности стоят особенно остро, проникая на каждый уровень, оставленный без адекватной защиты. Многие государства в настоящее время столкнулись с целым рядом вопросов, связанных с отражением угроз нелегальной эмиграции и контрабанды, предотвращением террористических атак и применением новых подходов при создании систем национальной и международной безопасности. Особую важность приобретает совершенствование поиска, выявления и идентификации лиц, нарушивших закон.

Решение подобных задач в глобальном масштабе требует применения наиболее современных технологических решений. Любая улика, полученная компетентными органами в рамках расследования или оперативно-разыскной деятельности, должна быть эффективно использована в масштабе времени, близком к реальному. Существующие на сегодняшний день в российских органах внутренних дел информационные криминалистические банки и базы данных довольно разрознены, а их эффективность имеет исключительно локальный характер. Это вызывает определенные затруднения в пресечении преступной деятельности межрегионального и национального масштаба.

Наиболее распространенным инструментом, используемым в практике выявления подозреваемых лиц, являются дактилоскопические контактные системы идентификации. Но они ограничивают возможности удаленного поиска, а идентификация личности происходит уже после ее обнаружения.

Представляется, что внедрение современного криминалистического учета в национальном масштабе позволит решить широкий спектр задач, стоящих перед органами правоохранительной системы, системы государственной безопасности и обеспечения обороны страны, среди которых:

создание распределенной системы сбора и хранения данных (фонограмм, фотографий, видеозаписей и других материалов);

осуществление интерактивного поиска разыскиваемых лиц по собранным базам данных в процессе следственной деятельности и оперативно-разыскных мероприятий;

возможность быстрого подключения в процессе принятия решений экспертов по обработке и анализу различного рода данных.

.3 Состояние рынка систем идентификации в настоящее время

В последнее десятилетие биометрические методы идентификации личности стремительно набирают популярность, как в корпоративном, так и в государственном секторе, в частности, в сфере обеспечения национальной безопасности. Криминалистический учет может стать более эффективным при совместном использовании всей биометрии, признаки которой представлены в базах данных правоохранительных органов. Актуальным представляется развитие мультимодальных биометрических систем идентификации. Большинство биометрических систем безопасности, применяемых в настоящее время, основаны только на одной уникальной поведенческой или физической характеристике человека, другими словами, для таких систем характерна унимодальность. Основной целью применения биометрии является создание механизма однозначной идентификации. Использование же только одной биометрической технологии затрудняет с достаточной точностью осуществлять идентификацию личности. В связи с этим, представляется очевидной необходимость комбинирования нескольких дистанционных биометрических методов идентификации с контактными биометрическими и не биометрическими методами.

Оптимальным сценарием развертывания национальной системы криминалистического учета представляется создание платформы системы биометрического поиска по портретным изображениям и фонограммам речи с последующей интеграцией с другими криминалистическим базами и банками данных. Поэтому такая платформа должна иметь возможность расширения в область учета и поиска (идентификации) по другим биометрическим и не биометрическим признакам.

«Центр речевых технологий» имеет большой опыт в разработке систем криминалистического учета национального масштаба. Так в 2010 году компания завершила внедрение самого крупного проекта в области голосовой идентификации, выполненного для Министерства Внутренних Дел Мексики. В ходе проекта на основе платформы «VoiceNet ID» на территории Мексики была развернута система национального фоноучета и голосового биометрического поиска, призванная помочь правительству Мексики в борьбе с организованной преступностью. Уникальность системы ЦРТ состоит в неограниченных возможностях масштабирования. На данный момент ее фонотека насчитывает около одного миллиона образцов речи. Производительность аппаратно-программного комплекса позволяет обрабатывать более шестисот тысяч фонограмм в сутки и около ста заявок на поиск неизвестных дикторов по голосу, а современная система резервирования гарантирует бесперебойную работу в режиме 24/7. Основные аппаратные и программные средства комплекса расположены в специализированном информационном центре. Распределенный доступ обеспечивает работу более чем 250 штатных полицейских подразделений с фонотекой системы через веб-интерфейс или с помощью программ - клиентов.

Технология Voice Key позволяет создать единую информационную систему с обширными возможностями для разного рода поисковых запросов как по накопленным банкам и базам данных, так и в режиме реального времени по каналам связи с последующим объединением событий в единую цепочку. Система «Voice Key» имеет модульную архитектуру - набор компонентов, выполняющих определенные функции и взаимодействующих по стандартным протоколам. Сбор биометрической информации у населения также может производиться из различных мест. Для решения этой задачи система имеет ряд следующих особенностей:

. Территориальная распределенность. Сбор и ввод биометрических данных, ведение учета и осуществления поиска можно организовать из территориально удалѐнных мест, например, из различных подразделений внутренних дел.

. Открытость и консолидация данных. Универсальная мультимедийная платформа позволяет объединять информацию, собранную у населения в рамках использования системы, с информацией, имеющейся в банках и базах данных правоохранительных органов, как биометрической, так и не биометрической (личное дело, биографические данные, номера документов и т.п.).

. Безопасность данных. В системе реализован контроль и разграничение доступа к данным и функционалу. Безопасность передачи данных по открытым сетям обеспечивается протоколом HTTPs.

. Автоматизация рабочих процессов. Система вовлекает каждого пользователя в работу согласно его компетенциям через гибкие механизмы полей, групп и рабочих процессов. Единая система биометрического поиска и национального криминалистического учета формируется из трех функциональных уровней.

Первый уровень отвечает за сбор данных, подлежащих криминалистическому учету: учетные карточки разыскиваемых лиц и образцы их речи, пригодные для идентификации.

Второй уровень отвечает за хранение и обработку данных, осуществление вычислительных операций: хранение банка биометрических данных и базы данных учетных карточек, осуществление непосредственно процесса идентификации и поиска по банку данных с помощью мощного вычислительного кластера.

Третий уровень отвечает за операции пользователя: постановку поисковых заданий; установку параметров поиска; вывод результатов поиска в форме отчетов; оперативное оповещение сотрудников в случае обнаружения разыскиваемого лица в каналах связи и фонотеках, пополняемых в процессе оперативно-розыскных мероприятий; постановку экспертам заданий на обработку и анализ результатов поиска и фонограмм.

.4 Системы голосовой аутентификации различных компаний

В настоящий момент на рынке голосовой аутентификации представлены продукты различных компаний.

Точность узнавания 97%.

Дикторонезависимая система. Разработчики системы проанализировали различные базы данных для многих языков, чтобы учесть все вариации речи, возникающие в зависимости от возраста, голоса, пола и акцента. Собственные алгоритмы обеспечивают распознавание речи независимо от особенностей оборудования (наушников, микрофона) и характеристик канала.

Система поддерживает возможность создания дополнительных словарей, учитывающих особенности произношения и акцентов. Это особенно полезно в тех случаях, когда системой пользуются люди, произношение которых сильно отличается от общепринятого.

Система поддерживает наиболее распространенные языки, такие как британский и американский английский, французский, немецкий, итальянский, североамериканский испанский. Словарь может быть настроен на любой из этих языков, но невозможно одновременно использовать несколько языков в составе одного словаря.

Продукт доступен на базе Windows NT/2000, Linux и Sun SPARC Solaris.SDK Version 3.0

Дикторонезависимая система, не требующая обучения под конкретного пользователя. Адаптация под пользователя происходит во время работы и обеспечивает наилучший результат распознавания. Автоматическая подстройка на голосовую активность позволяет распознавать речь в сильно зашумленной среде, например в салоне автомобиля. Система не определяет слова, не занесенные в словарь. Предусмотрена возможность поиска ключевых слов. Система может быть настроена на работу как с маленьким словарем (изолированное произнесение команд), так и с большим по объему словарем (речь).

Система поддерживает следующие языки: британский и американский английский, испанский немецкий, французский, датский, шведский, турецкий, греческий, исландский и арабский.

Система работает на базе Windows 98 (SE)/NT 4.0/2000/CE, Mac OS X и Linux.ASR

Дикторонезависимая система, оптимизированная для использования в телефонии. Предусмотрена возможность распознавания отдельных слов и речи, поиска ключевых слов (словарь до 500 слов). Позволяет создавать дружественные пользователю приложения за счет большого объема словаря и гибкости системы.

Поддерживает 12 языков, включая наиболее распространенные европейские языки (итальянский, испанский, британский и американский английский, французский, немецкий, греческий, шведский и др.).

Входит в состав продукта Loquendo Speech Suite вместе с системой text-to-speech и программой Loquendo VoiceXML Interpreter, поддерживающей использование различных голосов и языков.

Система работает на базе MS Windows NT/2000, UNIX и Linux.

Дикторонезависимая система, не требующая обучения, но после адаптации под конкретного пользователя результаты распознавания становятся гораздо лучше: точность распознавания превышает 90%.

По словам производителей, система оптимизирована для наименьшего потребления памяти и других системных ресурсов. Точность распознавания - до 96%, причем остается высокой даже в зашумленном помещении.

Есть возможность самообучения системы и ее подстройки под каждого пользователя.

Работает на базе Windows 2000 и Linux.

Язык может быть любой (словарь составляется под конкретные требования клиента и включает те слова и на том языке, которые клиент указал в требованиях к настройкам системы). В словарь могут быть включены слова из разных языков, то есть, не меняя настроек, система может распознавать слова, например, как на китайском, так и на финском языке, если они были заранее внесены в словарь). Таким образом, эта система может работать с любым языком, тогда как другие системы - лишь с определенным их набором.

Это автоматическая система распознавания речи, обеспечивающая высокое качество распознавания даже в сильно зашумленной среде. Система может быть легко настроена на работу в одном из двух режимов: распознавание фраз с фиксированным числом команд (произнесение отдельных команд, режим PIN-кода) и распознавание фраз с произвольным числом команд (слитное произнесение команд, «режим связной речи»). Есть возможность поиска ключевых слов. Данное решение работает в условиях аддитивного нестационарного шума. Требуемое соотношение «сигнал/шум» до 0 дБ в «режиме PIN-кода» и до +15 дБ в режиме связной речи.

Задержка распознавания - 0,2 с. Параметры акустического канала: полоса пропускания в пределах 300-3500 Гц. Адаптация к акустической среде производится по фрагментам шума суммарной длиной не менее 3 с.

Система может работать как в дикторозависимом, так и в дикторонезависимом режиме, поэтому специального обучения системы для работы с конкретным пользователем не требуется.

Обеспечивается высокая точность распознавания, и работа в реальном времени, даже в зашумленной среде.

Система распознает связную речь и последовательный перечень цифр.

Слова, не занесенные в словарь, и посторонний шум не воспринимаются ею, а ничего не значащие слова, такие как «а», «ну» и пр., отбрасываются.

Новые слова могут быть добавлены в словарь.

Система автоматически подстраивается под тон, произношение и другие речевые особенности пользователя.поддерживает американский английский и корейский языки; китайский и японский - в разработке.

Система работает на базе Windows 95/98/NT 4.0, UNIX и Linux.

6.5 Перспективы голосовой биометрии

Системы голосовой техники быстро развиваются. Практически во всех сферах бизнеса они создают новые возможности для обслуживания клиентов, повышения точности, производительности и эффективности производства, сокращения временных и финансовых затрат. Они вторгаются в жизнь миллионов частных пользователей. Поэтому можно ожидать дальнейшего увеличения числа распознаваемых языков и расширения количества создаваемых на этой основе сервисов.

Диаграмма №4. Динамика мирового рынка систем биометрической идентификации (2009-2017 гг.)

Диаграмма №5. Структура мирового рынка систем биометрической идентификации

Диаграмма №6. Причины, по которым организации не планируют применять биометрию

Диаграмма №7. В каких биометрических технологиях заинтересованы предприятия

Диаграмма №8. Динамика отдельных сегментов мирового рынка систем биометрической идентификации

Предложения современного рынка голосовой биометрии.

Три основных барьера стоят на пути развития систем распознавание речи:

. большие объемы словарей

. шаблоны непрерывной речи

. различные акценты и произношения

Это основные препятствия для автоматизированных систем распознавания голоса, но есть еще и другие проблемы - понимание семантики речи. Объемы словарей определяют степень сложности, требования к вычислительной мощности и надежность систем распознавания голоса. Можно приспособиться к непрерывному потоку речи, но есть еще и строгие семантические правила, которым необходимо следовать, чтобы система смогла понять семантику комбинаций слов в предложениях. Необходимо продолжать основательные исследования, только это позволит «справиться» с такими характеристиками речи, как морфология, акценты, высота звука, скорость, громкость, сливающиеся слова, контекст, артикуляция, лингвистическая информация, синонимы и т. д. Ожидается, что основным направлением развития станет моделирование языков для использования в системах распознавания речи.

Не решена окончательно и проблема отделения речевого сигнала от шумового фона. В настоящее время пользователи систем распознавания голоса вынуждены либо работать в условиях минимального шумового фона, либо носить шлем с микрофоном у самого рта. Кроме того, пользователям приходится «информировать» компьютер о том, что они к нему обращаются. Для этого обычно надо нажать кнопку или сделать что-то в этом роде. Конечно, это не самый лучший вариант пользовательского интерфейса. Решение этих проблем началось, и уже получены много-обещающие результаты. Одна из долгожданных разработок в области распознавания голоса - это человеко-машинные диалоговые системы; такими системами занимаются во многих университетских исследовательских лабораториях. Системы «умеют» работать с непрерывным речевым потоком и с неизвестными дикторами, понимать значения фрагментов речи (в узких областях) и предпринимать ответные действия. Эти системы работают в реальном времени и способны выполнять пять функций по телефону:

. узнавание речи - преобразование речи в текст, состоящий из отдельных слов

. понимание - грамматический разбор предложений и распознавание смыслового значения

. восстановление информации - получение данных из оперативных источников на основании полученного смыслового значения

. генерация лингвистической информации - построение предложений, представляющих полученные данные, на выбранном пользователем языке

. синтез речи - преобразование предложений в синтезированную компьютером речь

Диалоговый интерфейс в таких системах позволяет человеку разговаривать с машиной, создавать и получать информацию, решать свои задачи. Системы с диалоговым интерфейсом различаются по уровню инициативности человека или компьютера. Исследования фокусировались на «смешанно инициативных» системах, в которых и человек, и компьютер играют одинаково активную роль в достижении цели посредством диалога. С появлением систем распознавания голоса идея «говорящего» компьютера перестала быть фантастикой.

В ближайшее время вполне реальным видится комплексное использование речевых технологий в системах контроля доступа и информационных системах. Используя технологии идентификации личности Voice Key и распознавания голосовых команд Voice Com, пользователь может без участия обслуживающего персонала получить необходимую, в том числе закрытую для других информацию, подключить дополнительную услугу у оператора связи, узнать остаток на банковском счете и т. п. В заключение можно сказать, что применение речевых технологий является одним из самых перспективных направлений совершенствования систем контроля и управления доступом.

Дописать про ценовую политику, т.е формулы которые рассчитывали.

7. ОЦЕНКА СТОИМОСТИ РАБОТЫ

СТРУКТУРА ЗАТРАТ

выполнения работ по теме:

" ________________________________"

№ п/п	Наименование статей затрат	стоимость (тыс. руб.)
1	Материалы и комплектующие
2	Затраты по работам, выполняемым сторонними организациями
3	Затраты на заработную плату работникам, непосредственно занятым при выполнении работ по государственному контракту (сумма подстрок 3.1 и 3.2), в том числе:
3.1	- затраты на заработную плату работникам организации-исполнителя занятым по трудовому договору
3.2	- затраты на заработную плату работникам, занятым по договорам гражданско-правового характера
4	Затраты на социальное страхование
5	Стоимость спецоборудования и специальной оснастки
6	Прочие прямые расходы, непосредственно связанные с выполнением научно-исследовательских, опытно-конструкторских и технологических работ (сумма подстрок 6.1 и 6.2):
6.1	- затраты на командировки
6.2	- прочие прямые расходы
7	Общехозяйственные (непрямые) расходы, непосредственно не связанные с выполнением работ (не более 20% от суммы строк 1, 2, 3, 4, 5, 6)
	Итого:

8. ПЛАНИРУЕМЫЕ ОБЪЕМЫ ПРОИЗВОДСТВА

Календарный план-график проекта

№	Мероприятие	Форма представления результата	Сроки	Исполнитель
1.	Формирование координационной рабочей группы (КРГ) проекта.
1.1	Определение и назначение менеджера и куратора проекта.	Приказ	2 месяца	Консультант.
1.2	Подбор участников КРГ.	Приказ	2 месяца	Консультант.
2.	Планирование проекта.
2.3	Определение потенциальных потребителей продукта Voice Key.	Перечень потенциальных потребителей продукта.	1 месяц	участники КРГ
2.4.	Разработка и утверждение плана проекта.	Утвержденный план проекта.	1 месяц	участники КРГ
3.	Обучение персонала и техническое обеспечение проекта.
3.1	Проведение обучения процессному подходу.	Проведенный семинар.	0,5 месяца	Консультант.
3.2	Проведение обучения технологиям создания продукта	Проведенный семинар.	1 месяц	Консультант. Главный инженер.
3.3	Приобретение оргтехники и расходного материала.	Оргтехника и расходный материал.	0,5 месяца	Завхоз.
3.4	Обучение использованию программных средств и нового программного обеспечения	Проведенный семинар.	0,5 месяца	Консультант.
3.5	Инсталляция и настройка необходимого программного обеспечения	Инсталлированное и настроенное программное обеспечение.	0,5 месяца	Системный администратор.
4.	Маркетинговые исследования
4.1.	Формулирование миссии и целей.	Миссия, перечень стратегических целей.	1 месяц	Участники КРГ. Консультант-маркетолог.
4.2	Предварительная диагностика текущего состояния разработок и исследований в данной отрасли	Перечень разработок и исследований в данной отрасли в России и за рубежом	2 месяца	Участники КРГ. Консультант-маркетолог.
4.3	Оценка возможных сбытовых сегментов рынка	Перечень рынков сбыта товарной продукции	2 месяца	Участники КРГ. Консультант-маркетолог.
4.4	Оценка уровня конкуренции на целевых рынках	Перечень продуктов-конкурентов.	1 месяц	Участники КРГ. Консультант-маркетолог.
	Разработка стратегии выхода продукта на рынок.	Схема продвижения продукта	2 месяца	Участники КРГ. Консультант-маркетолог.
5.	Обоснование ценовой политики проекта.
5.1	Расчет себестоимости программного продукта	Составление финансовой отчетности.	3 месяца	Экономист.
5.2	Обоснование цены прикладной программы	Составление финансовой отчетности.	2 месяца	Экономист.
5.3	Обоснование сопутствующих расходов	Составление финансовой отчетности.	2 месяца	Экономист.
6.	Создание опытного образца системы в базовом варианте	Опытный образец системы.	1 год	Главный инженер. Участники КРГ.
7.	Создание прототипа системы идентификации по голосу Voice Key	Прототип системы идентификации по голосу Voice Key	1 год	Главный инженер. Участники КРГ.
8.	Продвижение системы идентификации по голосу Voice Key на рынок.	Отчет о продвижении товара на рынок.	1 год	Маркетолог.

9.АНАЛИЗ РЫНКОВ СБЫТА И ПРОГНОЗ РЕАЛИЗАЦИИ

Международная биометрическая группа (International Biometric Group) опубликовала прогноз развития рынка в 2008-2012 гг. Маркетологи предполагают, что доходы компаний вырастут за четыре года с $2,1 млрд до $5,7 млрд.

Эксперты международного агентства WinterGreen Research, составлявшие прогноз развития этого рынка до 2014 г., сделали вывод, что он подошел к порогу взрывного роста: биометрия становится неотъемлемой частью глобального рынка. Биометрическая информация уже не только используется для доступа на суперсекретные объекты, но и применяется в обычных паспортах, бытовых замках, сотовых телефонах. Это означает, что формируется огромный рынок для высокотехнологичных разработок. До сих пор только одной фирме с российскими корнями удалось занять прочные позиции в сегменте систем распознавания лица: компания A4Vision за несколько лет сумела сделать свои продукты мировым стандартом в этой области. Мы считаем, что продукт VoiceKey также станет одним из лидеров технологий биометрии.

Наша организация планирует сотрудничать с различными предприятиями, но приоритетный сегмент - это рынок контроля доступа. В дальнейшем планируется освоение рынка компьютерной безопасности. В планах стоит создание систем защиты данных на жестком диске и биометрического доступа к персональному компьютеру.

Наша компания разработчиков первая в Сибири, кто серьезно занимается подобными продуктами. В Москве и Санкт-Петербурге есть фирмы, которые возят технику из-за рубежа, появилась пара отечественных разработчиков. В Европе системы голосовой биометрии широко применяются, и там уже сложилась команда производителей, но их продукты дороги, не соответствуют российским нормам систем контроля доступа, плохо локализованы для нашей страны, а главное - нет сервисной поддержки от разработчика.

Наша компания учитывает условия российской реальности: помехи в связи, некачественное электропитание и т. д.

Рынок биометрической идентификации все больше привлекает к себе внимание IT-компаний. Многие понимают, что сегмент будет расти очень быстро. Но общая проблема рынка в том, чтобы донести преимущество технологии пользователям и заказчикам.

На рынок биометрии постоянно выходят новые компании. По оценкам экспертов International Biometric Group, среднегодовое снижение цен на биометрические системы достигает 15-20%. Это открывает широкие возможности для распространения технологии. Особенно если учесть рост спроса со стороны госструктур. Учитывая все вышесказанное, мы планируем, что наш продукт начнет приносить прибыль через 3 года после начала разработки проекта.

Следующие по значимости сегменты рынка, о чем свидетельствуют исследования International Biometric Group, - финансы и туризм. Благодаря этой возможности перед биометрическими технологиями открываются новые и весьма перспективные рынки, например мобильных телефонов и карманных компьютеров. Биометрия постепенно становится привычным и стандартным элементом массовой продукции.

voicekey идентификация голос аутентификация

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Электронные ресурсы:

. Г.Н. Зубов, М.В.Хитров, Состояние и перспективы голосовой биометрии, 2007. [Электронный ресурс]: http://www.chip-news.ru/

. Научная библиотека ХНУРЭ. [Электронный ресурс]: http://lib.kture.kharkov.ua/ua/bibllist/2.php

. Научная электронная библиотека «ВЕДА». [Электронный ресурс]: http://www.lib.ua-ru.net/diss/cont/15579.html

. Ю.Н. Хитрова, Применение речевой биометрии в системах ограничения доступа. [Электронный ресурс]: http://www.e-expo.ru/

. В.А.Свириденко, П.В.Мартынович, Системы верификации и идентификации диктора от SPIRIT Corp. [Электронный ресурс]: http://www.dancom.ru

. Официальный сайт американской компании Nuance Technology. [Электронный ресурс]: www.nuance-tech.com

. В.И. Галунов, Верификация и идентификация говорящего, Санкт-Петербургский государственный университет, 2007

Список литературы

. Маркел Дж., Грей А. Х. Линейное предсказание речи / Пер. с англ. М.: Связь, 1980.

2. David Chow, Waleed H. Abdulla Robust Speaker Identification Based on Perceptual Log Area Ratio and Gaussian Mixture Models. Auckland, New Zealand, 2002

. Л.Р. Рабинер, Р.В. Шафер, Цифровая обработка речевых сигналов, М.: Радио и связь, 1981. - 495с

. Кучерявый А.А. Бортовые информационные системы: Курс лекций / Под ред. В.А. Мишина и Г.И. Клюева. - 2-е изд. перераб. и доп. - Ульяновск: УлГТУ, 2004. - 504 с.

Технология идентификации по голосу Voice Key

Технология идентификации по голосу Voice Key

Похожие работы на - Технология идентификации по голосу Voice Key