主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
基于身份验证的声音识别系统的开发
小类:
信息技术
简介:
本作品旨在通过预先输入声音文本,经过声音预处理系统后再通过特征信号提取系统,提取出能表征说话人身份的特征参数,再利用提取出的特征序列根据一定的数学算法为说话人建立声音库。当说话人再次录入声音时,系统会自动进行数据库检索,根据匹配结果识别判断该说话人。特征提取方面,我们采用动态MFCC和静态MFCC相结合的方法;模板匹配方面,主要采用基于经典的BP算法的神经网络识别模型,并在算法方面探索改进和优化。
详细介绍:
本作品旨在通过预先输入声音文本,经过声音预处理系统(滤除杂、噪音)后再通过特征信号提取系统,提取出能表征说话人身份特征的特征参数,再利用提取出的特征序列根据一定的数学算法为说话人建立声音库。当说话人再次录入声音时,系统会自动进行数据库检索,根据匹配结果识别判断该说话人身份。 本作品主要由声音预处理部分、特征提取部分、模式匹配部分组成。声音预处理的目标是将原始语音信号经过...(查看更多)

作品专业信息

设计、发明的目的和基本思路、创新点、技术关键和主要技术指标

目的:普遍意义上声音识别的概念是指说话人识别。说话人识别包括说话人辨认和说话人确认两个方面。说话人辨认是一对多的分析过程,即判断出某段语音是若干人中哪一个所说,主要应用于刑侦破案、罪犯跟踪、国防监听等。说话人确认是一对一的确定过程,即确认某段语音是否属于指定的某人,主要应用于证券交易、银行交易、个人计算机声控锁、身份证、信用卡等。基于声音识别系统更广泛快速的应用于日常生活中的...(查看更多)

科学性、先进性

我们在分析了各种方法的利弊后,决定采用能够反映人对语音的感知特性的 Mel频率倒谱系数作为特征参数,主要利用静态MFCC和动态MFCC相结合,以期达到最佳的提取效果。标准的 MFCC只反映了语音参数的静态特性 ,而人耳对语音的动态特征更为敏感 ,一阶差分 MFCC是一种动态参数 ,有较好的噪声鲁棒性。因为它提取在一定程度上模拟了人耳对语音处理的特点 ,而且还具有一定的抗噪性 ...(查看更多)

获奖情况及鉴定结果

该作品获得2010年度郑州大学创新实验项目资助

作品所处阶段

实验室阶段

技术转让方式

作品可展示的形式

模型、现场演示

使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测

与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别具有不会遗失和忘记、不需记忆、使用方便准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、控制等各方面,特别是基于电信网络的身份识别。 它有着广阔的市场应用前景,通过SR技术,可以利用本身的生物特性进行身份鉴别,例如为公安部门进行语音验证、为一般用户提供防盗门开启功能等等。 比尔·盖茨认...(查看更多)

同类课题研究水平概述

19世纪60年代,美国的联邦调查局在贝尔实验室的帮助下,把声音进行分类。贝尔实验室的工程师劳伦斯·科斯塔逐渐相信声音图谱或声纹(他命名的)能够提供一种有效的个人识别方法,最早提出了“声纹(voicePrint)的概念并提出了基于模式匹配和概率统计方差分析的声纹识别方法,从而形成了声纹识别研究的一个高潮,其间的工作主要集中在各种识别参数的提取、选择和实验上,并将倒频谱和线性预...(查看更多)
建议反馈 返回顶部
Baidu
map
Loading...