基本信息
- 项目名称:
- 基于身份验证的声音识别系统的开发
- 来源:
- 第十二届“挑战杯”省赛作品
- 小类:
- 信息技术
- 大类:
- 科技发明制作A类
- 简介:
- 本作品旨在通过预先输入声音文本,经过声音预处理系统后再通过特征信号提取系统,提取出能表征说话人身份的特征参数,再利用提取出的特征序列根据一定的数学算法为说话人建立声音库。当说话人再次录入声音时,系统会自动进行数据库检索,根据匹配结果识别判断该说话人。特征提取方面,我们采用动态MFCC和静态MFCC相结合的方法;模板匹配方面,主要采用基于经典的BP算法的神经网络识别模型,并在算法方面探索改进和优化。
- 详细介绍:
- 本作品旨在通过预先输入声音文本,经过声音预处理系统(滤除杂、噪音)后再通过特征信号提取系统,提取出能表征说话人身份特征的特征参数,再利用提取出的特征序列根据一定的数学算法为说话人建立声音库。当说话人再次录入声音时,系统会自动进行数据库检索,根据匹配结果识别判断该说话人身份。 本作品主要由声音预处理部分、特征提取部分、模式匹配部分组成。声音预处理的目标是将原始语音信号经过...(查看更多)
作品专业信息
设计、发明的目的和基本思路、创新点、技术关键和主要技术指标
- 目的:普遍意义上声音识别的概念是指说话人识别。说话人识别包括说话人辨认和说话人确认两个方面。说话人辨认是一对多的分析过程,即判断出某段语音是若干人中哪一个所说,主要应用于刑侦破案、罪犯跟踪、国防监听等。说话人确认是一对一的确定过程,即确认某段语音是否属于指定的某人,主要应用于证券交易、银行交易、个人计算机声控锁、身份证、信用卡等。基于声音识别系统更广泛快速的应用于日常生活中的...(查看更多)
科学性、先进性
- 我们在分析了各种方法的利弊后,决定采用能够反映人对语音的感知特性的 Mel频率倒谱系数作为特征参数,主要利用静态MFCC和动态MFCC相结合,以期达到最佳的提取效果。标准的 MFCC只反映了语音参数的静态特性 ,而人耳对语音的动态特征更为敏感 ,一阶差分 MFCC是一种动态参数 ,有较好的噪声鲁棒性。因为它提取在一定程度上模拟了人耳对语音处理的特点 ,而且还具有一定的抗噪性 ...(查看更多)
获奖情况及鉴定结果
- 该作品获得2010年度郑州大学创新实验项目资助
作品所处阶段
- 实验室阶段
技术转让方式
- 无
作品可展示的形式
- 模型、现场演示
使用说明,技术特点和优势,适应范围,推广前景的技术性说明,市场分析,经济效益预测
- 与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别具有不会遗失和忘记、不需记忆、使用方便准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、控制等各方面,特别是基于电信网络的身份识别。 它有着广阔的市场应用前景,通过SR技术,可以利用本身的生物特性进行身份鉴别,例如为公安部门进行语音验证、为一般用户提供防盗门开启功能等等。 比尔·盖茨认...(查看更多)
同类课题研究水平概述
- 19世纪60年代,美国的联邦调查局在贝尔实验室的帮助下,把声音进行分类。贝尔实验室的工程师劳伦斯·科斯塔逐渐相信声音图谱或声纹(他命名的)能够提供一种有效的个人识别方法,最早提出了“声纹(voicePrint)的概念并提出了基于模式匹配和概率统计方差分析的声纹识别方法,从而形成了声纹识别研究的一个高潮,其间的工作主要集中在各种识别参数的提取、选择和实验上,并将倒频谱和线性预...(查看更多)