您的当前位置:首页正文

一种基于深度神经网络的多任务语音分类方法[发明专利]

2020-03-28 来源:个人技术集锦
专利内容由知识产权出版社提供

专利名称:一种基于深度神经网络的多任务语音分类方法专利类型:发明专利

发明人:毛华,彭德中,章毅,曾煜妮申请号:CN201710801016.6申请日:20170907公开号:CN107578775A公开日:20180112

摘要:本发明公开一种基于深度学习的多任务语音分类方法,涉及语音处理技术领域,包括如下步骤:S1:对语音数据进行时频分析操作,得到相应的语谱图。S2:建立基于卷积神经网络和残差网络的神经网络模型,并将语谱图作为网络输入,提取特征。S3:将提取的特征输入到多个不同的softmax分类器,从而得到一个初始化的模型。S4:对语音样本及对应的多个标记进行数值化,并用此数据集训练初始化的模型,得到训练好的网络模型。S5:将训练好的模型对未标记的语音数据行预测,得到分类的概率值,并且选择较高概率值的类别作为分类结果。本发明解决了现有的音频分类方法是针对任务单独处理而忽略语音任务相关性,导致分类效率低的问题。

申请人:四川大学

地址:610000 四川省成都市武侯区一环路南一段24号

国籍:CN

代理机构:成都弘毅天承知识产权代理有限公司

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容