您的当前位置:首页正文

一种基于相似词的汉语拼音标注方法、装置及存储介质[发明专利]

2023-04-09 来源:个人技术集锦
专利内容由知识产权出版社提供

专利名称:一种基于相似词的汉语拼音标注方法、装置及存储

介质

专利类型:发明专利发明人:徐波

申请号:CN201910154080.9申请日:20190301公开号:CN109977361A公开日:20190705

摘要:本发明公开了一种基于相似词的汉语拼音标注方法、装置及存储介质,该方法包括步骤:收集文本语料,根据文本语料训练分词模型、词向量模型;根据分词模型对待标注拼音的文本进行分词处理,获得若干个待标注词语;当待标注词语中含有多音字时,基于多音字,根据词向量模型获取待标注词语的相似词语;根据汉语拼音词典和汉语拼音备用词典对相似词语中的多音字进行拼音标注,获得拼音标注后的相似词语;采用投票方法根据拼音标注后的相似词语确定待标注词语中的多音字的拼音并进行拼音标注;将拼音标注后的待标注词语存储至汉语拼音备用词典。本发明能减少汉语拼音的错误标注,提高汉语拼音标注的准确率和应用拼音的可靠性。

申请人:广州多益网络股份有限公司,广东利为网络科技有限公司,多益网络有限公司

地址:510000 广东省广州市黄埔区伴河路90号

国籍:CN

代理机构:广州三环专利商标代理有限公司

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容