(12)发明专利申请
(21)申请号 CN201910506752.8 (22)申请日 2019.06.12
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号百度大厦2层
(10)申请公布号 CN110377591A
(43)申请公布日 2019.10.25
(72)发明人 刘珊珊;李轩;刘家铭;刘涛;许海伦;韩钧宇
(74)专利代理机构 北京鸿德海业知识产权代理事务所(普通合伙)
代理人 田宏宾
(51)Int.CI
权利要求说明书 说明书 幅图
(54)发明名称
训练数据清洗方法、装置、计算机设备及存储介质
(57)摘要
本发明公开了训练数据清洗方法、装置、
计算机设备及存储介质,其中方法可包括:获取识别模型对输入的作为训练数据的任一图片序列及对应的标注文本进行预定处理后得到的CTC解码结果;根据CTC解码结果构建置信度矩阵;根据置信度矩阵确定出图片序列是否为脏数据。应用本发明所述方案,可提高处理结果的准确性等。
法律状态
法律状态公告日
2019-10-25 2019-10-25 2019-11-19
公开 公开
法律状态信息
公开 公开
法律状态
实质审查的生效 实质审查的生效
权利要求说明书
训练数据清洗方法、装置、计算机设备及存储介质的权利要求说明书内容是....请下载后查看
说明书
训练数据清洗方法、装置、计算机设备及存储介质的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容