中国专利数据库

专利名称:训练文本生成方法、装置、电子设备及存储介质

专利申请号202111531751.2
申请日2021.12.14
公开(公告)号CN114398952A
公开(公告)日2022.04.26
主分类号G06K9/62
分案原申请号
分类号G06K9/62 G06V20/62 G10L15/02 G10L15/10 G06F40/289 G06F40/30
优先权
申请(专利权)人北京百度网讯科技有限公司
地址100085 北京市海淀区上地十街10号百度大厦二层
发明(设计)人刘兵;陈武臣;王佳伟;臧启光;吴震;付晓寅
国际申请
国际公布
进入国家阶段日期
专利代理机构北京清亦华知识产权代理事务所(普通合伙) 11201
代理人杜月
专利类型发明专利
摘要本公开提供了一种训练文本生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为语音识别和自然语言处理技术领域。具体实现方案为:对音频进行识别处理,以得到初始语音文本和参考语音文本,确定初始语音文本和参考语音文本之间的相似度信息,根据相似度信息,从初始语音文本之中确定出第一目标语音文本,以及根据第一目标语音文本和参考语音文本,生成训练文本。由此,可以实现联合初始语音文本与参考语音文本生成音频对应的训练文本,降低训练文本生成的出错率,有效提升生成的训练文本的样本质量和样本准确性,有效提升训练文本的产出率。
全文下载下载
©2022 Patent9.com All rights reserved.