中国专利数据库
专利申请号 | 202111531751.2 |
---|---|
申请日 | 2021.12.14 |
公开(公告)号 | CN114398952A |
公开(公告)日 | 2022.04.26 |
主分类号 | G06K9/62 |
分案原申请号 | |
分类号 | G06K9/62 G06V20/62 G10L15/02 G10L15/10 G06F40/289 G06F40/30 |
优先权 | |
申请(专利权)人 | 北京百度网讯科技有限公司 |
地址 | 100085 北京市海淀区上地十街10号百度大厦二层 |
发明(设计)人 | 刘兵;陈武臣;王佳伟;臧启光;吴震;付晓寅 |
国际申请 | |
国际公布 | |
进入国家阶段日期 | |
专利代理机构 | 北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 | 杜月 |
专利类型 | 发明专利 |
摘要 | 本公开提供了一种训练文本生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为语音识别和自然语言处理技术领域。具体实现方案为:对音频进行识别处理,以得到初始语音文本和参考语音文本,确定初始语音文本和参考语音文本之间的相似度信息,根据相似度信息,从初始语音文本之中确定出第一目标语音文本,以及根据第一目标语音文本和参考语音文本,生成训练文本。由此,可以实现联合初始语音文本与参考语音文本生成音频对应的训练文本,降低训练文本生成的出错率,有效提升生成的训练文本的样本质量和样本准确性,有效提升训练文本的产出率。 |
全文下载 | 下载![]() |