当前查询到47条专利与查询词 "北京捷通华声语音技术有限公司"相关,搜索用时0.2656187秒!排序方式:
发明专利:46实用新型: 1外观设计: 0
46 条,当前第 1-10 条 下一页 最后一页 返回搜索页
申请号:01123418.0 公开号:CN1333501 主分类号:G06F3/16
申请人:北京捷通华声语音技术有限公司 申请日:2001.07.20 公开日:2002.01.30
摘要:一种高清晰度和高自然度的汉语无限词汇语音合成方法,和一个实用的汉语文本播放系统,它能将汉语文本转换成流畅的汉语口语输出。基本方法是:收集大量的常用语句的录音,经声学分析,韵律层级标注,语音选择,建立语音库。然后由计算机对待播放的文本作出韵律层级分析,检索语音库中匹配语音音段,再拼接成准确、清晰、自然的连续语言。它具有数学运算少,能实时处理;占用计算机内存可压缩,可植入掌上电脑,输出语音准确、清晰、流畅,接近自然语言的特点。适用于台式计算机、掌上电脑和车载移动通信系统,可用于机场、码头和车站的自动播音系统,各种信息自动咨询系统,残疾人的助讲、助读以及办公自动化系统等方面。
详细信息 下载全文

申请号:200410096968.5 公开号:CN1787072 主分类号:G10L13/02(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2004.12.07 公开日:2006.06.14
摘要:本发明提供一种基于韵律模型和参数选音的语音合成方法,该方法基于韵律模型进行声学参数规划,得到每个音节所希望的声学参数的目标值;再进行最大匹配,选择差距最小的作为真正使用的样本。在进行完最大匹配后,针对未匹配上的区段,进行单字匹配的处理。计算各条贯穿所有音节候选样本的区段路径的综合代价,综合代价是由每个候选样本的声学参数和其规划值之间的差距以及路径中两个相邻音节的候选样本之间声学参数之间的差距综合决定的。通过动态规划算法获得综合代价最小的路径。当所有音节选定样本后,在语音库中获得数据并进行波形拼接,获得最终合成结果。
详细信息 下载全文

申请号:200510004910.8 公开号:CN1811911 主分类号:G10L13/02(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2005.01.28 公开日:2006.08.02
摘要:本发明提供一种自适应的语音变换处理方法,包括步骤:(a)建立多样本语音数据库;(b)分析多样本语音库中的语音数据,提取语音参数;规划并建立语音参数库,为数据处理阶段提供依据;(c)分析声源特征,获取不同个体的语音参数,将得到的这些参数作为衡量不同声音之间差异的依据;(d)利用语音参数库,建立声源特征和目标特征的映射关系;(e)根据映射系数,进行自适应调整。通过获取声源特征和目标特征的主要参数(如基频和共振峰),建立声源与目标特征之间的映射关系,利用语音数据库的统计信息,使得不同说话人的声音可以自适应地变换到同一类变音效果,改善了声音变换的效果。
详细信息 下载全文

申请号:200510004911.2 公开号:CN1811912 主分类号:G10L13/02(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2005.01.28 公开日:2006.08.02
摘要:本发明提供一种小音库语音合成方法,该方法基于自然语音压缩音库,综合利用声学参数规划、实时解压和韵律参数调节技术,具体包括如下步骤:(a)音数据库、语音索引库、韵律模型库;(b)对于要合成的语音进行文本预处理;(c)声学参数规划;(d)查找最优样本,得到相应的选中样本的声学参数信息;(e)实时解压,获得实际的语音波形数据;(f)韵律调节;(g)波形拼接,将调节后或未调节的波形数据的进行拼接,得到语音合成结果。采用该方法保留了韵律的变化性,又最大程度地避免了韵律调节算法带来的机器声和回声。主要可针对嵌入式系统的使用。
详细信息 下载全文

申请号:201010219460.5 公开号:CN101901075A 主分类号:G06F3/041(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.25 公开日:2010.12.01
摘要:本发明提供了一种点密度非线性归一化文字识别方法和装置,所述方法包括:针对用户输入的当前文字的手写轨迹,获取该手写轨迹的外接矩形;判断所述外接矩形的宽高比是否在预置比值范围之内;若是,则将外接矩形扩大为正方形,并在该正方形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标;若否,则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标。通过本发明能够减少文字识别中的变形、失真,提高识别的可靠性。
详细信息 下载全文

申请号:201010221884.5 公开号:CN101901348A 主分类号:G06K9/62(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.29 公开日:2010.12.01
摘要:本发明提供了一种基于归一化的手写识别方法和识别装置,通过创建训练数据集,所述数据集中包括各字符的手写样本集,统计样本集中各字符的字内距离,所述字内距离也即识别引擎给出的识别距离,包括字符笔画特征的相对坐标位置的特性,获取各样本集字内距离的协方差,接收输入的笔画轨迹,计算所接收的笔画轨迹到每个字符的字内距离,用各样本集的协方差对计算所得的字内距离进行归一化处理,获取马氏距离,按所获取的马氏距离进行排序,并对排序靠前字符的字内距离进行加权处理,输出加权处理后排序靠前的预设数量的字符,从而准确可靠的完成了字符的识别。
详细信息 下载全文

申请号:201010221901.5 公开号:CN101901355A 主分类号:G06K9/68(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.29 公开日:2010.12.01
摘要:本发明提供了一种基于最大熵的文字识别方法和识别装置,所述方法包括:将训练样本输入到各个识别引擎中进行特征提取,获得特性信息;针对用户输入的手写轨迹,逐个选取单一识别引擎进行识别,将识别得到的特征信息输入到最大熵训练模型中,由最大熵训练模型输出判定结果;其中,当单一识别引擎对应的判定结果满足预置判定值时,停止下一识别引擎的识别,将当前识别引擎对应的识别结果输出;当单个识别引擎对应的判定结果均不满足预置判定值时,对多个识别引擎的识别结果共同决策进行输出。通过本发明,在保证识别结果正确的前提下,提高了识别效率。
详细信息 下载全文

申请号:201010223497.5 公开号:CN101901598A 主分类号:G10L13/02(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.30 公开日:2010.12.01
摘要:本发明提供了一种哼唱合成方法和系统,其中的方法具体包括:接收用户输入的文本;进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;依据调整后的时长参数,对相应音节的谱参数进行插值调整;根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到语音数据。本发明能够输出带有歌曲节奏和旋律的语音数据。
详细信息 下载全文

申请号:201010223507.5 公开号:CN101882026A 主分类号:G06F3/041(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.30 公开日:2010.11.10
摘要:本发明提供了一种笔迹书写的方法和装置、一种笔迹模板分类器训练方法和装置,其中笔迹书写的方法具体包括:捕捉用户书写笔迹的采样点坐标;根据当前采样点坐标、上一采样点坐标,提取所述当前采样点的书写速度和书写方向特征;将所述当前采样点的书写速度和书写方向特征输入到N类笔迹模板分类器,输出当前采样点的笔迹模板类别,并根据所述笔迹模板类别,获取当前采样点的笔迹模板;合并所述用户书写笔迹采样点的笔迹模板,得到笔迹图形;显示所述笔迹图形。本发明能够使得书写笔迹平滑流畅无锯齿,进而提高用户体验度。
详细信息 下载全文

申请号:201010223512.6 公开号:CN101887719A 主分类号:G10L13/02(2006.01)I
申请人:北京捷通华声语音技术有限公司 申请日:2010.06.30 公开日:2010.11.17
摘要:本发明提供了一种语音合成方法、系统及具有语音合成功能的移动终端设备,以解决现有的实时合成计算量大的问题。所述方法包括:在模型训练阶段进行样本的语音参数调整,然后对调整后的参数进行统计训练,得到参数模型;在语音合成阶段,利用所述参数模型对待合成信息进行语音参数规划,然后将规划出的参数合成声音。本发明将语音参数的调整过程移到模型训练阶段完成,在实时合成时就不再进行此操作,从而降低了实时合成的计算量,保证了语音合成的实时性。此外,本发明还提供了一种具有语音合成功能的移动终端设备,能够降低实时合成的计算量。
详细信息 下载全文

46 条,当前第 1-10 条 下一页 最后一页 返回搜索页