Patent9 专利在线
高级搜索 ▼
申请号或专利号
公开号
专利名称
专利摘要
申请人
发明人
全部专利
发明专利
实用新型专利
外观设计专利
高级搜索 - 多字段组合检索
+ 增加条件
查询语句:
(请输入搜索条件)
普通搜索
当前查询到
3
条专利与查询词 "
忤锐
"相关,搜索用时0.2812436秒!
排序方式:
按相关度排序
按申请日升序↑
按申请日降序↓
按公开日升序↑
按公开日降序↓
发明专利:
1
实用新型:
2
外观设计:
0
共
1
条,当前第
1-1
条
返回搜索页
1:
[发明]
【中文】一种大矩阵快速转置多核并行处理方法 【EN】Large matrix fast transposition multi-core parallel processing method
申请号:
201811418100.0
公开号:CN111221574A 主分类号:G06F9/30
申请人:
【中文】北京华航无线电测量研究所【EN】BEIJING HUAHANG RADIO MEASUREMENT Research Institute
申请日:2018.11.26 公开日:2020.06.02
发明人:
【中文】何炜
;
王禹超
;
忤锐
;
叶伟平
;
王嘉栋【EN】He Wei
;
Wang Yuchao
;
Wu Rui
;
Ye Weiping
;
Wang Jiadong
摘要:【中文】本发明一种大矩阵快速转置多核并行处理方法,包括以下步骤:步骤一:DSP每个内核利用EDMA将外部大存储器中需处理子矩阵A
i(N,M)
,i∈[0,x‑1]搬移至SRAM缓存;步骤二、x个内核并行处理,CPU利用优化的内联函数,对缓存数据进行转置,得到A
Τ
i(N,M)
,i∈[0,x‑1],再通过EDMA将结果数据搬移至外部大存储器。本发明提高了数据处理速度。 【EN】The invention discloses a large matrix fast transposition multi-core parallel processing method, which comprises the following steps: the method comprises the following steps: each kernel of the DSP utilizes EDMA to process the sub-matrix A in the external large memory
i(N,M)
,i∈[0,x‑1]Moving to an SRAM cache; step two, x kernels are processed in parallel, and the CPU transposes the cache data by utilizing the optimized inline function to obtain A
Τ
i(N,M)
,i∈[0,x‑1]And then the result data is moved to an external large memory through the EDMA. The invention improves the data processing speed.
详细信息
下载全文
共
1
条,当前第
1-1
条
返回搜索页