中国专利数据库

专利名称:基于深度解耦框架的图文编码方法

专利申请号202210063065.5
申请日2022.01.19
公开(公告)号CN114398856A
公开(公告)日2022.04.26
主分类号G06F40/126
分案原申请号
分类号G06F40/126 G06T9/00
优先权
申请(专利权)人广州启辰电子科技有限公司;华南理工大学
地址510700 广东省广州市黄埔区天丰路3号301-1房
发明(设计)人郑彦魁;马震远;马千里;郑佳炜
国际申请
国际公布
进入国家阶段日期
专利代理机构北京前审知识产权代理有限公司 11760
代理人张静
专利类型发明专利
摘要本发明公开了一种基于深度解耦框架的图文编码方法,步骤如下:获取待进行编码的数据,分离出每个样本的图像数据和对应的文本数据;将所述图像输入预先训练的图像编解码模型,对所述图像进行编码,得到图像向量;将对应的文本数据输入预先训练的文本编解码模型,对文本数据进行编码,得到文本向量;将图像向量和文本向量进行结合,得到一个具有公共特征的向量;并通过该公共特征向量解耦出图像特有特征向量和文本特有特征向量;最终,将图像特有特征向量和文本特有特征向量以及公共特征向量进行拼接,得到最终的图文编码。通过本发明,可同时编码图像数据和其对应的文本数据,得到高质量的图文编码表示。
全文下载下载
©2022 Patent9.com All rights reserved.