引入视觉显著机制的图像检索架构研究

发布时间：2022-01-13 19:52

　　随着互联网的不断发展,多媒体信息在网络上日益增多。图像作为一个重要的多媒体信息元素,更是与人们的生活密切相关。网络上每时每刻都有着成千上万的数据量上传与下载,那么,如何在一个巨大的数据库中进行媒体数据的搜索一直是一个重要的课题。基于内容的图像搜索技术从图像内容出发,提取图像的关键信息再进行相似性度量以此来搜索到用户想要查询的相似图像。这种图像搜索方法比基于文本的图像检索方法更加的简单快捷,准确率高。但是,这种基于内容的图像检索方法需要充分地挖掘图像的内容信息,从而找到真正相似的图像,这就对图像内容理解有着很高的要求。视觉显著性作为一种人所关注的信息,能够挖掘图像的重要信息。本文主要将视觉显著性信息引入到图像检索架构中,主要研究工作包括:（1）嵌入训练视觉显著性的CNN架构研究。本文提出了一种嵌入训练视觉显著性的CNN架构,将DeepFixNet模型与VGG模型相结合,在DeepFixNet模型的第八层之后添加新的卷积层以此来训练出适用于图像搜索任务的显著图信息,与VGG模型相结合嵌入训练的显著性信息。在六种经典的数据集上进行实验验证,得到了嵌入的显著性信息的有效性。在泛化实验中,利用模...

【文章来源】：北京交通大学北京市 211工程院校教育部直属院校

【文章页数】：61 页

【学位级别】：硕士

【部分图文】：

引入视觉显著机制的图像检索架构研究

图２－１词包模型架构??Ｆｉｇｕｒｅ?２－１?Ｂａｇ?ｏｆ?ｗｏｒｄ?ｆｒａｍｅｗｏｒｋ??

过程图,卷积,过程

＇６４??图２－２ＶＧＧ－１６网络模型??Ｆｉｇｕｒｅ?２－２?ＶＧＧ－１６?ｆｒａｍｅｗｏｒｋ??２．３．１卷积层??卷积层是ＣＮＮ中一个重要的层，就是利用卷积核来对图像进行卷积求和的过??程，以此来得到图像的全局特征等信息，这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图２－３所示。??假设图２－３最左边的４Ｘ４矩阵是一幅特征图，卷积的过程中，首先进行补零??操作，对４Ｘ４的矩阵四周进行补零，形成６Ｘ６的矩阵，再利用图２－３中３Ｘ３的??卷积核（里面的数值就是ＣＮＮ中常说的权重参数）来进行卷积操作，将３Ｘ３的模板??与特征图中３Ｘ３的子块进行匹配，相应进行相乘相加的操作，得到一个数字作为??新的特征图左上角的第一个数字，然后模板进行滑动，按照上述过程进行卷积，最??终得到新的特征图。??０?Ｉ?０?１?０?１?０?Ｉ?０?１?０??１?ｈ?［２?ＩＴ］?Ｚ工工Ｉ工Ａ?ｍｉ丨１丨１丨２丨４??ＡＡ?ＡＡ?上土丄土Ｉ］区替?丁Ｔ?＿?Ｉ了了Ｉ??丄丄丄＿１丄丁反土＿１?＿＿＿?—ｉ?ＹＴＴＴ??４?Ｉ?３?［?Ｉ?５?Ｉ?＂〇￣?４?３?［?１?５?０???＾??０?Ｉ?０?Ｉ?０?Ｉ?０?Ｉ?０?［?０?Ｉ??图２－３卷积层过程??Ｆｉｇｕｒｅ?２－３?Ｃｏｎｖｏｌｕｔｉｏｎａｌ?ｌａｙｅｒ??卷积层操作能够得到图像中的一些特定信息

特征图,网络模型,卷积,卷积核

卷积层是ＣＮＮ中一个重要的层，就是利用卷积核来对图像进行卷积求和的过??程，以此来得到图像的全局特征等信息，这也是在模拟人脑思考感知机制的一个仿??真过程。整个卷积层的计算过程如图２－３所示。??假设图２－３最左边的４Ｘ４矩阵是一幅特征图，卷积的过程中，首先进行补零??操作，对４Ｘ４的矩阵四周进行补零，形成６Ｘ６的矩阵，再利用图２－３中３Ｘ３的??卷积核（里面的数值就是ＣＮＮ中常说的权重参数）来进行卷积操作，将３Ｘ３的模板??与特征图中３Ｘ３的子块进行匹配，相应进行相乘相加的操作，得到一个数字作为??新的特征图左上角的第一个数字，然后模板进行滑动，按照上述过程进行卷积，最??终得到新的特征图。??０?Ｉ?０?１?０?１?０?Ｉ?０?１?０??１?ｈ?［２?ＩＴ］?Ｚ工工Ｉ工Ａ?ｍｉ丨１丨１丨２丨４??ＡＡ?ＡＡ?上土丄土Ｉ］区替?丁Ｔ?＿?Ｉ了了Ｉ??丄丄丄＿１丄丁反土＿１?＿＿＿?—ｉ?ＹＴＴＴ??４?Ｉ?３?［?Ｉ?５?Ｉ?＂〇￣?４?３?［?１?５?０???＾??０?Ｉ?０?Ｉ?０?Ｉ?０?Ｉ?０?［?０?Ｉ??图２－３卷积层过程??Ｆｉｇｕｒｅ?２－３?Ｃｏｎｖｏｌｕｔｉｏｎａｌ?ｌａｙｅｒ??卷积层操作能够得到图像中的一些特定信息，比如：颜色、纹理、轮廓等。ＣＮＮ??中含有多种卷积层，不同卷积层含有不同的卷积核参数，包括卷积核的大小、不同??特征值等等信息。不同的卷积核能够得到不同的图像信息

【参考文献】：
期刊论文
[1]量化SIFT和同态加密的隐私保护图像检索方法[J]. 陈帆.  传感器与微系统. 2017(05)
[2]基于相似图片聚类的Web文本特征算法[J]. 方爽,殷俊杰,徐武平.  计算机工程. 2014(12)
[3]基于主色提取和主色集扩充的图像检索算法[J]. 李丽丽,孙劲光.  计算机应用与软件. 2012(01)
[4]基于XML文本片段的图像检索实现与评价[J]. 陆伟,张宓,刘丹.  中国图书馆学报. 2009(02)
[5]一种基于主颜色表的图像检索算法[J]. 刘相滨,邹北骥.  湖南大学学报(自然科学版). 2001(01)

本文编号：3587047

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3587047.html

上一篇：GNSS信号与信息处理的实验设计与分析
下一篇：城市大脑：云边协同城市视觉计算

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|