基于自注意力生成对抗网络的文本生成图像研究

发布时间：2023-12-11 18:39

　　目前,人工智能领域的发展备受人们的关注,这都归功于深度学习技术在近几年来取得的突破性进展,特别是与神经网络技术相关的研究取得的重大突破。在计算机视觉领域,深度学习技术已经在图像识别、图像分类、图像分割以及图像的语义描述等方向大放异彩,并展现出高于机器学习技术数倍的性能。然而,计算机视觉中的图像生成问题时至今日仍是一项艰巨的挑战,这是由于早期生成式模型的研究一直鲜有突破,利用图像类别甚至是文本描述作为条件来控制神经网络模型进行图像的生成则更是难上加难。令人振奋的是,生成对抗网络技术的提出为利用文本生成图像这一问题提供了很好的解决方案,并且生成对抗网络技术本身在近几年之间也不断被改进与优化,性能得到了大幅度的提升。众所周知,生成对抗网络在图像生成领域有着极佳的表现,模型本身具有易理解、易实现的架构优势,并且还能够生成原有方案无可比拟的真实性的图像。然而,生成对抗网络得益于其独特的训练方式的同时,也被其训练方式所约束,许多研究学者在实验中均发现原始生成对抗网络存在训练不稳定以及模式坍塌等问题。即便是最新的基于生成对抗网络的文本生成图像的工作当中,其模型仍存在这一问题,从而导致模型生成图像的能...

【文章页数】：78 页

【学位级别】：硕士

【文章目录】：
摘要
ABSTRACT
1 绪论
    1.1 研究背景及意义
    1.2 研究问题与主要挑战
        1.2.1 研究的主要问题
        1.2.2 研究的主要挑战
    1.3 生成对抗网络研究现状
    1.4 本文工作及主要贡献
    1.5 本文组织结构
2 生成对抗网络与文本生成图像相关理论
    2.1 神经网络理论
        2.1.1 人工神经网络
        2.1.2 卷积神经网络
        2.1.3 反卷积神经网络
    2.2 生成对抗网络相关理论
    2.3 文本生成图像相关理论
        2.3.1 文本描述的向量化
    2.4 数据集的选取以及实验结果评估标准
        2.4.1 数据集的选取
        2.4.2 实验结果评估标准
    2.5 本章小结
3 基于GAN-CLS算法的文本到图像生成方法及其改进
    3.1 引言
    3.2 相关工作
    3.3 基于GAN-CLS算法的文本生成图像方法
    3.4 GAN-CLS文本到图像生成方法的改进
        3.4.1 GAN-CLS中 DCGAN网络的局限性
        3.4.2 EM距离近似方法
        3.4.3 GAN-CLS文本生成图像算法损失函数的改进
    3.5 实验结果及分析
    3.6 本章小结
4 基于自注意力机制的文本生成图像方法
    4.1 文本生成图像中的注意力机制
    4.2 注意力与自注意力机制相关理论
    4.3 在文本生成图像方案中引入自注意力机制
    4.4 实验结果及分析
        4.4.1 实验设置与细节
        4.4.2 实验结果与分析
    4.5 本章小结
5 总结与展望
    5.1 本文总结
    5.2 未来展望
参考文献
附录
    A 作者在攻读学位期间发表的论文目录
    B 作者在攻读学位期间发表的专利目录
    C 学位论文数据集
致谢

本文编号：3873135

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3873135.html

上一篇：基于深度学习的方面级情感分析算法研究
下一篇：博览建筑展示空间的多媒体应用研究