关于我们
![]() ![]() |
纸上的想象 读者对象:本书可供从事信息技术相关研究和工程技术人员阅读参考
本书专注于研究文本到图像生成任务,该任务旨在通过自然语言描述生成逼真且语义一致的图片。第1章简要概述基于语言描述的图像合成研究。在第2章中,提出了一种名为“双注意力生成对抗网络(DTGAN)”的方法,该方法能够仅用单个生成器/判别器生成与给定自然语言描述相符的高质量图片。第3章致力于解决当前单阶段文本到图像生成模型中存在的生成图像缺乏多样性的问题。第4章创建了两个新的Good&Bad数据集,包含成功与失败的合成样本,并训练了对应的分类器,以确保生成的图片自然、逼真可信。第5章和第6章分别探讨基于条件生成对抗网络的文本到图像模型的潜空间和语言空间,以提升可解释性。通过独立成分分析算法对生成器的预训练权重值进行研究,揭示潜空间与图像变化之间的关系。此外,通过关键词之间的线性插值在合成图像语义空间中进行定性分析,揭示“语言”嵌入的作用。第7章总结本书的主要贡献并回答了研究问题。本书可供从事信息技术相关研究和工程技术人员阅读参考。
你还可能感兴趣
我要评论
|