发布时间:2025-02-03 16:19:15 点击量:
HASH GAME - Online Skill Game GET 300
本发明公开一种基于等量约束聚类的无监督图像哈希检索方法及系统,包括:将数据库图像输入哈希特征提取网络模型,得到数据库图像的二值化哈希码并构建哈希码数据库;将待检索图像输入训练获得的哈希特征提取网络模型,得到该待检索图像的哈希码,计算该待检索图像的哈希码与哈希码数据库中所有二值化哈希码的汉明距离,将汉明距离最小的数据库图像作为待检索图像的检索结果。本发明利用等量约束聚类对无标签训练图像进行聚类,有效避免K‑Means聚类算法面临的空聚类和聚类不平衡问题,提高硬伪标签标注精度;利用去噪的软伪标签监督哈希特征提取网络训练,充分利用软伪标签挖掘图像类间关系,避免硬伪标签造成的过拟合,提升哈希编码精度。
随着深度学习技术的快速发展,深度神经网络已被广泛应用于计算机视觉的各个领域。在图像检索任务中,由于深度神经网络提取的图像哈希特征具备存储效率高和查询速度快的优势,被研究者们广泛关注。目前,图像哈希检索方法主要是基于有监督深度学习方法进行表示学习。这类方法结合了深度学习和哈希学习的优势,在保持检索效率的同时提高了检索精度。但是,有监督深度哈希方法依赖于大量准确标注的数据,而获取这些数据将耗费大量的人力资源。
当前,图像无监督深度哈希学习方法中,大都通过代理任务学习哈希码。例如,申请号为9.2,公开号为CN108491430A的中国专利中提出了一种基于对特征方向进行聚类的无监督哈希检索方法。该方法通过K-Means聚类算法对特征聚类,从而实现特征降维,并进一步对新特征的每个维度进行聚类并实现二值编码。但由于K-Means算法缺乏有效的约束,会面临空聚类和聚类不平衡问题,且该类方法未进行鲁棒学习处理,会导致所得到的哈希码鲁棒性不够,从而影响哈希检索精度。
本发明利用等量约束聚类对无标签训练图像进行聚类,可以有效避免K-Means聚类算法面临的空聚类和聚类不平衡问题,进而提高硬伪标签标注精度;利用硬伪标签训练软伪标签标注网络,可以使软伪标签标注网络适应数据,提高软伪标签标注效果;利用软伪标签去噪方法去除软伪标签中的噪声标签,可以进一步提高软伪标签精度;利用去噪的软伪标签监督哈希特征提取网络训练,可以充分利用软伪标签挖掘图像类间关系,避免“one-hot”硬伪标签造成的过拟合,提升哈希编码精度,更好的完成图像检索任务。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。