发布时间:2025-08-31 19:16:12 点击量:
HASH GAME - Online Skill Game GET 300
本发明公开了一种基于深度哈希特征的行人多目标追踪方法。该方法为,选取行人重识别Market‑1501数据集训练残差网络ResNet50,结合行人重识别及哈希图像检索思想,将训练好的ResNet50作为基础网络模型与全连接哈希层相连接构建深度哈希网络模型,选取新的行人重识别数据集训练深度哈希网络,并使用此网络提取行人深度哈希表观特征,结合行人表观特征及与运动特征作为行人特征描述子,并在追踪过程中融合中断恢复机制以完成行人多目标追踪。本发明有效减少了行人多目标追踪过程中由于目标遮挡、目标交互产生的身份交换数量,提升了追踪精度。
[0002] 近年来,随着人工智能技术的发展,计算机视觉愈发得到海内外学者关注。计算机视觉囊括多个研究方向,例如目标检测、目标追踪、图像分类、图像分割等等。随着计算机视觉技术的完善,越来越多的视觉算法也被应用在现实场景中。在安防领域,例如车站、体育场等人员密集场景,小区、银行等安防监控场景,景区、地铁等人流量统计场景,都需要对监控摄像头抓捕的视频信息进行实时分析。传统监控方法主要依靠人工对视频信息进行统计分析,这种方法不仅效率低,误检、漏检情况也相对较多,此外,仅依靠人工分析是如此庞大数量的监控视频是不现实的,所以利用视觉算法对视频进行自动化分析具有重要研究意义。
[0003] 目标检测与目标追踪是计算机视觉领域的热点问题,而目标追踪中的多目标追踪问题因其实用价值极高更是研究的重中之重,它可以应用于视频监控、人机交互、虚拟现实等方向。目标追踪算法可以对视野内指定目标进行实时追踪,通过目标检测、位置预测、数据关联的方式获取目标移动轨迹。此外,多追踪算法还可以获取目标更为细节的信息,例如位置、速度、加速度、方向等,多样化的信息对目标状态分析、场景状态分析均有很大的帮助,因此越来越多的智能视觉分析算法依赖于多目标追踪完成。在如此大环境下,大量的多目标追踪算法被提出,但算法的准确性、普适性以及实用性仍有巨大的进步空间。多目标跟踪场景一般较为复杂,存在大量影响追踪结果因素例如,频繁遮挡、目标高速移动、目标方向变化等等,在复杂追踪场景中保证追踪准确性也是一大难点。多目标追踪算法作为众多视觉应用的基础,具有重要的研究意义。
[0004] 早期的多目标追踪算法大多在特征表示部分使用目标的运动特征,例如位置重叠度(IOU)等。当目标运动状态规律且无复杂情况发生时,此类算法表现优异,而在现实复杂场景中运动特征表现不佳。在目标遮挡、目标交互、方向突变、尺度突变情况频发的场景中,若仅使用运动特征,目标遮挡和目标交互会引起追踪过程中频繁的目标ID交换。此外,方向与尺度的突变会造成运动特征失效导致追踪频繁中断而产生大量追踪碎片及冗余轨迹。而这些问题也是多目标追踪问题面临的主要挑战。
[0037] 本发明与现有技术相比,其显著优点为, (1)在追踪数据关联时使用融合特征的思想,将目标表观特征与运动特征相结合以提升特征鲁棒性, (2)在表观特征提取方面,借鉴图像检索、行人重识别的思想,构建深度哈希网络并使用行人重识别数据集对其进行训练。通过此网络提取行人图像深度哈希特征作为行人表观特征,该深度哈希表换特征可以更好地描述行人目标, (3)改进了传统多目标追踪机制,提出特征池的概念保存未匹配到目标的轨迹特征信息以实现追踪中断后的身份恢复。
[0040] 本发明基于深度哈希特征的行人多目标追踪方法,该方法核心由运动特征表示模块,表观特征表示模块以及追踪失败恢复模块组成。首先使用行人重识别数据集训练残差网络ResNet50,将训练好的ResNet50与全连接哈希层相连接构建深度哈希网络,并使用此网络提取行人深度哈希表观特征,在获得目标检测框的基础上,采用交并比(IOU)作为行人运动特征表示,通过权重结合目标运动特征与表观特征并使用匈牙利算法进行行人目标数据关联,将关联结果保存为轨迹。在追踪过程中,如果出现目标遮挡、目标交互情况,采用追踪中断恢复机制及时将错误匹配的目标匹配到原有轨迹,避免身份交换情况的发生。本发明方法具体包括以下几个步骤,