当前位置:首页 >> 出版物 >> 情况交流

 
    首页 * 出版物 * 情况交流

    中国学者在视觉跟踪领域取得重要进展

    日期 2018-12-14   来源:江南大学   作者:吴小俊、卢湖川、王强、白帅  【 】   【打印】   【关闭

    第1期

    (总第706期)

      在国家自然科学基金项目(项目编号:61672265,61532018,61751212,61725202)等资助下,中国学者在视觉跟踪领域取得重要进展。

      最近,国际视觉跟踪竞赛Visual Object Tracking Challenge 2018 (VOT2018)在欧洲计算机视觉大会(ECCV2018)期间成功举办。本次比赛的四个第一名全部由中国参赛队获得,这是中国队在VOT历史上取得的最好成绩。

      VOT由伯明翰大学、卢布尔雅那大学、布拉格捷克技术大学、奥地利科技学院联合创办,是在线目标跟踪学术领域普遍认同的测评,每年评比一次,旨在提升在复杂环境下单目标跟踪的算法性能并提供对应的评价标准。由于评测序列和评价标准都会不断更新,且标注的精确度逐年提高,VOT竞赛难度远远超过其他数据集。相比于2017年,今年竞争异常激烈,参赛跟踪器由2017年的51个增加到72个,参赛队伍由38个增加到53个,包括牛津大学、卡耐基梅隆大学、微软亚洲研究院等国际著名AI实验室以及知名科研院所。

      根据VOT组委会的官方报告结论(http://prints.vicos.si/publications/365/the-sixth-visual-object-tracking-vot2018-challenge-results),现对VOT2018的四个第一名进行简单介绍。

      江南大学物联网工程学院吴小俊教授和英国萨里大学电子工程系Josef Kittler教授领导的模式识别与计算智能国际联合实验室(IJLPRCI)代表队(成员:徐天阳,冯振华,吴小俊和Josef Kittler)提出的LADCF算法获得本次竞赛公开数据库第一名。他们提出的特征选择跟踪模型LADCF的新颖之处在于利用目标和背景的互补信息,自适应地优化出最具鉴别性的空间特征;结合时序图像序列的平滑性,保持不断更新的跟踪器能够始终处在一个较低维度流形空间上。在此模型基础上利用深度特征实现在复杂场景中的有效跟踪。

      北京邮电大学MFT算法团队在短时盲库上目标跟踪获得第一名。该团队由北京邮电大学董远教授指导,白帅、何智群、庄骏飞组成团队,北京飞搜科技有限公司对北京邮电大学参赛队提供赞助。MFT团队提出一种多维合并的相关滤波方法用于目标跟踪。该方法充分利用多个维度不同特征对于不同跟踪场景的内部关系去实现更稳定跟踪。

      中国科学院自动化所模式识别国家重点实验室视频内容安全团队成员王强联合商汤科技在VOT2018 实时目标跟踪组别获得冠军。该团队凭借在视频跟踪领域丰富的研究积累,在实时目标跟踪任务中提出干扰对象感知的孪生神经网络(Distractor-aware Siamese Networks for Visual Object Tracking )。通过主动调节具有语义样本和简单样本数据分布,增强网络判别能力;同时,在网络架构方面进行深入探索,将网络宽度进行提升,增大网络容量;动态调节网络搜索范围,以适应不同尺度目标的运动。最后取得非常优异的跟踪精度。

      大连理工大学电子信息与电气工程学部卢湖川教授领导的IIAU实验室代表队MBMD获得本次竞赛长时组别冠军。相比于短时跟踪器,长时跟踪器必须具备判断目标是否在镜头内并在整个视野中检测目标的能力。这使得VOT 2018长时竞赛更具有挑战性。MBMD团队提出的模型新颖之处在于利用匹配网络和分类网络在目标跟踪任务中各自优势,提取了适应性和判别性更强的跟踪目标视觉特征。提出的协同作用卷积网络模型能够准确地判断出目标是否出现在当前视野内,并有效地在整个视野中搜索目标,在性能上显著优于以往长时跟踪器。中国科学院自动化所视频内容安全团队的算法在长时跟踪比赛中取得第二名。