2020年8月,世界三大计算机会议之一的ECCV 2020正式在网上举行。深蓝科技的深蓝团队在GigaVision 2020挑战赛中获得了图像多类别目标检测和视频多目标跟踪的双轨制冠军,有力地推动了十亿像素级图像和视频目标检测技术的发展。此外,他还在VIPrios系列和Vis无人机系列中获得了两项亚军和四项季军,其中包括八项大奖。值得一提的是,该团队还在谷歌标志性建筑检索2020中获得了一枚金牌,这是谷歌在卡格尔平台上举办的ECCV挑战赛。到目前为止,神兰科技已经在ICCV、CVPR和ECCV取得了许多优异的成绩,并实现了世界计算机视觉三大会议挑战的大满贯。
申兰科技赢得的GigaVision 2020挑战赛是由清华大学基于其最新发布的数据集PANDA组织的,该数据集是世界上第一个10亿像素的视频数据集。在过去的十年中,以人为中心的计算机视觉分析任务,如行人检测、跟踪、运动识别、异常检测和属性识别,已经引起了人们的极大关注。为了推广新的算法来理解大规模现实场景中复杂的人群活动和社会行为,十亿像素级的目标检测技术将被广泛应用于人脸识别、无人驾驶、监控与安全、智能手机等领域。
GigaVision 2020挑战赛的任务是两个经典的视觉任务:图像多类目标检测和视频多目标跟踪。任务1是行人和车辆检测,任务2需要提取视频中的行人轨迹。在熊猫上检测的准确性和效率必须同时解决。目标尺度的明显变化和复杂遮挡对精度提出了挑战,而10亿像素的分辨率对效率有很大影响。同时,相似目标的巨大规模变化、远距离跟踪的需要以及行人拥挤和相互遮挡的复杂场景带来了严峻的挑战。深蓝科技的深蓝团队在测试过程中将任务分解成多个子任务,并独立解决困难。根据以往的测试经验,积累的模块和方法进一步提高了测试结果。最终,第二名和第三名之间的差距只有千分之几,而深蓝队的最好成绩比第二名高出2.6个百分点,并有力地赢得了冠军。
作为神兰科技的核心技术之一,计算机视觉已经在许多国际比赛中得到验证,并被应用到不同领域的产品中,包括在疫情期间发挥巨大作用的神兰人工智能热视觉行为监控系统——猫头鹰(Owl),在广州、深圳、武汉、上海和长沙获得驾驶考试执照的熊猫智能公交车,以及各种机器人和智能零售产品。基础研究和算法的领先将直接影响产品的性能和人工智能的应用。因此,神兰科技将继续秉承“人工智能,服务民生”的愿景。