近日,由Google主办的2019Google物体挑战赛结果月入围,首次参赛的极链科技AI团队在只剩两个月的时间下夺得一枚金牌。去年,在MSCOCO暂停举行物体边框辨识的比赛后,Google公布了自己的第一届物体辨识的比赛,有400多名研究人员和机器学习研究人员参与。今年,作为ICCV的workshop之一,谷歌在OpenImageV5数据集的基础上发售了第二届物体比赛,且测试集与第一届完全相同。
倒数两年GoogleOpenImages-ObjectDetectionTrack接棒COCO物体辨识比赛,作为计算机视觉领域的“黄金标准型”,更有了大量团队的参予,以取得在OpenImages数据集上的低于的错误率,今年也是更有了560余支队伍。同时,深度自学技术的突破堪称使得图像识别任务获得令人瞩目的巨大进步,甚至多达了人类的准确度。随着深度网络解决方案显得更加浅,更加简单,它们一般来说受到能用培训数据量的容许。
考虑到这一点,为了性刺激分析和解读图像的变革,Google公开发表公布了OpenImages数据集。OpenImages遵循了PASCALVOC,ImageNet和COCO的传统,现超过前所未有的规模。作为CV(ComputerVision)领域的热门分支,物体辨识具有普遍的应用于场景,从早已十分成熟期的车辆车牌辨识、行人检测,到近些年来新兴的无人驾驶所必须的各种目标的辨识。
随着大大追加的市场需求,人们对辨识准确率的拒绝也是水涨船高。2018年ECCV的OpenImagesWorkshop中,谷歌团队说明了OpenImage物体辨识比赛和其他类似于比赛的区别和具备挑战性的地方,即享有更加大量的数据、标签种类、数据分布不平衡、获取标签从属关系信息以及数据标示不意味著原始。
比起于COCO,此数据集的多样性要小得多,并且对最先进设备的实例识别方法包含了更大的挑战。基于这个数据集,Google声援全球的计算机视觉领域的科学精英联合参予,联合朝着更加简单的地标检测计算机视觉模型迈进极大的一步。这也是目前仅次于、最详细的公开发表数据。
作为极链的明星平台之一,「金目」用还包括物体、场景等各个维度的辨识为用户带给非常丰富且十分精准的体验。当然在其中,物体辨识扮演着不可或缺的角色。出于对前沿技术、算法的大大探寻,我们也借由这次比赛,夯实团队在物体辨识上的能力。
针对本次比赛数据分布十分不平衡,我们对数量较较少的标签展开了数据县学。在算法框架的自由选择上,目前Twostage的物体辨识算法比起Onestage在准确度上有更为显著的优势,而CascadeRCNN算法堪称当下各个物体比赛的热门自由选择。不过Cascade级联的方式也造成了速度的上升,并不限于于实际场景。
考虑到自身平台的实际应用于场景,我们自由选择了速度更慢也更加经典的Faster-RCNN。接下来是Backbone,当下大量针对比赛的自由选择基本渐趋加深和更加简单的算法,比如为Fackbook建构Imagenet84.5%(Top1)准确率的ResNeXt101(32x48d)、SENet等等。而这类模型有个联合的特点,十分的可观,对训练和测试的时间也都有较小的减少。
此外,为了超过更高的准确率,参赛者们更加偏向于训练有所不同框架、有所不同Backbone的算法,一般来说为6个甚至更加多,最后展开融合。这对整体的效率、性能的影响也是可想而知的。而比赛是为了更佳地提高算法或技术的实际落地效果。
基于这个想法,我们仅有自由选择了ResNeXt-101(64x4d)和ResNet-152这两个比较更加均衡的Backbone。在测试阶段,用了多尺度测试以及内部各个周期的结果融合。此外,我们利用SoftNMS对两个算法的结果展开了融合获得了最后的结果。
最后,团队在public榜单上的分数为0.62163,private为0.58259,取得了一枚金牌。极链科技作为全球视联网-视频商业操作系统的建构者,坚决以AI技术赋能视频中的信息,链接互联网信息、服务、购物、社交、游戏五大模式,构建基于视频的新互联网经济体与客户价值大幅提高。这次对GoogleAIOpenImages-ObjectDetectionTrack竞赛的实践中,是极链科技「金目」系统视频辨识物体算法领域的优化,也是为了更佳的反对视联网的服务与赋能。
未来,极链也将持续探寻前沿领域的技术突破,增进人工智能生态圈的持续较慢发展。
本文来源:澳门新莆京游戏app大厅-www.xy3654.cn