目标检测从视频到街景,深兰科技斩获4项ICCV2019竞赛冠军

被誉为全球计算机视觉领域三大顶级会议之一的ICCV(International Conference on Computer Vision),于10月27日-11月2日在韩国首尔举行。深兰科技DeepBlueAI团队载誉而归,分别斩获Joint COCO and Mapillary Recognition Challenge中 的Mapillary Vistas Object Detection Task、VisDrone Challenge (无人机视觉挑战赛)中的Object Detection in Videos和Multi-Object Tracking,以及CVWC Challenge (野生动物视觉挑战赛)中的Tiger Pose Detection四个冠军;并在NightOwls Pedestrian Detection Challenge、AutoNUE Challenge中的Semantic Segmentation和Panoptic Segmentation以及DeepFashion2 Challenge中的Clothes Retrieval等赛题获得四个第二和一个第三。

COCO是历届ICCV的重头戏,也是人工智能领域最具影响力的通用物体检测挑战赛,今年COCO与Mapillary联合举办Workshop,共有7大挑战赛,冠军队伍除深兰科技外,还包括谷歌、商汤、旷视等。COCO数据集侧重于自然场景的识别,而 Mapillary Vista数据集则侧重于对街景自动驾驶场景的识别,Mapillary在数据集焦点方面可以看作是对COCO的补充,为自动驾驶提供了有力的技术支持。

配备摄像头的无人机应用已从航空摄影扩展到农业、快速交付和侦察监视等领域,此次VisDrone Challenge (无人机视觉挑战赛)也是组织了相关领域的赛题。赛题难点诸多,比如包括了海量高空拍摄的小物体,每张图片有上百个待检测和跟踪的小物体,数据集总共含有260多万个标注框;因数据集是由无人机拍照所产生的结果,部分目标过小;数据集由于拍摄角度问题,产生了不同的数据分布,对预训练效果产生较大影响等。DeepBlueAI团队运用Cascade RCNN+DCN+FPN+DoublueHead检测器,以及IOU Tracker+ KCF+Tracklet vote的跟踪算法,最终以领先4个多百分点的巨大优势获得两项冠军。

CVWC Challenge (野生动物视觉挑战赛)则旨在探索利用计算机视觉技术保护濒危野生动物,并要求与会者同意开源他们的解决方案,以支持野生动物保护。Pose Estimation的难点在于举办方所提供的数据集由老虎组成,部分在COCO数据集上达到很好效果的模型在这个数据集上表现较为糟糕,团队为了保持更多的空间信息,使用了U-Net Plus作为处理特征的算法,始终保持第一的成绩至比赛结束。Pose Estimation的应用场景较为广泛,除了安防,还可用于Keep这类健身软件来检测动作是否正确或到位。

计算机视觉是当前计算机科学研究中非常活跃的领域,历来ICCV的竞赛类型多为复杂场景中的目标识别及跟踪,这对视频监控、人机交互、自动驾驶、虚拟现实等场景都具有重要意义。学术竞赛的成绩可以用来验证和展示企业的实力,但更为重要的是要将先进方案与落地应用相关联,统一部署。

深兰科技的明星产品“熊猫智能公交车”,除却已经获得广州、上海、武汉、长沙的自动驾驶测试牌照,在车内打造的“智能客舱”就有多个功能获益于这些冠军方案。“精准广告推送” 可以通过屏幕摄像头精准识别和分析广告收看行为,目标跟踪技术会锁定用户人脸,对其位置进行跟踪,再结合眼球检测即可进行精准广告定位。而关键点检测则可为行为识别提供更详尽的特征信息,得到更好的优化结果,为车厢内摔倒、偷盗等行为提供报警,提高乘车安全性,为“异常行为识别系统”提供技术支持。

深兰科技始终坚持基础研究和应用开发双落地,计算机视觉作为底层技术之一,对后期的应用起着至关重要的作用。人工智能正深刻地改变人们的生活,如何加速AI落地、用科技为民生谋福也将成为深兰坚持探索和实践的道路。

免责声明:本网所转载文章不做商业用途,不代表本网赞同其观点与立场,本网不对内容真实性负责,请谨慎选择与投资,若有来源标注错误或或内容侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。

留言与评论(共有 0 条评论)
   
验证码: