近日,ACM Multimedia大规模视频分类挑战赛(LSVC 2017)结果揭晓,由中科院上海高等研究院信息技术中心视觉数据智能分析实验室和七牛云人工智能实验室AtLab组成的联合团队SARI&QINIU荣获亚军。
针对本次挑战赛对海量视频数据进行处理的特点,团队自主研发设计了流式数据处理系统(Elastic Streaming Sequential Data Processing System,ESSP)。ESSP系统充分考虑了视频分析处理中空间和时序特征的存取需求,可以灵活地进行服务部署、维护及扩展。在算法层面,团队研究了一种紧凑高效的视频帧特征表示方法,利用该方法可以减小模型规模、并极大地提升模型训练速度。团队最终取得了87.05%的准确率,以0.36%之差惜败于阿里iDST团队,位居亚军,比第三名参赛队高出近2个百分点。
LSVC竞赛
计算机视觉领域最知名的评测ImageNet挑战赛今年已是最后一期,这标志着静态图片的分类、物体检测等任务日趋成熟。但是在视频内容分析领域仍存在巨大挑战,也是当前学术界的研究热点。ACM Multimedia 作为多媒体领域的顶级学术会议,旗下大规模视频分类挑战赛(LSVC)意在考察大规模未分割视频的算法识别能力。
LSVC使用的数据集是在复旦-哥伦比亚视频数据集(FCVID)基础上扩充而来,它包含来自 YouTube 和 Flicker 的超过 8000 小时的视频,标注为 500 种分类。包括社交事件、动作、物体、场景等多种类型。最终测试集为 78,000 多个视频。
团队介绍
信息技术中心视觉数据智能分析实验室从成立至今,着力于视觉大数据智能分析技术的研究和应用,为计算机视觉智能应用提供技术支撑。经过几年的积累,团队已发表了十余篇知名国际学术刊物论文,获得国际知名学术会议最佳论文,并在人脸识别、字符检测、车辆检测、视频分类等具体问题的多项国际视觉数据评测竞赛名列前茅。实验室自建“图嶺人工智能深度学习平台”,拥有120块GPU,可调配超过400块GPU,结合各类已有多媒体数据,具有很强的深度学习模型定制能力。实验室与复旦大学、华东师范大学、公安部第三研究所、华盛顿大学、加州大学伯克利分校、马里兰大学等国内外科研机构广泛开展科技交流与合作,并与七牛云人工智能实验室在视频、检测等学术领域建立了产学研合作关系,优势互补,此次首次联合组队参加视频分析评测即取得不错的成果。