在近日召开的ACM Multimedia 2017会议上,来自阿里巴巴iDST(Institute of Data Science and Technologies)团队的三篇关于“城市大脑”的论文入选其中,三位论文作者受邀赴峰会做报告。
ACM MM是全球多媒体领域的顶级会议,属中国计算机学会(CCF)指定的A类国际会议。今年受邀赴美作口头报告的论文作者占比仅为7.5%,ACM MM组委会在邮件中称整个论文评选过程为“艰难激烈的”。此次阿里巴巴入选的三篇论文涉及的交通事故、人流轨迹、交通数据样本等技术问题均来自“城市大脑”实际应用场景。
早在2016年阿里巴巴就推出了人工智能“ET城市大脑”,通过为城市安装人工智能枢纽,以摄像头为核心进行数据采集与计算,对整个城市进行全局实时分析,自动调配公共资源,修正城市运行中的Bug。
“城市大脑”成功落地杭州、苏州等地,整个项目团队解决了大量难题,并在2017杭州云栖大会上交出了一份漂亮答卷:经过一年测试,“城市大脑”成功接管了杭州128个信号灯路口,试点区域通行时间减少15.3%,高架道路出行时间节省4.6分钟。此外,在主城区城市大脑对交通事件进行智能报警,日均事件报警数达500次以上,准确率达92%,大大提高了执法指向性,在萧山区,120救护车到达现场时间缩短一半。
会议现场,iDST团队的申晨、赵一儒对《时空自编码器的视频异常检测模型》、《基于多层相似度感知的深度神经网络及其在同人鉴别中的应用》两篇论文进行了口述报告。
ACM MM参会人员在阿里展位观看城市大脑演示内容
在阿里巴巴展区,技术人员向来自北美、亚洲、欧洲等区域的参会者介绍了阿里巴巴杭州“城市大脑”技术方案,在现场演示了DEMO内容。
来自美国 University of California, Irvine的Ramesh Jain教授(多媒体领域著名资深领军人物),瑞士Idiap和EPFL的Daniel Gatica-Perez(多媒体领域知名专家),澳大利亚墨尔本La Trobe University大学的Phoebe Chen教授(Chair of Department of Computer Science and Information Technology),以及新加坡国立大学、清华大学、北京大学、浙江大学等国内外大学知名教授纷纷参观了展台,并对阿里巴巴“城市大脑”方案进行了高度点评,他们认为“城市大脑”的确是人工智能的超级应用和创新平台,城市大脑方案真切地反映出阿里巴巴在人工智能技术领域的深厚实力,尤其通过技术推动城市管理与商业发展,为市场拓宽了技术发展思路。同时表达了和“城市大脑”项目合作的意向。
浙江大学庄越挺教授<左三>在阿里展区观看城市大脑演示DEMO
Ramesh Jain教授<右一> 和华先胜博士讨论城市大脑
Daniel<中>和华先胜博士交流
“城市大脑”人工智能技术负责人、阿里巴巴 Distinguished Engineer及iDST副院长华先胜表示,“城市大脑”包含多项人工智能技术,如视觉认知、优化决策、视觉搜索、预测、大规模实时视频处理系统等。“城市大脑”的应用场景也是许多技术研究的起点,研究成果都将保证“城市大脑”的真实落地。同样在这次会议组织的LSVC(Large-Scale Video Classification Challenge)大规模视频分类比赛上,阿里巴巴iDST视频技术团队凭借平均准确率87.41%创造本年度最佳成绩并夺得冠军。
除“城市大脑”外,阿里巴巴的人工智能“ET大脑”还落地了“工业大脑”、“”医疗大脑、“环境大脑”等多个领域。正是因为有了阿里巴巴领先的人工智能技术,才会有如今不断演进的“ET大脑”。在未来,阿里巴巴也将不断精进在人工智能领域的技术研究,推进人工智能在多个领域的成熟落地,以技术提升效率改善生活。
以下为本次ACM MM峰会入选论文介绍:
Spatio-Temporal Auto Encoder for Video Anomaly Detection
时空自编码器的视频异常检测模型
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
赵一儒
Bing Deng (Alibaba Group)
邓兵
Chen Shen (Zhejiang University & Alibaba Group)
申晨
Yao Liu (Alibaba Group)
刘垚
Hongtao Lu (Shanghai Jiao Tong University)
卢宏涛
Xian-Sheng Hua (Alibaba Group)
华先胜
论文摘要:
为城市大脑提供监控交通异常的方法。受动作识别等领域的最新研究成果启发,设计了一种时空自编码进行视频异常检测,同时提出一种权重递减的预测误差计算方法。经真实的交通场景评测,该算法在重要指标上已经超过了此前的最好方法。
Deep Siamese Network with Multi-level Similarity Perception for Person Re-identification
基于多层相似度感知的深度神经网络及其在同人鉴别中的应用
Chen Shen (Zhejiang University & Alibaba Group)
申晨
Zhongming Jin (Alibaba Group)
金仲明
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
赵一儒
Zhihang Fu (Alibaba Group)
付志航
Rongxin Jiang (Zhejiang University)
蒋荣欣
Yaowu Chen (Zhejiang University)
陈耀武
Xian-Sheng Hua (Alibaba Group)
华先胜
论文摘要:
为人流轨迹的识别判断提供技术支持。结合深度学习的Siamese网络和分类网络模型优势,同时将相似度扩展到其他层次。与经典的大规模同人鉴别公开数据集对比,目前检索精确度的最优结果已达业内最高水平。
Stylized Adversarial Autoencoder for Image Generation
基于风格化对抗自编码器的图像生成算法
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
赵一儒
Bing Deng (Alibaba Group)
邓兵
Jianqiang Huang (Alibaba Group)
黄建强
Hongtao Lu (Shanghai Jiao Tong University)
卢宏涛
Xian-Sheng Hua (Alibaba Group)
华先胜
论文摘要:
解决城市大脑交通视频数据样本不足的问题。受条件对抗生成网络和风格迁移学习的启发,采用内容提取网络和风格提取网络分别从内容图片和风格图片中提取特征,将两者融合后,通过图片生成网络获得融合相应内容和风格的图片。