深圳地铁:“行走”的大数据分析平台了解一下

地铁是什么?在小编的认知里,地铁是我们现在上下班的主要通勤工具,速度快,不堵车,偶尔故障一下,但不影响整体客户体验。

深圳市地铁集团有限公司建设总部专业副总工王小飞

地铁与大数据分析的关系?在采访深圳市地铁集团有限公司建设总部专业副总工王小飞之前,小编的简单认知就是现在北京地铁线引入了自动驾驶,需要收集大量数据进行分析测试。

采访之后……

深圳地铁。成立于1998年7月的深圳地铁,属于市属国资企业,现有员工近2万。目前运营7条线,加上港铁运营1条线,深圳地铁总开通里程为285公里,全国排名第五。

地铁与数据分析。王小飞指出,在国内来说,自动驾驶(ATO)系统是普及的,但无人驾驶实际上只有三条线——香港南港岛线、北京燕房线以及上海10号线。无人驾驶对设备可靠性要求极高。列车司机不在车上,一旦停运,如何指挥列车行驶至到就近车站,进行人员疏散需要指挥中心进行统一调度。

实际上,在地铁公司的日常运营中,其实可以通过数据分析达到节省多项成本的目的。比如深圳地铁对每公里要配备多少人有着严格的指标,可以通过数据分析减少人工,节省成本。

在开通新线路时,通过数据仓库的历史数据进行仿真手段预测车站位置设置是否合理,需要配套多少运力,以及该条线需要配备多少车辆等。

Teradata的合作。深圳地铁需要构建指挥中心实现统一调度,有自身的业务需求。另一方面,国内北广深=津都采用了Teradata的解决方案,因此Teradata在国内地铁数据中心的建设和运维方面具备丰富的经验。而最重要的一点则是Teradata能够满足深圳地铁要求的产品服务保障以及实时服务。

周末,每一个城市都会有大型演唱会或体育赛事,如果不及时将乘客疏散,容易引起突发性事故比如人员踩踏事故等,收集这些数据进行分析,以便预知在出现大型活动时地铁站点及出入口该如何设置,出入口是否要关闭,列车是否要跨站等,助力地铁运营决策。

通过数据仓库建立模型并形成288项指标分析。比如行车方面,每天发车数量,准点率如何,是否有故障,行车间隔等,基于每一类专业的类别形成相应的指标。

深圳地铁除了经营深圳本土地铁外,业务延伸到了外地,如郑州地铁PPP项目,并获得了三个海外项目——运营埃塞俄比亚、越南河内、以色列特拉维夫三条地铁线路。2013年6月份,深圳地铁开始投入20亿元,规划筹建25条线的指挥中心,其中系统设备部分投入占 7亿元,而投入到数据挖掘与仓库开发的开支达到6000万+。

王小飞还指出,因为考虑到安全等问题,目前地铁各专业系统都采用专网,相对封闭运行,数据未对公众开放。但在未来,可能会开放部分数据信息,并与互联网公司合作进行深度数据挖掘分析。