端到端支持用友医疗数据大挖掘
许振新 发表于:13年05月20日 00:00 [原创] DOIT.com.cn
“2009年开始我们已经开始做Hadoop,当时是作为一个创新主题,看看Hadoop的架构、应用场景是什么。由于当时中国有具体的需求,大数据环境非常好,并且有电信行业典型的用户需求。这都推动我们马上把Hadoop变成了一个产品来满足客户的需求。”苗凯翔博士回忆说。
英特尔中国行业合作解决方案服务部企业技术销售与数据中心咨询资深经理张哲源表示,正是有了Hadoop的加入,英特尔才能实现“软硬”的有机组合,构成了英特尔针对大数据应用提供的端到端支持,推动更多的合作伙伴在其上开发适合行业需求的大数据解决方案。
端到端支持用友医疗数据大挖掘
作为英特尔医疗行业大数据的重要合作伙伴,用友展示了其基于英特尔平台的大数据解决方案。用友医疗卫生信息系统有限公司副总裁、用友智慧健康研究院首席专家徐春华介绍, 医疗行业和大数据相关的主要有三大领域,也即电子健康档案、城市级的电子病历数据中心和卫生医疗相关的统计数据。这三个领域的数据有着共性的特征:海量数据、结构化半结构化并存、版本随着时间而改变。有鉴于此,用友将大数据技术主要用于三大数据库的建设上。
“这些领域必须采用大数据处理手段来处理,关键要素涉及到两个:一是通过引入并行计算框架提高整个解决方案的运行性能,到了PB级数据以后,运行时间成为了关键参数;二是基于列的数据库架构,它和传统的关系型数据库有很大的差异。”徐春华说。
在过去一年中,用友医疗和英特尔上海Hadoop团队开展了深入的合作,采用基于英特尔x86服务器集群+Hadoop综合解决方案来尝试处理大型电子健康档案和区域性的医疗质量分析。目前从运转情况来看效果非常理想。
在医疗行业,用友采用的计算架构有三类:x86服务器、小型机、大型主机。谈到大数据领域用友为什么会选择x86集群?徐春华表示,传统做计算架构或者存储架构的时候,经常要考虑3年到5年的存储量。但这样往往存在着大量的浪费,因为刚开始往往用不到那么大的量。而英特尔提倡的横向扩展模式,可以根据业务的规模而随时增加计算和存储能力,这是用友和用友的客户非常乐于接受的一种模式。