在大数据跟云计算刚刚被提出时,很多人都对它们的作用有所质疑。而现下,云计算和大数据正以其强有力的意义显示着其无法阻挡的发展趋势。而云计算和大数据在各项行业中的落地应用,为企业的发展、人们的生活质量,以及医疗行业都是受用其带来益处的典型。
在中国,一直存在着“看病难”这个问题,而究其原因,其实是因为医疗资源的匮乏所造成的,而要想解决这个问题就需要加大医疗资源的供给,除了医疗配套设施等的增加,还要尽快提高医院的工作效率,而这恰好是云计算和大数据能够帮助解决的问题。
医疗行业大数据所蕴含价值与挑战
医疗行业中大数据不仅量大且繁杂,其中蕴含的信息价值也是丰富多样。而医疗大数据的来源主要包括四类:一是制药企业和生命科学;二是临床决策支持和其他临床应用,包括诊断相关的影像信息等;三是费用报销、利用率和欺诈监督;四是患者行为、社交网络。这些大数据均蕴含相当有利的应用价值。
虽然对其进行有效的存储、处理、查询和分析,就可辅助临床医生做出更为科学和准确的诊断和用药决策,或帮助医院根据患者潜在需求开发全新个性化服务及自动服务,甚至于帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置。
但也有数据统计,在目前的医疗行业,寻常一张CT扫描图像,就含有约150MB的数据;一个基因组序列文件大小约为750MB;标准的病理图的数据量则大得多,要接近5GB。如果将这些数据量乘以人口数量和平均寿命的话,仅一个社区医院累积的数据量,就可达数TB甚至数PB之多,而且其中还富含图像、视频等非结构化数据,更勿论规模更大的医疗机构,甚至是地区医疗主管部门汇集的数据集。
大数据帮助提升业务分析效率
如何将海量、复杂的数据的存储、处理和保护成本降至最低,同时还能对此进行实时或准实时的处理、秒级的查询需求响应以及智能、深入的分析,都面临这很大的难题。这其中之一就是大数据集的存储、处理和查询难题。
英特尔与用友医疗就关于大数据分析的解决方案进行了深入的探索和研究,并且制定了基于英特尔大数据解决方案的区域卫生数据中心建设目标:在海量数据情况下,数据中心必须具有文档快速检索的性能;随着未来医疗系统的升级,医疗标准的版本升级,数据中心必须能够解决存储模式如何满足数据模式的更新的问题;数据中心必须具备水平扩展能力和对应用程序透明的能力,要求能做到底层扩展对上层业务的隔离,通过更多的服务器成比例的透明化扩展容量和性能。
如果说英特尔是对医疗行业的大数据进行高效的存储、查阅和处理,那么,甲骨文和IBM等企业就是依靠软件在大数据的分析和挖掘来发掘大数据更多的价值。他们从医院管理目标出发对医院运营数据仓库进行规划和建模,以医院的HIS、EMR、病案管理、医保等系统作为数据源,进行数据抽取、清洗和转换,为数据的智能化分析利用打好基础。