DOIT 发表于:14年12月14日 15:34 [来稿] DOIT.com.cn
2014年12月12-14日,作为大数据领域最具影响、规模最大的IT盛会——2014中国大数据技术大会暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店圆满落幕。大会历时三天,以国际化的视野,分享了海内外大数据技术的发展趋势;从技术与实践角度探讨“大数据生态系统”、“大数据技术”、“大数据应用”、“大数据基础设施 ”等新技术应用和实践经验;通过创新大赛和培训课程等特色活动,解密大数据创业热点,分享行业实战经验。2014中国大数据技术大会已经成为大数据技术与应用深度结合的新起点,产业界、科技界与政府部门密切合作的新平台,为推动我国大数据的产学研用做出了重大贡献。
2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)大会由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业发展为主旨。同时,由中国计算机学会主办,CCF大数据专家委员会承办,南京大学与复旦大学协办的“2014年第二届CCF大数据学术会议”同时召开,并与技术大会共享主题报告。
为了更好地讨论大数据技术生态系统的现状和发展趋势,交流大数据技术实践经验,进一步推进大数据技术创新与应用,展示国内外大数据领域的最新成果,BDTC 2014特邀近百位来自全球大数据产业界知名学者、企业领军人物、行业资深专家、一线实践技术代表,内容涵盖Hadoop、YARN、Spark、Tez、HBase、Kafka、OceanBase等开源软件的最新进展,NoSQL/NewSQL、内存计算、流计算和图计算技术的发展趋势,OpenStack生态系统对于大数据计算需求的思考,以及大数据下的可视化、机器学习/深度学习、商业智能、数据分析等的最新业界应用。
作为中国大数据领域最具价值的IT盛会,历经七届沉淀,中国大数据技术大会已经成为中国最具影响、规模最大、参会者人数最多的大数据领域技术盛会。第八届中国大数据技术大会对于产业的发展与推进有着重要意义。
大数据引发工业革命
近年来,国内外互联网公司和传统企业大都已经意识到数据资产化和规模化带来的潜在价
值,如何低成本且高效率地存储和处理数百TB乃至EB量级的数据成为极大挑战。“向数据要价值”使得几乎每个行业都面临着大数据问题。“大数据”引发了新一轮IT“工业革命”。
2014年,大数据技术已经在互联网、运营商、IT服务提供商,以及众多传统企业中落地实践。在全体大会主题演讲环节,海内外顶级专家学者深入探讨了大数据技术生态系统的现状和发展趋势和落地实践经验。
其中,Hadoop之父、Cloudera首席架构师Doug Cutting的“The Data Revolution”主题演讲分享了新时代的数据革命;AWS大数据和高性能计算框架全球高级经理Ben Butler,IBM大中华区系统与科技事业部杰出工程师李永辉,卡内基梅隆大学计算机科学系教授Zhang Hui,University of Delaware电子与计算机工程系教授、计算机系统结构和并行系统实验室主任高光荣,卡耐基梅隆大学教授、ICML2014程序主席Eric P. Xing,Conviva联合创始人兼CEO、Huawei EU Research Center研发架构首席架构师Sabri SKHIRI,HBase核心贡献者Ted Yu带来了国际最新技术思想和实践经验。
百度研究院副院长、深度学习实验室主任、图片搜索部高级总监余凯分享“大数据人工智能”,星环科技CTO孙元浩解密“2015年大数据基础技术的演进趋势”,浪潮集团高级副总裁王恩东讲述“大数据开启行业化应用新浪潮”,中国移动苏州研发中心大数据产品部总经理钱岭剖析“电信运营商大数据商务模式研究 ”,则深入谈论大数据生态系统的现状和发展趋势,分享了主流实践技术经验。
百家企业分享大数据实战经验
围绕“大数据生态系统、大数据技术、大数据应用、大数据基础设施”四大技术分论坛,来自Hadoop PMC、OpenStack基金会、Databricks、LinkedIn、Intel、eBay、Dropbox、VMWare、DELL、希捷、阿里巴巴、腾讯、百度、中国移动、华为、浪潮、搜狐、网易、携程、高德、沃尔玛、亚信等海内外一线IT公司的近百位工程师精英,从现实出发彻底剖析大数据技术实践中的问题和解决方案。
大数据生态系统绘制发展图谱。汇聚Databricks、美国俄亥俄州立大学、华为、Hadoop/Tez PMC、Intel、OpenStack基金会、中国移动、LinkedIn、阿里巴巴等十余个机构的一线专家,研讨如今大数据生态领域的热门技术和实践。其中,论坛上午,Databricks 软件工程师、Apache Spark PMC成员孟祥瑞分享了“Apache Spark and Databricks Cloud”;美国俄亥俄州立大学计算机科学与工程系Senior Research Associate鲁小亿就“在现代集群上使用RDMA加速大数据处理”做了经验分享;华为Universe大数据平台架构师徐健鹏讲述了“基于DAG引擎的流式ETL”的实践经验; Apache Hadoop和Tez项目PMC成员Bikas Saha带来了名为“Apache Tez-A Framework to Model and Build Hadoop Data Processing Applications”的技术演讲;Intel Senior Software Engineer、Apache Hadoop Committer、 Apache Hadoop PMC Member Uma Maheswara Rao G 与Intel Senior Software Engineer、Apache Hadoop Committer Yi Liu共同完成了技术演讲“Apache Hadoop中的扩展属性和透明加密”。论坛下午,OpenStack基金会董事杜玉杰、中国移动集团公司业务支撑系统部项目经理何鸿凌、LinkedIn 软件工程师王国璋、柏睿数据科技有限公司董事长兼CTO刘睿民、阿里巴巴资深技术专家蒋志勇、 云人科技联合创始人兼CEO吴朱华等六位专家则会就OpenStack、数据库、分布式消息系统、内存技术等多个领域的进行深入技术分享。
大数据技术分享实战成果。搜狐移动研发部经理刘佳的“基于全网内容的新闻客户端推荐系统”,前通联数据首席战略官龙白滔的“金融投资大数据实践分享”,VMware高级产品线经理董波的“VMware为大数据应用铺平道路 ”,亚信科技大数据事业部数据资产管理部门产品总监高伟的“数据资产管理——大数据时代的掘金术”从不同维度展示大数据技术应用方向。网易NTSE/TNT引擎负责人胡炜的“网易数据库压缩技术 ”,英特尔大数据首席架构师戴金权的“基于Spark软件栈的下一代大数据分析”,VMware 资深业务解决方案架构师介文清 的“12306:改变传统思路解决问题的NoSQL实践”,Admaster技术副总裁卢亿雷的“Hadoop在广告监测技术的实践”,阿里巴巴数据平台事业部ODPS 技术专家徐冬的“ODPS MapReduce 对外开放实践”, 携程资深软件工程师廖晓格的“让大数据更实时和可视化”,品友互动联合创始人兼CTO沈学华的“DSP 基于数据的实时竞价优化”则在技术细节方面更加突出实战处理。
大数据应用聚焦行业落地。华盛顿大学终身教授、中国联通研究院大数据/云计算首席科学家陈一昕,Co-Create of Apache Kylin、eBay高级产品经理韩卿,中国移动苏州研发中心大数据项目总监徐萌,百度研究院大数据实验室数据科学家沈志勇,腾讯数据平台部精准推荐中心深度学习方向负责人邹永强,大会程序主席、Dropbox 研发经理邵铮,腾讯广点通高级研究员靳志辉,沃尔玛实验室核心数据科学家Zhu Tao,蚂蚁金服大安全安全智能部总监/ 资深数据专家,CCF 大数据专家委员会委员陈继东,宜信大数据创新中心研发总监郑华,高德软件有限公司数据架构师周琦等十一位技术专家携手带来一场大数据应用的盛宴。
大数据基础设施实现架构融合。为了覆盖大数据全产业链,本届大会首次增设了“大数据基础设施”分论坛,从硬件视角出发探讨大数据的存储、处理和软硬件融合技术。其中,浪潮集团副总裁胡雷钧从数据中心层面讲解了新时代的资源保障体系;Mellanox亚太区市场开发总监刘通,武汉绿色网络信息服务有限责任公司副总经理雷葆华,博科中国区技术总监谷增云从网络层次着手对大数据时代基础设施进行了分析;希捷资深架构师郝继玖,Memblaze技术顾问刘爱在存储方面做了相关分享;而百度基础架构部高级架构师柴华,北京卓越讯通科技有限公司CEO赖兆红,DELL资深解决方案经理尹玉峰,阿里巴巴资深技术专家强琦,亚信大数据平台研发部经理田毅,AMD中国研究院研究员谷俊丽则带大家畅游了大数据平台打造之道。
除此以外,还有“全国大数据创新项目评选”活动脱颖而出的8家大数据初创企业的成果展示;“第二届中国大数据技术创新大赛”中获奖队伍的深入技术分享;以及帮助企业快速实现“基于大数据的个性化系统构建及其核心技术”的实战培训。
2015大数据发展趋势引领技术变革
2014年,在众多实践企业的推动下,大数据生态系统得到了飞速发展,各种技术在“应用为王”的大前提下飞速迭代,数据真正转化为高价值。而高速发展的背后,是技术架构的巨大改变。要以更低成本实现数据的最佳利用,企业需要紧随技术变革,把握趋势,才能更好地迎接挑战。
大会现场正式发布的《中国大数据技术与产业发展白皮书(2014)》和《2015大数据十大发展趋势预测》,代表了百余位业内专家在大数据典型应用现状、大数据技术体系现状、大数据IT产业链与生态环境、大数据人才资源、大数据发展趋势与建议等方面的深入思考,为未来大数据产业发展奠定坚实的理论基础,为企业制定大数据战略规划提供了极具价值的参考建议。
2014大数据应用现状和技术体系现状。大数据作为一种赋能性技术,如同电一样,作用于经济社会的各个层面。任何一种技术的应用都要经历从简到繁,由浅入深的过程,大数据的应用路径仍然遵从这一发展路径。数十亿用户每日在互联网上的处处留痕、时时留迹,使得其在网络空间的画像活动日益丰满,从而其需求很容易被准确洞察,精准营销仍为大数据最具产业规模的领域。围绕大数据精准营销产业链,互联网、金融、电信、新媒体等领域的大数据技术产品创新此起彼伏,应用广度不断拓宽,深度不断加强。同时,电网、交通、医卫、地信、政府、农业领域的大数据应用也明显提速。结合大数据典型应用与案例,不难发现,大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来,为人类社会经济活动提供依据,提高各个领域的运行效率,甚至整个社会经济的集约化程度。目前,大数据领域每年都会涌现出了大量新的技术,成为大数据获取、存储、处理分析或者可视化的有效手段;相关的平台和工具也越来越多,给业界提供了更多的选择,未来还会继续出现新的技术和工具。由CCF大数据专家委员会和中关村大数据产业联盟联合主编的《中国大数据技术与产业发展白皮书(2014)》将详细解读各种大数据技术的最新发展和动态。
2015技术挑战和技术发展趋势预测。CCF大数据专家委员会每年都面向全体委员进行年度趋势预测调研。希望通过对于大数据发展趋势的年度预测,将最受关注的科学、技术、产业、应用、政策等相关变化趋势发掘出来,以便大数据领域相关的各界人士能够从中获得启迪,或顺势而为,或依势而起,或引领潮头。《2015大数据十大发展趋势预测》将候选项分为大数据科学、大数据技术、大数据系统和工程、大数据应用、数据资源、产业生态环境等共6个不同方面,总计54个候选项。最后根据投票数,选出10个主要的发展趋势:大数据与人工智能的融合、跨学科领域交叉的数据分析应用、数据科学带动多学科融合、深度学习成为大数据智能分析的核心技术、利用大数据构建大规模、有序化开放式的知识体系、大数据的安全持续令人担忧、开源继续成为大数据技术的主流、大数据与云计算、移动互联网等的综合应用、大数据提升政府治理能力、数据资源化、私有化、商品化成为持续的趋势、大数据技术课程体系建设和人才培养快速发展。
2014中国大数据技术大会,百余场主题演讲、技术论坛和专业培训,数千名业内人士与会齐聚的深度实践之旅。作为大数据技术与应用深度结合的新起点,BDTC 2014已经成为产业界、科技界与政府部门密切合作的新平台,为推动我国大数据的产学研用做出了重大贡献。