Neo4j亚太区副总裁:答案,就隐藏在“数据关系”的背后

说到Neo4j,您一定看过这样的报道:Neo4j可以帮助NASA对其著名的“经验教训”数据库进行现代化改造,并推进了火星任务;被沃尔玛用于实时在线推荐;还被德国糖尿病研究中心 (DZD) 用于帮助糖尿病患者,并致力于消除这种疾病。

此外在Neo4j 社区,也一直在用图数据库技术解决一些社会紧迫问题:比如气候变化、癌症治疗、加速人类的火星之旅、推进性别平等、提高政府透明度、以及推动人类知识的边界等。

对此,您是不是也感到好奇:Neo4j是如何做到这些的呢?利用Neo4j图数据平台解决方案,会带来哪些突破呢? 为此,记者日前线上采访了Neo4j亚太区副总裁Nik Vora先生。

Neo4j亚太区副总裁Nik Vora先生

其实答案也很简单,这是一种图数据库的技术,通过对实体和关系抽取,通过研究发现数据背后的秘密。

仍然以糖尿病的研究为例,简单说糖尿病是一种代谢性疾病,但仅仅查看代谢数据是不够的,研究人员需要寻找、研究更多的线索,也许考虑其他学科,如基因组学或蛋白质组学。

无论如何,在人体代谢中一切都是相互关联的;一个基因编码会关联某种蛋白质、代谢物,而代谢物会影响、调节另外一种基因,可以说我们的代谢是由数千种相互连接的成分组成的网络,这就一个图数据模型。

借助对这种复杂的图数据模型的研究,也许我们会找到应对糖尿病的办法。

同样的在各行各业,拥有和积累了大量的数据,如果利用图数据库技术,对这些数据关系进行研究,会带来许多新的发现和惊喜。

“世界领先的汽车制造商沃尔沃也在使用Neo4j图数据库应用于知识图谱,每辆沃尔沃汽车都有近200个传感器、400个应用程序,涉及1万+信号源和3万+机械部件,所有的这些数据必须保持协同,任何错误都会带来安全隐患。” Nik Vora说。

“如果按照传统的方式将这些数据存储在excel表格或传统关系型数据库中,将很难形成各种数据关系的单一视图。” Nik Vora补充说。

沃尔沃使用Neo4j图数据库作为知识图谱的应用,各种隐藏的数据关系一目了然。以此为基础,研究人员从不同层次进行知识挖掘,运用图技术进行模型训练和数据分析,为车辆和行车安全提供了保障。

Nik Vora表示:中国作为制造大国,有深厚的生产能力和数据积累,更应该用好图数据库技术。作为一家瑞典的公司,Nik Vora重视中国市场,愿意加大中国市场投入,帮助中国从制造大国变为制造强国。

2021年是我国“十四五”规划的开局之年,也是我国“加快数字发展建设数字中国”的关键之年。其中,数据创新的作用举足轻重。毫无疑问,图数据库技术将带来新的思维和突破。应该抓紧对图数据库技术的研究。

对于图数据库技术而言,数据实体和关系的抽取非常重要,仅仅依靠人力,其难度很大。但是好的消息在于:循环神经网络(RNN、LSTM)、卷积神经网络(CNN)和 Transformer 等AI技术的应用,为数据实体和关系的自动抽取带来帮助,这也为数据研究带来新的契机。

世界上永远不缺少美好的事物,只是缺少发现美的眼睛!数据创新应用也是如此,人类很多难以突破的问题,其答案就隐藏在这些关系的背后,等待我们去发现。

一万年太久,只争朝夕!