Tableau首席技术官:对抗虚假信息,用数据建立信任

Andrew Beers

Tableau 首席技术官

Tableau首席技术官Andrew Beers邀请行业领导者、研究人员和创新人员,共同探讨改变数据未来和数据分析技术的重大问题。

过去一年荆棘密布、挑战重重,而未来长路漫漫,许多问题亟待解决。为此,我邀请了企业管理人员、研究人员和创新人士共同进行讨论,分享关于如何塑造未来的真知灼见。作为 Tableaus 首席技术官,我有幸领导了一支兼具世界一流技术和以人为本理念的优秀研发团队。我们潜心研究十多年,齐心协力寻找数据、技术和文化之间的共同点,研究它们如何相互作用。 

我们认为,从办公到创新,人们当下选择使用数据和分析它们的方式将影响改变我们未来的决策。本文将重点聚焦数据信任,介绍我们如何利用数据获得可靠信息,而非其他未经验证的内容。 

真假新闻

过去的一年,面对各种不确定性,数据洞察的热潮兴起,但虚假信息也开始泛滥。大肆传播的虚假信息、阴谋论引发的争议成为公众议论的热点话题,让人们忽略了事实本身。很遗憾,仅凭数据并不能完全消除这种现象。当新冠肺炎疫情成为公众的日常讨论话题时,各种对相关数据的解读、怀疑和分析纷纷涌现。而大众需要从海量内容中自行提炼信息,判断这种疾病的危险是否有被夸大的成分,以及各种虚假信息中是否也存有一些真相。 

在《财富》杂志最近刊登的一篇文章中,有专家表示,为了应对数据被无意误用或滥用的情况,我们必须做出一定的改变。首先,他们建议开展公众教育,帮助人们培养从讯息中辨别假新闻的能力。其次,科技公司也必须加大力度,遏制和控制虚假信息的传播。同时,公众需要对所见所闻保持客观态度,理性判断,而不是仅仅求证自己希望成真的信息。只有各方一起行动起来,才能有效遏制虚假信息的扩散。

正确使用和解读数据对于帮助人们识别信息真伪非常重要。因此,对于企业而言,重视数据并指导员工如何正确使用和解读,将为公司带来更大的竞争优势。 

数据信任

在 Tableau,所有人都各司其职,各尽其责。我的团队一直在探索各种方法,在提高数据和分析的可信度和透明度的同时,避免产生混乱。诚然,创新技术对信息鉴别有很大的帮助,但我们不希望仅凭技术来辨别真假。 

人们在数据和分析方面具有丰富经验、创造性思维和批判性的道德判断。而我们对于数据进行批判性思考的能力就显得尤为重要。我邀请了来自各行各业的专家,请他们分享关于数据信任的观点。共同讨论我们应如何看待有关新冠疫情的数据,以保证我们得到的消息真实可信?我们又应该如何利用数据来帮助我们进行关键决策?

__________________

Francis X. Campion,医学博士,美国内科医师协会会员The MITRE Corporation 数字健康首席负责人

疫情爆发期间,科学界和公共卫生界需要根据现有数据进行决策。正如同医生需要根据患者所用的药物和手术做出治疗决定,并不断权衡潜在的利弊。这是我们每天面对患者时都要经历的过程。  疫情让我们不得不在极短的时间内加快数据驱动角色的进程,改变我们制定科学和公共政策的方式。这需要各方的协作和信任。我们迅速且顺利地建立了几个新联盟(例如新冠病毒肺炎医疗联盟),凝聚人才和机构的力量,根据现有的最佳数据共同解决问题。

展望未来,我们希望通过快速更新的大规模数据计划,将医疗体系和公共卫生系统更加紧密地联系在一起。我们期待这些协作可以让 AI 和 ML 在超大型数据集中的应用成为可能。我们希望数据科学取得的这些进展能够加速推动新疗法的发现、新药品和疫苗的研发,以及对现有疗法的再利用,以达到新的目的。

__________________

Yoav SchlesingerSalesforce 人工智能伦理负责人

数据是我们现在为度过疫情难关而做出的每一项决策的关键,无论是预测医院收容量,还是向最急需疫苗的地区部署疫苗,数据都起到了重要作用。虽然我们早就知道数据的重要性,但现在,我们更需要使用数据工具在正确的时间提供适用的信息,确保公平负责地抗击疫情。但是,如果我们手头的工具或数据存在偏见或系统性不平等,就会产生涟漪效应。 

举例来说,全国各地的医疗系统一直努力开发 AI 系统,以预测新冠患者患重病甚至死亡的可能性。但总的来说,用于训练这些模型的数据集未能包括不同类型的患者,因此一些模型极有可能导致对新冠患者的偏见和不平等护理。事实上,不平等的数据已经给黑人、原住民和其他有色人种社区造成了额外的伤害。 

我们应该对我们研究的信息刨根究底,甄别数据来源是否合法。如果合法,它们来自哪里?是谁整理的这些数据?数据背后的假设是什么?数据是否得以准确呈现?我们如何确保根据数据解析做出的行动能够最大程度地减少不平等,而不是加剧不平等?现在,我们需要从根本上重新评估我们与数据的关系,并围绕数据的收集、使用和滥用建立新的规范。

__________________

Anamaria Crisan 博士Tableau 高级研究员

150 年前,约翰·斯诺和弗洛伦斯·南丁格尔借助数据回答了一个关键问题: “人为什么会死?” 为此,他们独立开发了创新的可视化数据收集方法,以对抗严重的霍乱爆发和士兵们面临的不断恶化但致命的卫生条件。他们根据研究发现制定了干预措施,阻止了疾病的传播,并最终建立了现代公共卫生实践。 今天,他们的事迹激励了新一代的流行病学家去了解和应对看不见的威胁,拯救无数人的生命。

但是从数据收集到付诸行动的过程并非一帆风顺。斯诺和南丁格尔都通过不断努力,才在收集到的数据中了解潜在的传染媒介。关于疾病的来源和传播途径,人们众说纷纭。斯诺和南丁格尔身边存在着各种各样的说法,有些合理,有些则不然。为了找到正确的答案,他们不知疲倦地调查和测试得到的数据,最终才付诸行动。随着科学家和社区管理者不断整理出关于新冠疫情的各类数据,我们今天也面临着同样的挑战,人们对疫情的猜测有真有假。但在今天,我们可以创建平台,向公众广泛传播可视化的数据,帮助人们厘清事实。我们提供了一项关键服务,允许人们分享和贡献数据,打击蓄意误导的信息,并团结社区共同行动。  然而,我们现在面临的挑战可能会在下一次疫情爆发时卷土重来。因此,我们必须不断努力,创新数据处理的方法,来对抗疾病和虚假信息的传播。