近年来,已经发表了超过 28,000 篇关于图形驱动数据科学的同行评审科学论文。但是,获得图数据科学的好处不再仅限于科学家和财力雄厚的人。该技术揭示了上下文数据连接,为智能系统提供动力并增强机器学习预测。
谷歌是最早使用基于图表的页面排名来彻底改变搜索引擎的公司之一。现在,图形技术的使用量呈指数级增长。随着公司寻求从数据中获得最佳见解,对图形数据科学的兴趣与人工智能和机器学习重叠。
图形数据科学可以通过图形算法推断每条数据的连接上下文的“形状”,从而实现卓越的机器学习建模。图形数据科学让企业可以在许多不同的情况下进行预测,从欺诈检测到跟踪客户或患者的旅程。它可以帮助公司从用户旅程中学习,为未来的购买提供准确的建议,并得到购买历史证据的支持,以建立对建议的信心。知识图谱也被用于识别基因和疾病之间的新关联,发现新药。
分析公司 Gartner 已将图形数据科学确定为关键的数据和分析技术趋势。当被问及人工智能和机器学习的使用情况时,92% 的公司表示计划在五年内采用图形技术。Gartner 认为,四分之一的全球财富 1000 强公司将在三年内建立技能基础,并将利用图形技术作为其数据和分析计划的一部分。
中央的图形技术
图形技术正在政府高层使用。数据科学家 Felisia Loukou 和 Matthew Gregory 博士在图形技术的帮助下部署了他们的第一个机器学习模型,根据他们正在访问的页面向 GOV.UK 用户推荐内容。
科学家们解释说,他们的应用程序学习了图形节点的连续特征表示,然后可用于机器学习任务,例如推荐内容。他们指出,为模型的训练和部署创建必要的数据基础设施是最耗时的部分。
图表技术推动营销
即使对于网站的临时访问者,图形技术也有助于识别正确的内容。媒体和营销服务公司 Meredith 的高级数据科学家 Ben Squire 使用图形算法将数十亿的页面浏览量转换为具有丰富浏览配置文件的数百万个假名标识符。他说:“向在线用户提供相关内容,即使是那些没有进行身份验证的用户,这对我们的业务至关重要。我们现在不再是‘在黑暗中做广告’,而是更好地了解我们的客户,这转化为显着的收入增长和更好的消费者服务。”
支持医疗供应链
图数据科学也在支持医疗供应链。医疗设备制造商波士顿科学公司正在使用图形数据科学来确定产品故障的原因。多个团队,通常位于不同的国家,经常并行处理相同的问题。然而,工程师不得不求助于分析电子表格中的数据,导致不一致,最重要的是,难以找到缺陷的根本原因。
波士顿科学公司建立了一个由三个节点组成的图形数据模型,其关系可以追踪故障到零件并将其连接到成品。分析查询时间更快,有助于提高整体效率并简化整个分析过程。该公司现在可以识别更有可能出现故障的特定组件。另一个好处是,由于图数据模型非常简单,因此很容易与他人交流。“参与该项目的每个人,从业务利益相关者到技术实施者,都能够相互理解,因为他们都说一种共同的语言,”该公司的数据科学家 Eric Wespi 证实。
促进健康结果
在医疗保健领域,纽约长老会医院的分析团队正在使用图形数据科学来跟踪感染并采取行动控制感染。医院希望记录每一个事件,从患者入院到他们接受的所有测试以及最终出院。图形数据科学提供了一种灵活的方式来连接事件的所有维度——事件发生的内容、时间和地点。
该团队创建了一个“时间”树,然后创建了一个“空间”树来模拟所有患者可以在现场接受治疗的房间。这个初始模型揭示了大量的相互关系。为了在此基础上进行构建,包含了一个事件实体来连接时间树和位置树。生成的数据模型允许分析团队分析其设施中发生的一切。
这些例子只是图数据科学可能性的一小部分尝试。图形技术与预测性人工智能和机器学习计划齐头并进,并将成为企业数据分析的关键支柱。