Page 1 of 1

为可扩展的AI创建统一的数据+信息架构

Posted: Sat Jan 25, 2025 4:03 am
by Mitu9900
我们关于生命科学数据、信息和知识管理系列博客的第一篇概述了当今一些最常用的数据和信息框架。

在第二篇博客中,我们将快速了解数据-信息-知识连续体以及创建可支持可扩展 AI 部署的统一数据 + 信息架构的重要性。

2000 年,一篇具有开创性意义的知识管理文章摘自《工作知识:组织如何管理其已知内容》一书,文章指出,尽管数据、信息和知识这几个术语之间的区别只是程度问题,但理解这种区别可能是组织成败的关键。

区别本身很简单,数据是指一组离散的、客观的事实,它们几乎没有内在的相关性或目的,也无法为行动提供可持续的基础。具有相关性和目 巴哈马手机数据 的的数据则成为能够影响判断和行为的信息。知识包括智慧和洞察力等高阶概念,它源于信息,并有助于决策和行动。

如今,在大数据、人工智能和数据驱动型企业的时代,数据量和复杂性呈指数级增长,由于无法将原始数据大规模转化为可操作信息,导致信息缺口增加。数据堆越大,有价值但尚未使用的数据就越普遍。



生命科学领域的信息差距
生命科学数据通常以百亿亿亿字节、艾字节、泽字节甚至尧字节为单位,其海量性以及将这种海量数据转化为信息的迫切性,促使该行业将近一半的技术投资投入到三项与分析相关的技术中——应用人工智能、工业化机器学习以及云计算和边缘计算。与此同时,生命科学领导者认为,扩展分析的关键挑战是缺乏高质量的数据源和数据集成。

数据集成是成功的企业信息管理(EIM) 战略的关键组成部分。然而,数据专业人员估计有 80% 的时间花在数据准备上,从而大大减慢了数据洞察行动的进程。因此,创建正确的数据和信息基础设施(IA) 对于实施、运营和扩展 AI 至关重要。或者正如人们通常所说的那样,没有 IA 就没有 AI。