Page 1 of 1

人们已经尝试定义这些概念;

Posted: Sun Feb 16, 2025 9:49 am
by sujonkumar6300
在大数据的情况下,经常提到 3V(容量、种类和速度);而在数据科学的情况下,通常可以找到这种图表。



问题在于这些定义是开放的;他们举了几个例子(例如数量),但本质上保留了将任何东西称为“大数据”或“数据科学”的可能性。这并不奇怪,因为这些毕竟是为了营销目的而创建的术语。

如果我们想要得出一个可用的定义并消除所有的炒作,我们 白俄罗斯 WhatsApp 号码列表 需要考虑一个更精确的定义,即使这意味着使其更加排他。

大数据:

它必须涉及跨多台服务器的分布式计算。
它必须结合数据管理和处理。
它必须超越关系数据库和数据仓库。
它应该允许获得以前的方法无法获得的结果,或者需要更长的时间(执行时间或延迟)。
数据科学:

它必须涉及一个或多个领域的知识(例如金融、医学或地质学)。
必须考虑计算方面。
它应该包括假设检验和结果验证等科学技术。
结果必须可靠。
它应该比以前的方法涉及更多的数学和统计学。
它应该包括机器学习、人工智能或知识发现算法。
它应该涉及软件开发的可视化和快速原型设计。
你必须以令人不安的程度满足至少其中一项职责。