您的当前位置:首页 >> 新闻详情

信息图:大数据——谬误与事实

2016-03-07

大数据对所有的大小企业都是很有前途的。它对业务收入的增长带来一些帮助,也能了解服务和产品的差距。然而,与其他任何技术一样,人们对大数据的认知也有一些误解的部分。通过这个图表,我们打破了围绕大数据的一些谬误。

大数据

1、谬误:大数据是新概念

事实:圣经中的每个字都被大量的交叉引用,叫做一致性,在第一个数据库引用之前就被修道士使用了几个世纪。

2、谬误:大数据是针对大企业的

事实:所有规模的企业都能够利用大数据分析,这得益于最近的云数据管理技术的改进。

3、谬误:数据越多越好

事实:数据的质量胜过数据的质量。使用什么往往比使用多少更有价值。

4、谬误:我们的数据如此混乱,我们不可能掌握大数据

事实:先进的数据质量、主控数据管理和数据管理工具使清理混乱的企业数据更加容易。

5、谬误:每一个问题都是大数据的问题

事实:如果你要在几兆字节中匹配一些字段和一些环境,它不是真正的大数据问题。不要把每个分析需求都看成是大数据的工作。

6、谬误:大数据应用需要很少或者根本不需要性能优化

事实:大数据应用程序需要定期调整分析与越来越多的数据和变量的统计模型。

7、谬误:大数据是一个魔力8号球

事实:大数据可能不会告诉你一切。很多情况下取决于正确的问题和正确的数据才能让它工作。

8、谬误:大数据只是非结构化数据

事实:大数据不必非结构化。例如大量的结构化数据,由于其体积庞大而划分为大数据。

9、谬误:你需要非机构化数据来预测

事实:预测模型使用一个非结构化和结构化的数据组合来训练模型和推理。

10、谬误:机器学习是一个与大数据相关的概念

事实:机器学习的概念是利用数据来模拟一个潜在的过程。然而,当与大数据结合使用时,机器学习算法可以提供有价值的见解。

11、谬误:大数据不需要人监督

事实:无监督这个形容词并不意味着算法本身没有人监督。训练无监督学习模型的一个分析师(或一个数据科学家)有一个类似的建模学科作为一个培训的监督模式。

原文作者:Ketan Pandit,本文由36大数据-云泥翻译。

via:36大数据  http://www.36dsj.com/archives/42669