以前我们关注的都是交易系统和业务系统产生的数据,通过数据仓库去分析展现,其实终端,尤其是个人各种流水操作,例如购买物品清单,上网浏览历史,照片,微博等也有,但是不关注,而大数据时代,更多的是关注这些大量的数据,期望分析这些数据来发现价值,因此大数据其实以前在系统,终端,个人等等都在产生,只是没有加以利用而已,现在要分析这些数据从中发现价值。
当数据量、数据的复杂程度、数据处理的任务要求等超出了传统数据存储与计算能力时,称之为“大数据(现象)”。可见,计算机科学与技术中是从存储和计算能力视角理解“大数据”——大数据不仅仅是“数据存量”的问题,还涉及“数据增量”、复杂度和处理要求(如实时分析)有关。
大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。