传统意义上的“数据”是指“有根据的数字”。进入信息时代之后,“数据”二字的内涵扩大,它不仅指代“数字”,还统称一切保存在电脑中的信息,包括文本、声音、视频等。信息时代的“数据”概念是明确的,但是对于“大数据”至今还没有一个公认的定义,不同的定义基本上是从大数据的特征出发,通过对这些特征的阐述和归纳试图给出定义。在这些定义中,比较有代表性的是4V定义,既认为大数据具备4个特点:规模性(Volume),数据量级已从240字节发展至250字节乃至270字节;多样性(Variety),数据类型繁多,越来越多为网页、图片、视频、图形和位置信息等半结构化和非结构化数据信息;高速性(Velocity),数据流通常为高速数据流,而且需要快速、持续实时处理;低价值密度(Value High and Low Density),即价值与数据总量之比很低,需要对海量的数据进行挖掘分析才能形成用户价值。
传统意义上的“数据”是指“有根据的数字”。进入信息时代之后,“数据”二字的内涵扩大,它不仅指代“数字”,还统称一切保存在电脑中的信息,包括文本、声音、视频等。信息时代的“数据”概念是明确的,但是对于“大数据”至今还没有一个公认的定义,不同的定义基本上是从大数据的特征出发,通过对这些特征的阐述和归纳试图给出定义。在这些定义中,比较有代表性的是4V定义,既认为大数据具备4个特点:规模性(Volume),数据量级已从240字节发展至250字节乃至270字节;多样性(Variety),数据类型繁多,越来越多为网页、图片、视频、图形和位置信息等半结构化和非结构化数据信息;高速性(Velocity),数据流通常为高速数据流,而且需要快速、持续实时处理;低价值密度(Value High and Low Density),即价值与数据总量之比很低,需要对海量的数据进行挖掘分析才能形成用户价值。