上QQ阅读APP看书,第一时间看更新
1.1.1 5V特征
一般而言,大数据具有5V特征,即大规模(Volume)、多样性(Variety)、快速性(Velocity)、低价值密度(Value)和真实性(Veracity)。只有具备这些特征的数据才是大数据。
● 大规模。全球数据量在2010年正式进入ZB(Zetta Byte,泽字节)时代。随着时间的推移,数据的规模将越来越大,增速也在逐渐提高。
● 多样性。大数据的来源广泛。例如,移动互联网、物联网、AR(Augmented Reality,增强现实)、VR(Virtual Reality,虚拟现实)、MR(Mixed Reality,混合现实)、生成式人工智能等都会产生大量数据。来源的多样性导致大数据类型的多样性。
● 快速性。由于大数据往往以数据流的形式快速、动态地产生,因此它具有很强的时效性。由于大数据自身的状态与价值往往随时间变化而变化,因此采集、分析和处理大数据时对时间要求比较高。
● 低价值密度。海量数据包含大量的不相关信息。随着数据量的增加,大数据中有意义的信息并没有成比例增加。大数据的价值与其真实性及处理时间相关,需要通过算法来完成大数据价值的“提纯”。
● 真实性。真实性是指大数据的质量和保真性。大数据要求具有较高的信噪比。信噪比与数据源和数据类型无关。