"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。 1、 数据体量巨大。从TB级别,跃升到PB级别。 2、 数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。 3、 价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。 4、 处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
声明:若涉及版权问题,请联系我们进行删除!谢谢大家!