编辑导读:随着“数智化”时代的到来,我们生活中的方方面面都离不开数据,而你真的了解数据吗?本文将为你重新解读数据的概念和价值,以及数据的价值是如何在“数智化”时代下一步一步得到运用与升华的。因内容颇多,我将分几期为大家进行讲解。
一、前言
我们日常生活中经常会听到这样的问题:你有数据支撑吗?你的数据来源是哪儿?数据噪声大吗?
那么这里的“数据”究竟是怎样的存在?
百度百科对数据定义很简单:数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。
而仔细想想,我们日常中所指的数据真的是data吗?其实,我们更多指的是已经形成体系、有逻辑结构和实用性的“数据知识”。
所以,我们也不能把数据当作一个简单的概念,但其实“数据”里面还有很多学问。
下面先给大家引出四个“数据”相关的名词概念,后面我会分别阐述它们“价值变现”的方法论。
你真的了解data、information、kownledge、insight是什么吗?
data(菜市场买来的菜):简单的事实,未处理的,无组织的,原始的。information(折菜、洗菜):经过结构化组织、处理的数据,要根据“情景和语境”使其具有相关性和实用性。kownledge(下锅炒菜):是通过学习和经验联系在一起的信息地图,具有预测和决策和概括的能力。insight(已经到能教别人做菜的程度):准确而深刻地理解复杂问题或情况的能力(是可以借助工具实现的)。今天,小陈就带大家看看数据的来源及其具体类型,毕竟知己知彼,方能百战不殆,有了今天的铺垫我们才能在后面几期的学习中,能容易上手~
二、数据来源(菜市场)
如果说,data是我们烹饪所需的原材料,那么确定数据来源就好比我们出去买菜之前要先确定去哪家菜市场买菜一样;而且“菜市场”也是术业有专攻的!买海鲜去海鲜市场、买家禽要去禽类市场…数据也是一个道理,要通过你所需的领域,具体筛选数据来源,毕竟保证数据质量是烹饪佳肴的第一步~
就像前面所述,数据是一个庞大的概念,我们想要利用好,首先要知道数据的类型,根据类型再去判断来源和收集数据。
1. 按照结构化程度区分数据来源
1)非结构化数据
非结构化数据,是数据的最简形式;我们身边时时刻刻都有非结构化数据的身影且几乎唾手可得,文字、图片、声音或视频都属于非结构化数据,这类数据通常存储在文件存储库中(小白们,可以把它看作是计算机硬盘驱动器上一个组织良好的目录)。
但,从这种形状的数据中提取价值通常是最困难的;因为我们首先需要从描述或抽象数据中提取结构化特性(例如,要使用文本,我们可能需要提取主题以及文本对主题的正面或负面评价,而一千个读者就会有一千个哈姆雷特,这类信息是极具主观色彩的)。
目前,非常流行的文本挖掘技术,它的数据来源就是我们此处所说的非结构化数据。
2)结构化数据
结构化数据,顾名思义,是定义良好的表格数据(行和列),这意味着我们知道有哪些列以及它们包含什么类型的数据;这些数据通常存储在数据库中,在数据库中,我们可以使用SQL语言进行结构化数据的筛选,并轻松创建数据集用于我们的数据科学解决方案。
歌诗图怎么样(本田歌诗图缺点有哪些)广西医科大学怎么样(广西的大学211有哪些)正泰开关怎么样(一线品牌开关插座有哪些)怎么样去除眼袋(怎样祛除眼袋方法有哪些)芙蓉王多少钱一包(30元左右好抽的烟有哪些)20公分等于多少厘米(20厘米参照物有哪些东西)肉植有哪些(欧泰植)有哪些图片网站(图库有哪些网站)手机的牌子有哪些(新品牌手机有哪些)贫血药有哪些(快速补血的西药)