|
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转新大榭论坛!
您需要 登录 才可以下载或查看,没有账号?注册
x
第一章:数据与信息
1 U" f# B, `( p! P7 n0 P1 D // 1.5 数据与大数据《思考与练习》 第 - 29 - 页 1. 学生学籍系统中存放着大量的学生数据,这些数据是否属于大数据?为什么?8 K7 Q' y3 z9 u. T5 z0 g' y) s
答: 首先,这属于数据,但这些数据并不是大数据。
, F, P8 P: r' a4 a 大数据一般的定义为:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
, c/ Y% Y, U) n" F$ m/ p, n 那么学籍系统符合上面那些吗?明显不符合,首先这类信息是完全格式化的,一般的常规软件就可以进行处理的,更不要提什么更强的决策力和洞察力了,而且也不是多样化的信息而是程式化的信息,所以一般来说该系统中的数据不是大数据。
& T1 ?" u* y; T5 H* X( U 但是学籍系统不是大数据,不代表学生系统不是大数据,所谓的学生系统不仅包含学籍信息,也包含其他信息,比如成绩信息,获奖信息,健康信息(可能包括但不限于)等等,这些都算上才能称的上是大数据,因为它符合大数据的四个特征,即数据规模大、处理速速快、数据类型多,价值密度低。- F- S4 u& n o; a
; k: }/ g+ s7 _ 2. 在处理数据时,往往会选择“抽样数据”或“全样本数据”进行分析,请比较这两种分析方式的特点,并举例说明。8 U9 \* F9 S2 \3 E: ^" ~
答:
1 H* X/ V3 T9 S$ e3 U" e9 u1. 抽样数据分析方式效率较高,但这种方式取决于抽取样本随机性,在某些情况下,不同样本可能得到截然不同结论。9 B5 s$ _. S0 W# x; D, P" G
2. 对于数据不再最求精确性,而是能够接受数据的混杂性。. M/ P- b4 M8 I. h& `$ _8 W
3. 不强调对事物的因果关系探求,而是更加注重它们之间的关联性。2 M& W$ z! k+ O/ r- f7 @3 L
具体详见P27 { Z* v# ]) q0 g
课程导读 >> 下一课:P030【巩固与提高】第一章 数据与信息(单元测试) → 【传送门】
|
|