1 绪论 测验

1、 问题:什么是KDD?
选项:
A:数据挖掘与知识发现
B:领域知识发现
C:文档知识发现
D:动态知识发现
答案: 【数据挖掘与知识发现

2、 问题:“8,000”和“10,000”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【数据

3、 问题:人从出生到长大的过程中,是如何认识事物的?
选项:
A:聚类过程
B:分类过程
C:先分类,后聚类
D:先聚类,后分类
答案: 【先聚类,后分类

4、 问题:“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【信息

5、 问题:“飞机无法飞过高山”表示:
选项:
A:数据
B:信息
C:知识
D:智慧
答案: 【知识

2 认识数据 测验

1、 问题:下面哪个不属于数据的属性类型:
选项:
A:标称
B:序数
C:区间
D:相异
答案: 【相异

2、 问题:只有非零值才重要的二元属性被称作:
选项:
A:计数属性
B:离散属性
C:非对称的二元属性
D:对称属性
答案: 【非对称的二元属性

3、 问题:一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:
选项:
A:一年级
B:二年级
C:三年级
D:四年级
答案: 【一年级

4、 问题:杰卡德系数用来度量非对称的二进制属性的相似性
选项:
A:正确
B:错误
答案: 【正确

5、 问题:欧式距离用来度量连续数值属性数据的相似性
选项:
A:正确
B:错误
答案: 【正确

3 数据预处理 测验

1、 问题:所谓高维数据,指的是
选项:
A:数据对象很多
B:数据属性很多
C:以上都正确
D:以上都错误
答案: 【数据属性很多

2、 问题:假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:
选项:
A:0.821
B: 1.224
C: 1.458
D: 0.716
答案: 【 0.716

3、 问题:假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?
选项:
A:第一个
B:第二个
C:第三个
D:第四个
答案: 【第二个

4、 问题:卡方测试用来度量离散标称属性数据的相关性
选项:
A:正确
B:错误
答案: 【正确

5、 问题:相关系数用来度量标称属性数据的相关性
选项:
A:正确
B:错误
答案: 【错误

剩余60%内容付费后可查看