第一章 单元测试

1、 问题:

下面哪句话是正确的( )

选项:
A:机器学习模型的精准度越高,则模型的性能越好
B:增加模型的复杂度,总能减小测试样本误差
C:增加模型的复杂度,总能减小训练样本误差
D:其余选项说法都不对
答案: 【
增加模型的复杂度,总能减小训练样本误差

2、 问题:

评估模型之后,得出模型存在偏差,下列哪种方法可能解决这一问题( )

选项:
A:减少模型中特征的数量
B:向模型中增加更多的特征
C:增加更多的数据
D:向模型中增加更多的特征和增加更多的数据
E:其余选项全是
答案: 【
向模型中增加更多的特征

3、 问题:以垃圾微信识别为例,Tom Mitchell的机器学习的定义中,任务T是什么?( )
选项:
A:T是垃圾微信
B:T是识别
C:T是性能度量
D:T是不必要条件
答案: 【
T是识别

4、 问题:如何在监督式学习中使用聚类算法( )?
选项:
A:首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法
B:在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征
C:在应用监督式学习之前,不能创建聚类
D:在应用监督式学习算法之前,不能将其类别ID作为特征空间中的一个额外的特征
答案: 【
首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法
在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征

5、 问题:想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型( )?
选项:
A:对训练集随机采样,在随机采样的数据上建立模型
B:尝试使用在线机器学习算法
C:使用PCA算法减少特征维度
答案: 【
对训练集随机采样,在随机采样的数据上建立模型
尝试使用在线机器学习算法
使用PCA算法减少特征维度

6、 问题:机器学习兴起于( )。
选项:
A:1960年
B:1970年
C:1980年
D:1990年
答案: 【
1980年
1990年

7、 问题:监督学习包括是( )。
选项:
A:聚类算法
B:回归
C:分类
D:关联算法
答案: 【
回归
分类

8、 问题:机器学习可以对电子商务产品评价进行好评与差评分类。( )
选项:
A:对
B:错
答案: 【

9、 问题:机器学习必备知识包括数学基础、心理学基础、算法设计基础、商业模式基础。( )
选项:
A:对
B:错
答案: 【

第二章 单元测试

1、 问题:

关于k-NN算法,以下哪个选项是正确的?

选项:
A:可用于分类
B:可用于回归
C:可用于分类和回归
答案: 【
可用于分类和回归

2、 问题:

k-NN算法在测试时间而不是训练时间上进行了更多的计算。

选项:
A:对
B:错
答案: 【

3、 问题:

假设算法是k最近邻算法,在下面的图像中,____将是k的最佳值。

选项:
A:3
B:10
C:20
D:50
答案: 【
10

4、 问题:

 一个kNN分类器,该分类器在训练数据上获得100%的准确性。在客户端上部署此模型时,发现该模型根本不准确。以下哪项可能出错了?

注意:模型已成功部署,除了模型性能外,在客户端没有发现任何技术问题

选项:
A:可能是模型过拟合
B:可能是模型未拟合
C:不能判断
D:其余三个选项都不是
答案: 【
可能是模型过拟合

5、 问题:

以下是针对k-NN算法给出的两条陈述,其中哪一条是真的?

1、我们可以借助交叉验证来选择k的最优值

2、欧氏距离对每个特征一视同仁

选项:
A:1
B:2
C:1和2
D:1和2都不是
答案: 【
1和2

6、 问题:

你给出了以下2条语句,发现在k-NN情况下哪个选项是正确的?

1、如果k的值非常大,我们可以将其他类别的点包括到邻域中。

2、如果k的值太小,该算法会对噪声非常敏感

选项:
A:1
B:2
C:1和2
D:1和2都不是
答案: 【
1和2

7、 问题:

在下图中,下列哪一个k值可以给出最低的留一法交叉验证精度?

选项:
A:1
B:2
C:3
D:5
答案: 【
2

8、 问题:

如果一个经过训练的机器学习模型在测试集上达到 100% 的准确率,这是否意味着该模型将在另外一个新的测试集上也能得到 100% 的准确率呢?

选项:
A:是的,因为这个模型泛化能力已经很好了,可以应用于任何数据
B:不行,因为还有一些模型不确定的东西,例如噪声
答案: 【
不行,因为还有一些模型不确定的东西,例如噪声

9、 问题:

关于K折交叉验证,下列说法正确的是?

选项:
A:K值并不是越大越好,K值过大,会降低运算速度;
B:选择更大的K值,会让偏差更小,因为K值越大,训练集越接近整个训练样本
C:选择合适的K值,能减小验方差
D:其余选项都正确

答案: 【
其余选项都正确

第三章 单元测试

1、 问题:下面有关决策树的描述,错误的是( )。
选项:
A:决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法
B:决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别
C:决策树易于理解和实现,人们在在学习过程中不需要使用者了解很多的背景知识,这同时是它的能够直接体现数据的特点,只要通过解释后都有能力去理解决策树所表达的意义
D:对于决策树,数据的准备需要海量的,并且需要能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果
答案: 【
对于决策树,数据的准备需要海量的,并且需要能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表评论

电子邮件地址不会被公开。 必填项已用*标注