本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-02-22到2020-06-20
本篇答案更新状态:已完结

【第1周】初识大数据 【第一周】单元测试

1、 问题:大数据的特性不包括
选项:
A:应用领域广
B:容量大
C:速度快
D:价值密度低
答案: 【应用领域广

2、 问题:如下关于大数据分析流程的哪一项是正确的?
选项:
A:数据采集、数据清洗、数据管理、数据分析、数据呈现
B:数据采集、数据分析、数据清洗、数据管理、数据呈现
C:数据采集、数据呈现、数据分析、数据清洗、数据管理
D:数据清洗、数据采集、数据呈现、数据分析、数据管理
答案: 【数据采集、数据清洗、数据管理、数据分析、数据呈现

3、 问题:大数据分析与传统的数据分析的区别主要在于:
选项:
A:传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。
B:大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。
C:大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。
D:大数据分析需要借助各种分析工具完成,而传统数据分析不需要使用其他工具。
答案: 【传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。;
大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。;
大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。

4、 问题:1、大数据目前并无统一的定义,主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。
选项:
A:正确
B:错误
答案: 【正确

5、 问题:数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统
选项:
A:正确
B:错误
答案: 【错误

6、 问题:大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。
选项:
A:正确
B:错误
答案: 【正确

7、 问题:大数据分析能够应用在哪些领域?
答案: 【交通 医疗 足球 零售 天文 政治

【第6周】数据分析方法 【第6周】单元测试

1、 问题:如下关于数据分析框架的流程,哪一项是正确的?
选项:
A:业务理解、数据理解、数据准备、建立模型、模型评估
B:建立模型、模型评估、数据理解、业务理解、数据准备
C:数据理解、业务理解、建立模型、数据准备、模型评估
D:数据准备、建立模型、模型评估、数据理解、业务理解
答案: 【业务理解、数据理解、数据准备、建立模型、模型评估

2、 问题:偏度是数据分布扁平程度的测度。
选项:
A:正确
B:错误
答案: 【错误

3、 问题:中位数指的是任意一组数据中的中间位置的数。
选项:
A:正确
B:错误
答案: 【错误

4、 问题:某组数据的峰态系数小于0,则并表明该组数据为扁平分布或者平峰分布。
选项:
A:正确
B:错误
答案: 【正确

5、 问题:预测降雨量属于机器学习中的回归任务的应用场景。
选项:
A:正确
B:错误
答案: 【正确

6、 问题:已知10个家庭的人均月收入数据分别为:660、750、780、850、960、1080、1250、1500、1630、2000,请计算该组数据的中位数。
答案: 【1020

7、 问题:已知9个家庭的人均月收入数据分别为:1500、750、780、1080、850、960、2000、1250、1630,请计算该组数据的四分位数。(请使用较准确的位置确定方法。)
答案: 【815 1565

8、 问题:请计算下列数据{10,12,13,14,25,30,40,50,90,100}的p=40%的截断均值。(保留2位小数)
答案: 【28.67

9、 问题:请计算下列数据{1,3,7,9,0,3,5}的中列数。
答案: 【4.5

10、 问题:依据下面两组数据,分别计算两组年收入数据的方差。第一组:99个年收入10万的人和1个年收入1000万的人,第二组:60个年收入10万的人和40个年收入34.75万的人。
答案: 【9801 148.5

【第7周】数据分析方法 【第七周】 单元测试

1、 问题:“二手车价格预测”场景属于哪种机器学习的典型任务?
选项:
A:回归
B:分类
C:关联
D:聚类
答案: 【回归

2、 问题:“垃圾邮件的处理”场景属于哪种机器学习的典型任务?
选项:
A:分类 
B:关联
C:聚类
D:回归
答案: 【分类 

3、 问题:“推荐系统”场景属于哪种机器学习的典型任务?
选项:
A:聚类
B:分类
C:关联
D:回归
答案: 【聚类

4、 问题:“尿布与啤酒”案例属于哪种机器学习的典型任务?
选项:
A:关联    
B:分类
C:聚类
D:回归
答案: 【关联    

5、 问题:过拟合是指模型不能在训练集上获得足够低的误差
选项:
A:正确
B:错误
答案: 【错误

6、 问题:有监督算法和无监督算法的区别在于数据是否进行标注。
选项:
A:正确
B:错误
答案: 【正确

7、 问题:K-means算法属于分类算法。
选项:
A:正确
B:错误
答案: 【错误

8、 问题:KNN算法的优点在于不需要指定K的个数。
选项:
A:正确
B:错误
答案: 【错误

9、 问题:决策树的生成由两个阶段组成:_____
答案: 【判定树构建 树剪枝

10、 问题:假设有四个样本分布在坐标系中,已知A区两点分别(2,5)和(1,4),B区(8,1)和(9,2),若使用KNN算法(距离使用欧氏距离),求M(4,3)属于哪一区?
答案: 【A

【第8周】开源平台和工具 【第八周】 单元测试

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表评论

电子邮件地址不会被公开。 必填项已用*标注