大数据解析与应用导论知到智慧树答案满分完整版章节测试

第一章单元测试

1、下列属于多元统计方法的为（）

A:决策树
B:主元分析
C:回归分析
D:神经网络
答案: 主元分析
,回归分析

2、多元统计分析的图表示法有（）

A:轮廓图
B:雷达图
C:调和曲线图
D:散布图矩阵
答案: 轮廓图
,雷达图
,调和曲线图
,散布图矩阵

3、完整的数据分析过程，包括数据采集、数据清洗和数据分析。（）

A:对
B:错
答案: 对

4、下列场景适用于回归分析的是 ( )

A:天气预报
B:水果分拣
C:信息浓缩
D:人脸识别
答案: 天气预报

5、下面哪一句体现了主元分析的思想（）

A:物以类聚，人以群分
B:笨鸟先飞
C:牵牛要牵牛鼻子
D:人不是一座孤岛
答案: 牵牛要牵牛鼻子

第二章单元测试

1、一般常见的缺失值处理的方法有（）

A:替换填充法
B:插值填充
C:回归填充法
D:最近邻插补填充法
答案: 替换填充法
,插值填充
,回归填充法
,最近邻插补填充法

2、一般常见的数据归一化的方法有（）

A:最小最大规范化
B:回归填充法
C:替换填充法
D:零均值规范化
答案: 最小最大规范化
,零均值规范化

3、少量的异常值完全不会影响数据分析。（）

A:对
B:错
答案: 错

4、下列哪种方法不是数据填补的手段 ( )

A:均值标准化
B:插值填充法
C:替换填充法
D:回归填充法
答案: 均值标准化

5、主成分分析的英文名是（）。

A:Principal Component Analysis
B:Ordinary Least Squares
C:Partial Least Squares
D:Canonical Component Analysis
答案: Principal Component Analysis

第三章单元测试

1、下面哪个是SVM在实际生活中的应用（）

A:图片分类
B:邮件分类
C:文本翻译
D:房价预测
答案: 图片分类
,邮件分类

2、以下说法正确的有哪些（）

A:核方法不能解决非线性问题
B:软间隔的引入可以解决轻度线性不可分问题
C:SVM只能够解决回归问题
D:SVM是一种线性方法
答案: 软间隔的引入可以解决轻度线性不可分问题
,SVM是一种线性方法

3、拉格朗日乘子法可用于线性可分SVM的模型求解。（）

A:错
B:对
答案: 对

4、 SVM的中文全称叫什么？（）

A:支持向量机
B:最小向量分类器
C:支持向量回归器
D:最大向量分类器
答案: 支持向量机

5、 SVM算法的最小时间复杂度是O（n²），基于此，以下哪种规格的数据集并不适该算法？（）

A:不受数据集的大小影响
B:小数据集
C:中等数据集
D:大数据集
答案: 大数据集

第四章单元测试

1、一元线性回归有哪些基本假定？（）

A:随机误差项和解释变量X不相关；
B:随机误差项具有零均值、同方差和序列不相关的性质；
C:随机误差项服从零均值、同方差的正态分布。
D:解释变量X是确定性变量，Y是随机变量；
答案: 随机误差项和解释变量X不相关；
,随机误差项具有零均值、同方差和序列不相关的性质；
,随机误差项服从零均值、同方差的正态分布。
,解释变量X是确定性变量，Y是随机变量；

2、最典型的两种拟合不佳的情况是（）。

A:强拟合
B:欠拟合
C:弱拟合
D:过拟合
答案: 欠拟合
,过拟合

3、岭回归适用于样本很少，但变量很多的回归问题。（）

A:错
B:对
答案: 对

4、最小二乘方法的拟合程度衡量指标是（）。

A:残差和
B:均值差
C:残差平方和
D:拟合残差
答案: 残差平方和

5、关于最小二乘法，下列说法正确的是。（）

A:最小二乘法要求样本点到拟合直线的竖直距离的平方和最小
B:最小二乘法要求样本点到拟合直线的垂直距离的和最小
C:最小二乘法要求样本点到拟合直线的垂直距离的平方和最小
D:最小二乘法要求样本点到拟合直线的竖直距离的和最小
答案: 最小二乘法要求样本点到拟合直线的竖直距离的平方和最小

第五章单元测试

1、在区分某个算法是否是聚类算法时，往往可以通过该算法是否需要预先设定明确的类中心来判断（）。

A:对
B:错
答案: 对

2、闵可夫斯基距离是一组距离的定义，下列距离中属于闵可夫斯基距离的有（）

A:欧式距离
B:曼哈顿距离
C:马氏距离
D:切比雪夫距离
答案: 欧式距离
,曼哈顿距离
,切比雪夫距离

3、在利用EM算法估计高斯混合模型参数的时候，需要预先设定的参数有（）。

A:高斯元的方差
B:类别个数
C:高斯元的均值
D:高斯元的权重系数
答案: 高斯元的方差
,类别个数
,高斯元的均值
,高斯元的权重系数

4、聚类算法是一种（）的学习方式。

A:无监督
B:有监督
C:自上而下
D:Q型
答案: 无监督

5、理想情况下，K均值算法中确定类别个数的最佳方式为（）。

A:无需提前确定，可以在训练中得到
B:随机确定
C:结合先验知识确定
D:根据比较不同类别个数时的聚类效果来确定
答案: 结合先验知识确定

上方为免费预览版答案，如需购买完整答案，请点击下方红字

点击这里,购买完整版答案

点关注，不迷路，微信扫一扫下方二维码

关注我们的公众号：阿布查查 随时查看答案，网课轻松过

为了方便下次阅读，建议在浏览器添加书签收藏本网页

电脑浏览器添加/查看书签方法

1.按键盘的ctrl键+D键，收藏本页面

2.下次如何查看收藏的网页？

点击浏览器右上角-【工具】或者【收藏夹】查看收藏的网页

手机浏览器添加/查看书签方法

一、百度APP添加/查看书签方法

1.点击底部五角星收藏本网页

2.下次如何查看收藏的网页？

点击右上角【┇】-再点击【收藏中心】查看

二、其他手机浏览器添加/查看书签方法

1.点击【设置】-【添加书签】收藏本网页

2.下次如何查看收藏的网页？

点击【设置】-【书签/历史】查看收藏的网页

锤馅反辰哺先闹搽肥慌辈冷却

第一章 单元测试

第二章 单元测试

第三章 单元测试

第四章 单元测试

第五章 单元测试

第一章单元测试

第二章单元测试

第三章单元测试

第四章单元测试

第五章单元测试