大数据解析与应用导论 知到智慧树答案满分完整版章节测试

接疏祥桑答钨槐陛锹烯弧靖冗

 

第一章 单元测试

1、 下列属于多元统计方法的为( )

A:决策树
B:主元分析
C:回归分析
D:神经网络
答案: 主元分析
,回归分析

2、 多元统计分析的图表示法有( )

A:轮廓图
B:雷达图
C:调和曲线图
D:散布图矩阵
答案: 轮廓图
,雷达图
,调和曲线图
,散布图矩阵

3、 完整的数据分析过程,包括数据采集、数据清洗和数据分析。( )

A:对
B:错
答案: 对

4、 下列场景适用于回归分析的是 ( )

A:天气预报
B:水果分拣
C:信息浓缩
D:人脸识别
答案: 天气预报

5、 下面哪一句体现了主元分析的思想( )

A:物以类聚,人以群分
B:笨鸟先飞
C:牵牛要牵牛鼻子
D:人不是一座孤岛
答案: 牵牛要牵牛鼻子

第二章 单元测试

1、 一般常见的缺失值处理的方法有( )

A:替换填充法
B:插值填充
C:回归填充法
D:最近邻插补填充法
答案: 替换填充法
,插值填充
,回归填充法
,最近邻插补填充法

2、 一般常见的数据归一化的方法有( )

A:最小最大规范化
B:回归填充法
C:替换填充法
D:零均值规范化
答案: 最小最大规范化
,零均值规范化

3、 少量的异常值完全不会影响数据分析。( )

A:对
B:错
答案: 错

4、 下列哪种方法不是数据填补的手段 ( )

A:均值标准化
B:插值填充法
C:替换填充法
D:回归填充法
答案: 均值标准化

5、 主成分分析的英文名是( )。

A:Principal Component Analysis
B:Ordinary Least Squares
C:Partial Least Squares
D:Canonical Component Analysis
答案: Principal Component Analysis

第三章 单元测试

1、 下面哪个是SVM在实际生活中的应用( )

A:图片分类
B:邮件分类
C:文本翻译
D:房价预测
答案: 图片分类
,邮件分类

2、 以下说法正确的有哪些( )

A:核方法不能解决非线性问题
B:软间隔的引入可以解决轻度线性不可分问题
C:SVM只能够解决回归问题
D:SVM是一种线性方法
答案: 软间隔的引入可以解决轻度线性不可分问题
,SVM是一种线性方法

3、 拉格朗日乘子法可用于线性可分SVM的模型求解。( )

A:错
B:对
答案: 对

4、 SVM的中文全称叫什么?( )

A:支持向量机
B:最小向量分类器
C:支持向量回归器
D:最大向量分类器
答案: 支持向量机

5、 SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?( )

A:不受数据集的大小影响
B:小数据集
C:中等数据集
D:大数据集
答案: 大数据集

第四章 单元测试

1、 一元线性回归有哪些基本假定?( )

A:随机误差项和解释变量X不相关;
B:随机误差项具有零均值、同方差和序列不相关的性质;
C:随机误差项服从零均值、同方差的正态分布。
D:解释变量X是确定性变量,Y是随机变量;
答案: 随机误差项和解释变量X不相关;
,随机误差项具有零均值、同方差和序列不相关的性质;
,随机误差项服从零均值、同方差的正态分布。
,解释变量X是确定性变量,Y是随机变量;

2、 最典型的两种拟合不佳的情况是( )。

A:强拟合
B:欠拟合
C:弱拟合
D:过拟合
答案: 欠拟合
,过拟合

3、 岭回归适用于样本很少,但变量很多的回归问题。( )

A:错
B:对
答案: 对

4、 最小二乘方法的拟合程度衡量指标是( )。

A:残差和
B:均值差
C:残差平方和
D:拟合残差
答案: 残差平方和

5、 关于最小二乘法,下列说法正确的是。( )

A:最小二乘法要求样本点到拟合直线的竖直距离的平方和最小
B:最小二乘法要求样本点到拟合直线的垂直距离的和最小
C:最小二乘法要求样本点到拟合直线的垂直距离的平方和最小
D:最小二乘法要求样本点到拟合直线的竖直距离的和最小
答案: 最小二乘法要求样本点到拟合直线的竖直距离的平方和最小

第五章 单元测试

1、 在区分某个算法是否是聚类算法时,往往可以通过该算法是否需要预先设定明确的类中心来判断( )。

A:对
B:错
答案: 对

2、 闵可夫斯基距离是一组距离的定义,下列距离中属于闵可夫斯基距离的有( )

A:欧式距离
B:曼哈顿距离
C:马氏距离
D:切比雪夫距离
答案: 欧式距离
,曼哈顿距离
,切比雪夫距离

3、 在利用EM算法估计高斯混合模型参数的时候,需要预先设定的参数有( )。

A:高斯元的方差
B:类别个数
C:高斯元的均值
D:高斯元的权重系数
答案: 高斯元的方差
,类别个数
,高斯元的均值
,高斯元的权重系数

4、 聚类算法是一种( )的学习方式。

A:无监督
B:有监督
C:自上而下
D:Q型
答案: 无监督

5、 理想情况下,K均值算法中确定类别个数的最佳方式为( )。

A:无需提前确定,可以在训练中得到
B:随机确定
C:结合先验知识确定
D:根据比较不同类别个数时的聚类效果来确定
答案: 结合先验知识确定



上方为免费预览版答案,如需购买完整答案,请点击下方红字

点击这里,购买完整版答案


 

点关注,不迷路,微信扫一扫下方二维码

关注我们的公众号:阿布查查  随时查看答案,网课轻松过

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第1张


为了方便下次阅读,建议在浏览器添加书签收藏本网页

电脑浏览器添加/查看书签方法

1.按键盘的ctrl键+D键,收藏本页面

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第2张

2.下次如何查看收藏的网页?

点击浏览器右上角-【工具】或者【收藏夹】查看收藏的网页

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第3张


手机浏览器添加/查看书签方法

一、百度APP添加/查看书签方法

1.点击底部五角星收藏本网页

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第4张

2.下次如何查看收藏的网页?

点击右上角【┇】-再点击【收藏中心】查看

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第5张

二、其他手机浏览器添加/查看书签方法

1.点击【设置】-【添加书签】收藏本网页

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第6张

2.下次如何查看收藏的网页?

点击【设置】-【书签/历史】查看收藏的网页

大数据解析与应用导论 知到智慧树答案满分完整版章节测试第7张

锤馅反辰哺先闹搽肥慌辈冷却