南开21春《数据科学导论》在线作业-南开大学-无忧答案网

aopeng 发表于 2021-4-17 14:50:23

南开21春《数据科学导论》在线作业

21春学期（1709、1803、1809、1903、1909、2003、2009、2103）《数据科学导论》在线作业
1.[单选题] 单层感知机是由()层神经元组成。
无忧答案网答案资料下载，请参考帮助中心说明
A.一
B.二
C.三
D.四
答:——B——
2.[单选题] K-means聚类适用的数据类型是()。
A.数值型数据
B.字符型数据
C.语音数据
D.所有数据
答:——A——
3.[单选题] 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。
A.最优回归线
B.最优分布线
C.最优预测线
D.最佳分布线
答:——A——
4.[单选题] 例如将工资收入属性值映射到[-1,1]或者内属于数据变换中的()
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化更多答案进 ap5u.com 东师 q1647 861640
答:————
5.[单选题] 在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A.减小，减小
B.减小，增大
C.增大，减小
D.增大，增大
答:————
6.[单选题] 聚类的最简单最基本方法是()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类
答:————
7.[单选题] 设X={1,2,3}是频繁项集,则可由X产生()个关联规则。
A.4
B.5
C.6
D.7
答:————
8.[单选题] 在回归分析中,自变量为(),因变量为()。
A.离散型变量，离散型变量
B.连续型变量，离散型变量
C.离散型变量，连续型变量
D.连续型变量，连续型变量
答:————
9.[单选题] 哪一项不属于规范化的方法()
A.最小-最大规范化
B.零-均值规范化
C.小数定标规范化
D.中位数规范化
答:————
10.[单选题] 单层感知机模型属于()模型。
A.二分类的线性分类模型
B.二分类的非线性分类模型
C.多分类的线性分类模型
D.多分类的非线性分类模型
答:————
11.[单选题] 以下哪个不是处理缺失值的方法()
A.删除记录
B.按照一定原则补充
C.不处理
D.随意填写
答:————
12.[单选题] 我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A.自上而下
B.自下而上
C.自左而右
D.自右而左
答:————
13.[单选题] 下列两个变量之间的关系中,哪个是函数关系()。
A.人的性别和他的身高
B.人的工资与年龄
C.正方形的面积和边长
D.温度与湿度
答:————
14.[单选题] 变量之间的关系一般可以分为确定性关系与()。
A.非确定性关系
B.线性关系
C.函数关系
D.相关关系
答:————
15.[单选题] 单层感知机拥有()层功能神经元。
A.一
B.二
C.三
D.四
答:————
16.[单选题] 通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化
答:————
17.[单选题] 在一元线性回归模型中,残差项服从()分布。
A.泊松
B.正态
C.线性
D.非线性
答:————
18.[单选题] 层次聚类对给定的数据进行()的分解。
A.聚合
B.层次
C.分拆
D.复制
答:————
19.[单选题] 以下哪一项不是特征选择常见的方法()
A.过滤式
B.封装式
C.嵌入式
D.开放式
答:————
20.[单选题] 对于k近邻法,下列说法错误的是()。
A.不具有显式的学习过程
B.适用于多分类任务
C.k值越大，分类效果越好
D.通常采用多数表决的分类决策规则
答:————
21.[多选题] 聚类的主要方法有()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类
答:————
22.[多选题] 数据科学具有哪些性质()
A.有效性
B.可用性
C.未预料
D.可理解
答:————
23.[多选题] 下面例子属于分类的是()
A.检测图像中是否有人脸出现
B.对客户按照贷款风险大小进行分类
C.识别手写的数字
D.估计商场客流量
答:————
24.[多选题] 下列选项是BFR的对象是()
A.废弃集
B.临时集
C.压缩集
D.留存集
答:————
25.[多选题] Apriori算法的计算复杂度受()影响。
A.支持度阈值
B.项数
C.事务数
D.事务平均宽度
答:————
26.[多选题] 相关性的分类,按照相关的方向可以分为()。
A.正相关
B.负相关
C.左相关
D.右相关
答:————
27.[多选题] 系统日志收集的基本特征有()
A.高可用性
B.高可靠性
C.可扩展性
D.高效率
答:————
28.[多选题] 什么情况下结点不用划分()
A.当前结点所包含的样本全属于同一类别
B.当前属性集为空，或是所有样本在所有属性上取值相同
C.当前结点包含的样本集为空
D.还有子集不能被基本正确分类
答:————
29.[多选题] k近邻法的基本要素包括()。
A.距离度量
B.k值的选择
C.样本大小
D.分类决策规则
答:————
30.[多选题] 距离度量中的距离可以是()
A.欧式距离
B.曼哈顿距离
C.Lp距离
D.Minkowski距离
答:————
31.[判断题] K-means算法采用贪心策略,通过迭代优化来近似求解。
A.对
B.错
答:————
32.[判断题] 随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。
A.对
B.错
答:————
33.[判断题] 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。
A.对
B.错
答:————
34.[判断题] 关联规则可以用枚举的方法产生。
A.对
B.错
答:————
35.[判断题] Jaccard系数只关心个体间共同具有的特征是否一致这个问题。
A.对
B.错
答:————
36.[判断题] 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。
A.对
B.错
答:————
37.[判断题] 由不同的距离度量所确定的最近邻点是不同的
A.对
B.错
答:————
38.[判断题] Apriori算法是一种典型的关联规则挖掘算法。
A.对
B.错
答:————
39.[判断题] 决策树的输入为训练集,输出为以node为根结点的一棵决策树
A.对
B.错
答:————
40.[判断题] K均值(K-Means)算法是密度聚类。
A.对
B.错
答:————
41.[判断题] 如果一个候选集至少有一个子集是非频繁的,根据支持度的反单调属性,这样的候选项集肯定是非频繁的。
A.对
B.错
答:————
42.[判断题] 啤酒与尿布的故事是聚类分析的典型实例。
A.对
B.错
答:————
43.[判断题] 对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。
A.对
B.错
答:————
44.[判断题] 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。
A.对
B.错
答:————
45.[判断题] 特征的信息增益越大,则其越不重要。
A.对
B.错
答:————
46.[判断题] 为了尽可能正确分类训练样本,结点划分过程将不断重复,有时会造成决策树分支过少,以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合
A.对
B.错
答:————
47.[判断题] 不满足给定评价度量的关联规则是无趣的。
A.对
B.错
答:————
48.[判断题] 具有双隐层的感知机足以用于解决任何复杂的分类问题。
A.对
B.错
答:————
49.[判断题] 多层感知机的学习能力有限,只能处理线性可分的二分类问题。
A.对
B.错
答:————
50.[判断题] uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同
A.对
B.错
答:————

转载注明无忧答案网随机作业核对题目后下载答案

页: [1]

无忧答案网's Archiver

南开21春《数据科学导论》在线作业