北语22年5月22春《大数据技术与应用》作业3题目及答案
22春《大数据技术与应用》作业31.[单选题] 项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
答案资料下载请参考帮助中心说明
A.1项集
B.2项集
C.3项集
D.4项集
答:——D——
2.[多选题] 关联规则反映的是 东北大学答案无忧答案网整理
A.可分类性
B.可分割性
C.事物之间相互依存性
D.事物之间相互关联性
答:——CD——
3.[判断题] 数据挖掘的过程都是有统一一致的步骤的
A.对
B.错
答:——B——
4.[多选题] 决策树的关键点包括
A.采用Bagging框架
B.采用随机特征选择生成每个决策树的训练数据特征子集
C.采用采样数据集的特征子集训练对应决策树
D.以上都不对
答:————
5.[单选题] 数据集{1,2,3,5,7,9}的中位数是
A.3
B.5
C.7
D.4
答:————
6.[单选题] 决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A.ID3
B.C4.5
C.CART
D.以上都不对
答:————
7.[多选题] 大数据收集的途径包括()
A.互联网
B.移动互联网
C.物联网传感器
D.手动
答:————
8.[判断题] 下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
A.对
B.错
答:————
9.[单选题] 数据集{1,2,2,2,3,4}的众数是
A.1
B.2
C.3
D.4
答:————
10.[单选题] 如果一个项集包含K个项,则该项集称为
A.项
B.空集
C.超项集
D.K项集
答:————
11.[单选题] 从软件库中导入LOF异常检测算法类的语句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
答:————
12.[单选题] 从软件库中导入模糊C均值聚类算法类的语句是
A.from fcmeans import FCM
B.fcm=FCM(n_clusters=3)
C.fcm.fit(X)
D.fcm_labels=fcm.u.argmax(axis=1)
答:————
13.[多选题] 可用于实现数据one-hot编码的方法包括
A.Pandas的head
B.Pandas的get_dummies
C.sklearn.preprocessing.OneHotEncoder方法
D.Pandas的tail
答:————
14.[单选题] 利用pandas处理数据缺失值时,用于丢弃重复值的函数为
A.drop_duplicates
B.duplicated
C.fillna
D.dropna
答:————
15.[单选题] 数据等级排序T的是
A.定距等级>定比等级>定类等级>定序等级
B.定比等级>定序等级>定距等级>定类等级
C.定比等级>定距等级>定序等级>定类等级
D.定比等级>定类等级>定序等级>定距等级
答:————
16.[多选题] 聚类分析可以用于
A.顾客分组
B.分类
C.回归
D.找出显著影响
答:————
17.[判断题] 定类数据层次比定序数据高
A.对
B.错
答:————
西南大学答案无忧答案网发布
页:
[1]