浙江广播电视大学21秋《大数据技术(省)》任务2题目
《大数据技术(省)》任务21.[单选题] 奈奎斯特采样定理指出采样频率应该大于信号中最高频率的( )倍时,采样之后的数字信号才能够完整地保留原始信号中的信息。
A.2
B.4
C.6
D.3
答:——A——
2.[单选题] 下列哪项不属于常用的大数据抽取方法( )
A.全量数据抽取
B.增量数据抽取
C.批量数据抽取
D.文件型数据抽取
答:——C——
3.[单选题] 大数据环境下的隐私担忧,主要表现为( )
A.个人信息的被识别与暴露
B.用户画像的生成
C.恶意广告的推送
D.病毒入侵
答:——A——
4.[单选题] NoSQL数据库中最常用的存储方式是( )。
A.键值存储方式
B.按地址存储方式
C.文档存储方式
D.列存储方式
答:————
5.[单选题] 大数据的5个“V”特性是数据量、多样性、( )、速度、真实性。
A.稀疏性
B.关联性
C.实用性
D.价值
答:————
6.[单选题] 以下组件中不属于HADoop生态系统的组件:( )
A.MApREDuCE
B.HDFS
C.OrAClE
D.HBAsE
答:————
7.[单选题] 下列演示方式中,不属于传统统计图方式的是( )
A.柱状图
B.饼状图
C.曲线图
D.网络图
答:————
8.[单选题] 回归分析主要用于哪种情境( )
A.商品的库存数量预测分析
B.调查问卷的效度检验报告
C.不同班级在英语得分上是否存在差异
D.根据用户特征进行市场细分。
答:————
9.[单选题] CyBEr空间是指以计算机技术、现代通信网络技术、( )等信息技术的综合运用为基础,以知识和信息为内容的新型空间。
A.电子技术
B.虚拟现实技术
C.软件技术
D.人工智能
答:————
10.[单选题] 数据清洗的方法不包括( )。
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
答:————
11.[判断题] 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库.因此分布式数据库具有物理上的独立性.逻辑上的一体性.性能上的可扩展性等特点。
A.√
B.×
答:————
12.[判断题] 分类就是自动将数据象分成多个类或簇,划分的原则是在同一个簇中的数据象具有较高的相似度,而不同簇中的数据象相似度差别较大。
A.√
B.×
答:————
13.[判断题] 大数据技术和云计算技术是两门完全不相关的技术。
A.√
B.×
答:————
14.[判断题] HADoop和sTorm都属于大数据处理工具,两者具备数据实时分析功能。
A.√
B.×
答:————
15.[判断题] 当两条不同的线出现了交叉点时,相交的问题就产生了。我们需要注重非交叉点信息的可视化展现。
A.√
B.×
答:————
16.[判断题] 余弦值越接近0,就表明夹角越接近0°,也就是两个向量越相似,当夹角等于0°时,即两个向量相等,称为余弦相似性。
A.√
B.×
答:————
17.[判断题] 离线数据分析是指将待分析的数据先存储于硬盘中,然后进行数据分析,离线数据分析用于较复杂和耗时的数据分析和批处理。
A.√
B.×
答:————
18.[判断题] 传统数据获取与大数据获取的唯一区别是前者数据量小,后者数据量大。
A.√
B.×
答:————
19.[判断题] 大数据仅仅是指数据的体量大。
A.√
B.×
答:————
20.[判断题] 分箱平滑法是一种数据局部平滑方法,它是通过考察所有的数据来平滑存储数据。
A.√
B.×
答:————
21.[多选题] 基于约简维数的大小分类,维数约简可以分为( )、( )和( )。
A.硬维数约简
B.可视化
C.统计维数约简
D.软维数约简
答:————
22.[多选题] 网站内部数据主要有( )和( )。
A.日志数据
B.寄存器数据
C.数据库数据
D.内存数据
答:————
23.[多选题] 下列哪些属于流式数据源( )。
A.传感器数据
B.卫星图像数据
C.互联网及WEB流量
D.保存于硬盘中的各类文档
答:————
24.[多选题] 大数据的主要特征表现为( )。
A.数据类型多
B.处理速度快
C.数据容量大
D.商业价值高
答:————
25.[多选题] 由大及小的数据展现方式是先给出一个( )的画面,可以引导读者具体深入到一个( )的点。
A.一般
B.整体
C.聚焦
D.局部
答:————
26.[多选题] 天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作
不应该进行:( )
A.对变量进行标准化
B.对变量进行百分位秩或 TukEy正态性转换
C.对变量进行因子分析或变量聚类
D.对变量进行分箱处理
答:————
页:
[1]