《大数据导论》在线作业南开大学19秋
19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业1.[单选题] 大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确答案:——A——
2.[单选题] 用于描述数据分散情况的是()
A.分布图
B.箱式图
C.饼图
D.折线图
正确答案:——B——
3.[单选题] 下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
正确答案:——A——
4.[单选题] 数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
正确答案:————
5.[单选题] 数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:————
6.[单选题] 下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:————
7.[单选题] IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:————
8.[单选题] 数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
正确答案:————
9.[单选题] GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
正确答案:————
10.[单选题] 以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
正确答案:————
11.[单选题] 以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
正确答案:————
12.[单选题] 第一个提出大数据概念的公司是()。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
正确答案:————
13.[单选题] 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:————
14.[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
正确答案:————
15.[单选题] DAS代表的意思是()
A.两个异步存储
B.数据归档软件
C.连接一个可选的存储
D.直连存储
正确答案:————
16.[多选题] 大数据采集主要包括()四种。
A.系统日志采集
B.网络数据采集
C.数据库采集
D.其他数据采集
正确答案:————
17.[多选题] 基于大数据的临床决策支持系统的架构包括
A.支撑层
B.大数据分析层
C.网络层
D.应用层
正确答案:————
18.[多选题] 可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
正确答案:————
19.[多选题] 大数据存储的特点与挑战有()
A.容量问题
B.延迟问题
C.安全问题
D.成本问题
正确答案:————
20.[多选题] 传感器工作模式类别包括()
A.基于位置
B.基于活动
C.基于设备
正确答案:————
21.[多选题] 数据归约(Data Reduction)主要有有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
正确答案:————
22.[多选题] 常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
正确答案:————
23.[多选题] 关于R语言扩展包下列正确的是()
A.network可创建带有点和边的网络图
B.animation可制作一系列的图像并将它们串联起来做成动画
C.ggmaps通过树图来可视化层次型数据
D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案:————
24.[多选题] 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A.用户行为数据
B.日志式的活动数据
C.事件信息
正确答案:————
25.[多选题] 数据预处理的过程主要是
A.数据清洗
B.数据集成
C.数据变换
D.数据规约
正确答案:————
26.[多选题] 大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
正确答案:————
27.[多选题] 常见的分类方法有
A.决策树
B.贝叶斯网络
C.遗传算法
D.FP算法
正确答案:————
28.[多选题] 数据归约(Data Reduction)主要有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
正确答案:————
29.[多选题] 大数据在教育中的应用
A.网上公开课
B.慕课
C.智慧校园
D.翻转课堂
正确答案:————
30.[多选题] 云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.流计算
B.分布式计算
C.并行计算
D.网络计算
正确答案:————
31.[判断题] 《科学》(Science)杂志专刊——Dealing with data,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类面临的“数据困境”。
A.对
B.错
正确答案:————
32.[判断题] NewSQL是对各种可扩展/高性能数据库的简称,这类数据库在保持了传统数据库支持ACID和SQL等能力的同时,还具有NoSQL对海量数据的存储管理能力。
A.对
B.错
正确答案:————
33.[判断题] PaaS是平台即服务的简称
A.对
B.错
正确答案:————
34.[判断题] 用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
A.对
B.错
正确答案:————
35.[判断题] FP算法比Apriori算法慢
A.对
B.错
正确答案:————
36.[判断题] 当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。
A.对
B.错
正确答案:————
37.[判断题] 广义的Spark是指Spark生态系统,采用了四层架构。
A.对
B.错
正确答案:————
38.[判断题] 内存分析数据量比海量分析数据量大
A.对
B.错
正确答案:————
39.[判断题] 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A.对
B.错
正确答案:————
40.[判断题] 数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
A.对
B.错
正确答案:————
41.[判断题] 利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A.对
B.错
正确答案:————
42.[判断题] 事件是Flume的基本数据单位
A.对
B.错
正确答案:————
43.[判断题] 大数据可视化便于人们对数据的理解
A.对
B.错
正确答案:————
44.[判断题] 用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
A.对
B.错
正确答案:————
45.[判断题] 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A.对
B.错
正确答案:————
46.[判断题] 数据挖掘主要是为了发现隐藏在数据中的有用信息和规律
A.对
B.错
正确答案:————
47.[判断题] 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”
A.对
B.错
正确答案:————
48.[判断题] 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
A.对
B.错
正确答案:————
49.[判断题] 大数据数据量一定是PB,TB级的
A.对
B.错
正确答案:————
50.[判断题] 美国《自然》(Nature)杂志专刊——The next google,第一次正式提出“大数据”概念。
A.对
B.错
正确答案:————
页:
[1]