南开19秋《大数据导论》在线作业答案
1.[单选题]以下不是数据仓库基本特征的是()A.数据仓库是面向主题的 B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的 D.数据仓库的数据是反映历史变化的
正确答案:——B——
2.[单选题]数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容 B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容 D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:——C——
3.[单选题]()是Microsoft Office的核心组件
A.SQL B.WORD
C.PPT D.EXCEL
正确答案:——D——
4.[单选题]数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A.运营式系统阶段 B.用户原创内容阶段
C.感知式系统阶段 正确答案:————
5.[单选题]下列不属于商业大数据类型的是
A.传统企业数据 B.机器和传感器数据
C.社交数据 D.电子商务数据
正确答案:————
6.[单选题]PaaS是()的简称
A.软件即服务 B.平台即服务
C.基础设施即服务 D.硬件即服务
正确答案:————
7.[单选题]第一个提出大数据概念的公司是()。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
正确答案:————
8.[单选题]哪个选项不属于大数据4V特点?
A.Volume
B.Valid
C.Variety
D.Value
正确答案:————
9.[单选题]购物篮问题是##的典型案例
A.数据变换
B.关联规则挖掘
C.数据分类
正确答案:————
10.[单选题]IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:————
11.[单选题]SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
正确答案:————
12.[单选题]下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:————
13.[单选题]下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
正确答案:————
14.[单选题]以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
正确答案:————
15.[单选题]GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
正确答案:————
16.[多选题]大数据在教育中的应用
A.网上公开课
B.慕课
C.智慧校园
D.翻转课堂
正确答案:————
17.[多选题]关于R语言扩展包下列正确的是()
A.network可创建带有点和边的网络图
B.animation可制作一系列的图像并将它们串联起来做成动画
C.ggmaps通过树图来可视化层次型数据
D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案:————
18.[多选题]数据变换(Data Transformation)的方法有()
A.光滑
B.聚集
C.数据泛化
D.规范化
正确答案:————
19.[多选题]大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
正确答案:————
20.[多选题]一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A.一个名字节点
B.若干个名字节点
C.一个数据节点
D.若干个数据节点
正确答案:————
21.[多选题]云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.流计算
B.分布式计算
C.并行计算
D.网络计算
正确答案:————
22.[多选题]数据分析的类型根据数据分析深度可以分为()
A.描述性分析
B.预测性分析s
C.规则性分析
正确答案:————
23.[多选题]常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
正确答案:————
24.[多选题]交通数据处理包括以下几个步骤()
A.数据清洗
B.数据映射
C.数据组织
D.数据聚类
正确答案:————
25.[多选题]大数据智能感知层:主要包括()及软硬件资源接入系统
A.数据传感体系
B.网络通信体系
C.传感适配体系
D.智能识别体系
正确答案:————
26.[多选题]数据工厂包括
A.低能耗数据中心
B.超大规模讲分布式架构
C.新一代智能自动化运维
D.超强云安全
正确答案:————
27.[多选题]交通数据分析可用于:
A.交通流量实时分析
B.合理进行道路规划
C.信号灯智能调度
D.实时路况查询播报
正确答案:————
28.[多选题]下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
正确答案:————
29.[多选题]可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
正确答案:————
30.[多选题]大数据时代预测人类移动行为的数据来源有
A.志愿者定位数据
B.装有导航设备的出租车轨迹数据
C.手机终端定位于通讯记录
D.社会网络签到数据
正确答案:————
31.[判断题]高质量的数据是能够满足应用需求的数据。
A.对
B.错
正确答案:————
32.[判断题]结构化数据是用excel结构表现的数据
A.对
B.错
正确答案:————
33.[判断题]多维数据指的是具有多个维度属性的数据变量。
A.对
B.错
正确答案:————
34.[判断题]空间视图提供了交通堵塞的概览
A.对
B.错
正确答案:————
35.[判断题]数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约
A.对
B.错
正确答案:————
36.[判断题]每个变量的最大值和最小值之差称为极差
A.对
B.错
正确答案:————
37.[判断题]非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值
A.对
B.错
正确答案:————
38.[判断题]大数据可视化便于人们对数据的理解
A.对
B.错
正确答案:————
39.[判断题]数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
A.对
B.错
正确答案:————
40.[判断题]频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。
A.对
B.错
正确答案:————
41.[判断题]BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
A.对
B.错
正确答案:————
42.[判断题]PaaS是平台即服务的简称
A.对
B.错
正确答案:————
43.[判断题]原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。
A.对
B.错
正确答案:————
44.[判断题]基于存储网络虚拟化是在存储区域网中增加虚拟化引擎实现存储资源的集中管理,其具体实施一般是通过具有虚拟化支持能力的路由器或交换机实现的。
A.对
B.错
正确答案:————
45.[判断题]社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。
A.对
B.错
正确答案:————
46.[判断题]NAS代表的意思是网络附加存储
A.对
B.错
正确答案:————
47.[判断题]分布图用于表示数据之间分布规律,以及一个变量与另一个变量之间如何相互关联。
A.对
B.错
正确答案:————
48.[判断题]数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量
A.对
B.错
正确答案:————
49.[判断题]R语言是S语言的实现,是一种B编译语言
A.对
B.错
正确答案:————
50.[判断题]发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
A.对
B.错
正确答案:————
核对题目下载答案
页:
[1]