南开《大数据开发技术(一)》19秋期末考核
《大数据开发技术(一)》19秋期末考核1.[单选题] UMP系通过()来实现实现数据路由的基本功能
A.Controller服务器
B.Procy服务器
C.愚公系统
D.Agent服务器
正确答案:——B——
2.[单选题] Amazon Redshift属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
正确答案:——D——
3.[单选题] 应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
正确答案:——B——
4.[单选题] HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Master
B.Region
C.Zookeeper
D.Chubby
正确答案:————
5.[单选题] UMP系统中面对中等规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
正确答案:————
6.[单选题] 以下亚马逊的产品中哪个是数据仓库
A.ElastiCache
B.RDS
C.DynamoDB
D.Redshift
正确答案:————
7.[单选题] UMP系统中面对多个小规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
正确答案:————
8.[单选题] 关于Strom中Bolt说法错误的是()。
A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B.Bolt是一个被动的角色,Spout是一个主动的角色
C.Bolt不仅可以处理Tuple还可以创建新的Tuple
D.Bolt是Streams的状态转换过程的抽象含义
正确答案:————
9.[单选题] 优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
正确答案:————
10.[单选题] 应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
正确答案:————
11.[单选题] Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A.Master
B.Slaver
C.Region
D.客户端
正确答案:————
12.[单选题] 以下亚马逊的产品中哪个是分布式内存缓存
A.ElastiCache
B.RDS
C.DynamoDB
D.Redshift
正确答案:————
13.[单选题] Hbase采用()作为底层数据存储
A.HDFS
B.GFS
C.Hbase
D.传统文件系统
正确答案:————
14.[单选题] 关于Hadoop集群,以下说法错误的是()。
A.SecondaryNameNode可以和NameNode共用一台机器
B.JobTracker指派的任务由TaskTracker执行
C.SecondaryNameNode可以和DataNode共用一台机器
D.NameNode可以和JobTracker共用一台机器
正确答案:————
15.[单选题] Map Task和Reduce Task均由()启动。
A.Client
B.Job Tracker
C.Task
D.Task Tracker
正确答案:————
16.[多选题] HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A.FsImage
B.DataNode
C.Block
D.EditLog
正确答案:————
17.[多选题] 以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A.Giraph
B.Pregel
C.Hama
D.DEX
正确答案:————
18.[多选题] 以下哪种数据库属于NoSQL数据库()
A.MySQL
B.DynamoDB
C.InfiniteGraph
D.MongoDB
正确答案:————
19.[多选题] 关系数据库与NoSQL数据库相比适用于哪些领域()
A.电信
B.银行
C.互联网企业大数据处理
D.传统企业的数据分析
正确答案:————
20.[多选题] 以下哪种数据库是针对在线业务的,并且抛弃了关系模型()
A.MongoDB
B.MySQL
C.Oracle
D.Redis
正确答案:————
21.[多选题] 分布式文件系统的设计目的包括()。
A.并发控制
B.可伸缩性
C.容错
D.速度
正确答案:————
22.[多选题] MapReduce的main函数中设置输出类型的方法有()。
A.setOutputKeyClass
B.setOutputClass
C.setOutputValueClass
D.setKeyValueClass
正确答案:————
23.[多选题] 以下哪些是云计算关键技术()。
A.虚拟化
B.分布式计算
C.分布式存储
D.物联网
E.单租户
正确答案:————
24.[多选题] Pregel作为分布式图计算的计算框架,主要用于()
A.图遍历
B.最短路径
C.PageRank计算
D.MapReduce
正确答案:————
25.[多选题] 以下哪个应用适合用Pregel来解决()
A.数据库的笛卡尔积
B.单元最短路径
C.二分匹配
D.求极值
正确答案:————
26.[判断题] 分布式离线分析可以实现秒级别的实时分析响应。
A.对
B.错
正确答案:————
27.[判断题] Hadoop平台在大数据发展的成熟期时开始大行其道
A.对
B.错
正确答案:————
28.[判断题] Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A.对
B.错
正确答案:————
29.[判断题] 在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
A.对
B.错
正确答案:————
30.[判断题] HBase中包含一个Region服务器和许多个Master服务器
A.对
B.错
正确答案:————
31.[判断题] HDFS读数据过程中读取请求获得的输入流是FSInputStream
A.对
B.错
正确答案:————
32.[判断题] Linux系统中只有Ubuntu可以安装Hadoop。
A.对
B.错
正确答案:————
33.[判断题] MapReduce处理分组聚合操作时,在Map过程中,选择关系的某一宇段的值作为键,其他字段的值作为与键相关联的值;Reduce过程,输出为<键,聚合运算结果〉。
A.对
B.错
正确答案:————
34.[判断题] Hbase和传统数据库一样都是列式数据库
A.对
B.错
正确答案:————
35.[判断题] 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
A.对
B.错
正确答案:————
36.[主观填空题] MapReduce的main函数中添加MyMapper类的方法为job.##(MyMapper.class);
正确答案:————
37.[主观填空题] Storm运行任务的方式与Hadoop类似:Hadoop运行的是MapReduce作业,而Storm运行的是##
正确答案:————
38.[主观填空题] HDFS中SecondaryNameNode通过HTTP的##请求方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下;
正确答案:————
39.[主观填空题] SQL中的table对应与MongoDB中的##<br><br>
正确答案:————
40.[主观填空题] 所有的HDFS通信协议都是构建在##协议基础之上的
正确答案:————
41.[问答题] Hbase中Master的主要工作
正确答案:————
42.[问答题] 试说明一个MapReduce程序在运行期间,所启动的Map任务数量和Reduce任务数量各是由什么因素决定的。
正确答案:————
43.[名词解释] Twitter Storm
正确答案:————
44.[名词解释] Hbase中.META.表
正确答案:————
45.[名词解释] 数据库事务的原子性
正确答案:————
46.[名词解释]Hadoop项目中的Pig
正确答案:————
页:
[1]