21春南开《大数据开发技术（一）》在线作业资料-南开大学-无忧答案网

奥鹏答案 发表于 2021-4-13 14:48:11

21春南开《大数据开发技术（一）》在线作业资料

21春学期（1709、1803、1809、1903、1909、2003、2009、2103）《大数据开发技术（一）》在线作业
1.[单选题] MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
无忧答案网答案资料下载，请参考帮助中心说明
A.M
B.N
C.M-1
D.N-1
答:——A——
2.[单选题] SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
A.Client Layer
B.Services Layer
C.Platform Layer
D.Infrastructure Layer
答:——B——
3.[单选题] MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A.Split
B.Slot
C.Map
D.Shuffle
答:——B——
4.[单选题] 对于不同顶点之间的信息交换,Pregel采用了()
A.远程数据读取
B.共享内存
C.纯消息传递模型
D.共享消息
答:————
5.[单选题] 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
答:————
6.[单选题] 优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
A.列族数据库
B.键值数据库
C.图数据库福师 q164786 1640 更多答案进 ap5u.com
D.文档数据库
答:————
7.[单选题] UMP系统借助于()来实现高效和可靠的协同工作
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
答:————
8.[单选题] Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
答:————
9.[单选题] UMP系统中面对分库分表用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
答:————
10.[单选题] 以下不属于物联网关键技术的是()。
A.RFID
B.传感器
C.交换机
D.矩阵式二维码
答:————
11.[单选题] 关于Storm中Topology说法错误的是()。
A.Topology可视为流转换图
B.Topology可以被提交到Storm集群执行
C.在Topology里面可以指定每个组件的并行度， Storm会在集群里面分配那么多的线程来同时计算
D.Topology里面的每一个组件都是串行运行的
答:————
12.[单选题] Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
答:————
13.[单选题] Hbase中Zookeeper文件记录了()的位置
A..META.表
B.-ROOT-表
C.Region
D.Master
答:————
14.[单选题] BigTable采用()作为底层数据存储
A.HDFS
B.GFS
C.Hbase
D.传统文件系统
答:————
15.[单选题] MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A.数据向计算靠拢
B.计算向数据靠拢
C.计算向网络靠拢
D.计算与数据并行
答:————
16.[单选题] Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
答:————
17.[单选题] Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
A.Master
B.Region
C.Zookeeper
D.Chubby
答:————
18.[单选题] 应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
答:————
19.[单选题] 针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A.Time Tunnel
B.Spark
C.Super Mario
D.Storm
答:————
20.[单选题] UMP系通过()来实现实现数据路由的基本功能
A.Controller服务器
B.Procy服务器
C.愚公系统
D.Agent服务器
答:————
21.[单选题] ()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
答:————
22.[单选题] 以下哪种数据库适合于批量数据处理和即席查询()
A.MySQL
B.Oracle
C.Hbase
D.NosSQL
答:————
23.[单选题] HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Master
B.Region
C.Zookeeper
D.Chubby
答:————
24.[单选题] 以下亚马逊的产品中哪个是关系数据库
A.RDS
B.SimpleDB
C.DynamoDB
D.Redshift
答:————
25.[单选题] 1秒定律体现了大数据的哪个特征()。
A.数据量大
B.数据产生速度快
C.数据存储快
D.数据计算快
答:————
26.[单选题] HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A.大于
B.小于
C.等于
D.大于等于
答:————
27.[单选题] 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
A.动态
B.存量
C.实时
D.静态
答:————
28.[单选题] MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A.Client
B.Job Tracker
C.Task
D.Task Tracker
答:————
29.[单选题] HDFS读数据过程中()具体实现了FileSystem
A.DistributedFileSystem
B.GFSSystem
C.FileSystem
D.HDFSSystem
答:————
30.[单选题] 关于分布式并行编程,以下说法错误的是()。
A.“摩尔定律”，CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后，人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上，可以并行执行大规模数据处理任务，从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
答:————
31.[多选题] Hadoop配置文件中说法错误的是()。
A.core-site.xml中hadoop.tmp.dir表示存放临时数据的目录，仅为NameNode的数据
B.core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称
C.hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方
D.hdfs-site.xml中dfs.replication表示副本的数量，伪分布式要设置为0
E.hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方
答:————
32.[多选题] MapReduce可以解决哪些计算问题()。
A.矩阵乘法
B.关系代数运算
C.聚合运算
D.关系投影运算
答:————
33.[多选题] 流计算系统的需求有()。
A.实时性
B.廉价
C.高性能
D.高带宽
E.分布式
答:————
34.[多选题] 以下亚马逊的产品中哪个属于存储部分
A.EC2
B.EBS
C.S3
D.ELB
答:————
35.[多选题] MapReduce的main函数中设置输出类型的方法有()。
A.setOutputKeyClass
B.setOutputClass
C.setOutputValueClass
D.setKeyValueClass
答:————
36.[多选题] 哪些属于数据可视化的重要作用()
A.分析数据
B.采集数据
C.辅助理解数据
D.观测跟踪数据
答:————
37.[多选题] 大数据的特征是()。
A.数据体量大
B.数据产生速度快
C.数据种类多
D.数据计算快
E.数据价值高
答:————
38.[多选题] 已得到广泛应用的分布式文件系统主要包括()。
A.GFS
B.MapReduce
C.Hbase
D.HDFS
答:————
39.[多选题] HDFS中客户端在读取到数据后,会采用()对数据块进行校验,已确定正确性
A.md5
B.哈希桶
C.sha1
D.奇偶校验
答:————
40.[多选题] 以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A.Giraph
B.Pregel
C.Hama
D.DEX
答:————
41.[判断题] 文件块的大小和副本个数只能由系统指定。
A.对
B.错
答:————
42.[判断题] Hbase和传统数据库一样都是列式数据库
A.对
B.错
答:————
43.[判断题] 数据产生方式的运营式系统阶段的数据产生方式是主动的。
A.对
B.错
答:————
44.[判断题] 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层
A.对
B.错
答:————
45.[判断题] Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A.对
B.错
答:————
46.[判断题] 云数据库不可以满足大企业的海量数据存储需求
A.对
B.错
答:————
47.[判断题] Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
A.对
B.错
答:————
48.[判断题] 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
A.对
B.错
答:————
49.[判断题] 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
A.对
B.错
答:————
50.[判断题] Storm框架是实时计算系统,所以不能使用数据库。
A.对
B.错
答:————

转载注明无忧答案网随机作业核对题目后下载答案

页: [1]

无忧答案网's Archiver

21春南开《大数据开发技术（一）》在线作业资料