奥鹏答案 发表于 2021-4-13 14:48:11

21春南开《大数据开发技术(一)》在线作业资料

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(一)》在线作业
1.[单选题] MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
无忧答案网答案资料下载,请参考帮助中心说明
    A.M
    B.N
    C.M-1
    D.N-1
    答:——A——
2.[单选题] SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
    A.Client Layer
    B.Services Layer
    C.Platform Layer
    D.Infrastructure Layer
    答:——B——
3.[单选题] MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
    A.Split
    B.Slot
    C.Map
    D.Shuffle
    答:——B——
4.[单选题] 对于不同顶点之间的信息交换,Pregel采用了()
    A.远程数据读取
    B.共享内存
    C.纯消息传递模型
    D.共享消息
    答:————
5.[单选题] 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
    A.列族数据库
    B.键值数据库
    C.图数据库
    D.文档数据库
    答:————
6.[单选题] 优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
    A.列族数据库
    B.键值数据库
    C.图数据库   福师 q164786 1640 更多答案进 ap5u.com
    D.文档数据库
    答:————
7.[单选题] UMP系统借助于()来实现高效和可靠的协同工作
    A.Mnesia
    B.LVS
    C.RabbitMQ
    D.Zookeeper
    答:————
8.[单选题] Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
    A.ShuffleGrouping
    B.AllGrouping
    C.GlobalGrouping
    D.FiedlsGrouping
    答:————
9.[单选题] UMP系统中面对分库分表用户如何进行资源调度()
    A.可以共享同一个MySQL实例
    B.每个用户独占一个MySQL实例
    C.会占用多个独立的MySQL实例
    D.随机分配MySQL实例
    答:————
10.[单选题] 以下不属于物联网关键技术的是()。
    A.RFID
    B.传感器
    C.交换机
    D.矩阵式二维码
    答:————
11.[单选题] 关于Storm中Topology说法错误的是()。
    A.Topology可视为流转换图
    B.Topology可以被提交到Storm集群执行
    C.在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
    D.Topology里面的每一个组件都是串行运行的
    答:————
12.[单选题] Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
    A.ShuffleGrouping
    B.AllGrouping
    C.GlobalGrouping
    D.FiedlsGrouping
    答:————
13.[单选题] Hbase中Zookeeper文件记录了()的位置
    A..META.表
    B.-ROOT-表
    C.Region
    D.Master
    答:————
14.[单选题] BigTable采用()作为底层数据存储
    A.HDFS
    B.GFS
    C.Hbase
    D.传统文件系统
    答:————
15.[单选题] MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
    A.数据向计算靠拢
    B.计算向数据靠拢
    C.计算向网络靠拢
    D.计算与数据并行
    答:————
16.[单选题] Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
    A.ShuffleGrouping
    B.AllGrouping
    C.GlobalGrouping
    D.FiedlsGrouping
    答:————
17.[单选题] Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
    A.Master
    B.Region
    C.Zookeeper
    D.Chubby
    答:————
18.[单选题] 应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
    A.列族数据库
    B.键值数据库
    C.图数据库
    D.文档数据库
    答:————
19.[单选题] 针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
    A.Time Tunnel
    B.Spark
    C.Super Mario
    D.Storm
    答:————
20.[单选题] UMP系通过()来实现实现数据路由的基本功能
    A.Controller服务器
    B.Procy服务器
    C.愚公系统
    D.Agent服务器
    答:————
21.[单选题] ()可解决HDFS中名称节点运行期间EditLog不断变大的问题
    A.NameNode
    B.SecondaryNameNode
    C.DataNode
    D.Block
    答:————
22.[单选题] 以下哪种数据库适合于批量数据处理和即席查询()
    A.MySQL
    B.Oracle
    C.Hbase
    D.NosSQL
    答:————
23.[单选题] HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
    A.Master
    B.Region
    C.Zookeeper
    D.Chubby
    答:————
24.[单选题] 以下亚马逊的产品中哪个是关系数据库
    A.RDS
    B.SimpleDB
    C.DynamoDB
    D.Redshift
    答:————
25.[单选题] 1秒定律体现了大数据的哪个特征()。
    A.数据量大
    B.数据产生速度快
    C.数据存储快
    D.数据计算快
    答:————
26.[单选题] HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
    A.大于
    B.小于
    C.等于
    D.大于等于
    答:————
27.[单选题] 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
    A.动态
    B.存量
    C.实时
    D.静态
    答:————
28.[单选题] MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
    A.Client
    B.Job Tracker
    C.Task
    D.Task Tracker
    答:————
29.[单选题] HDFS读数据过程中()具体实现了FileSystem
    A.DistributedFileSystem
    B.GFSSystem
    C.FileSystem
    D.HDFSSystem
    答:————
30.[单选题] 关于分布式并行编程,以下说法错误的是()。
    A.“摩尔定律”,CPU性能大约每隔12个月翻一番
    B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
    C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
    D.谷歌公司最先提出了分布式并行编程模型MapReduce
    答:————
31.[多选题] Hadoop配置文件中说法错误的是()。
    A.core-site.xml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据
    B.core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称
    C.hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方
    D.hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0
    E.hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方
    答:————
32.[多选题] MapReduce可以解决哪些计算问题()。
    A.矩阵乘法
    B.关系代数运算
    C.聚合运算
    D.关系投影运算
    答:————
33.[多选题] 流计算系统的需求有()。
    A.实时性
    B.廉价
    C.高性能
    D.高带宽
    E.分布式
    答:————
34.[多选题] 以下亚马逊的产品中哪个属于存储部分
    A.EC2
    B.EBS
    C.S3
    D.ELB
    答:————
35.[多选题] MapReduce的main函数中设置输出类型的方法有()。
    A.setOutputKeyClass
    B.setOutputClass
    C.setOutputValueClass
    D.setKeyValueClass
    答:————
36.[多选题] 哪些属于数据可视化的重要作用()
    A.分析数据
    B.采集数据
    C.辅助理解数据
    D.观测跟踪数据
    答:————
37.[多选题] 大数据的特征是()。
    A.数据体量大
    B.数据产生速度快
    C.数据种类多
    D.数据计算快
    E.数据价值高
    答:————
38.[多选题] 已得到广泛应用的分布式文件系统主要包括()。
    A.GFS
    B.MapReduce
    C.Hbase
    D.HDFS
    答:————
39.[多选题] HDFS中客户端在读取到数据后,会采用()对数据块进行校验,已确定正确性
    A.md5
    B.哈希桶
    C.sha1
    D.奇偶校验
    答:————
40.[多选题] 以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
    A.Giraph
    B.Pregel
    C.Hama
    D.DEX
    答:————
41.[判断题] 文件块的大小和副本个数只能由系统指定。
    A.对
    B.错
    答:————
42.[判断题] Hbase和传统数据库一样都是列式数据库
    A.对
    B.错
    答:————
43.[判断题] 数据产生方式的运营式系统阶段的数据产生方式是主动的。
    A.对
    B.错
    答:————
44.[判断题] 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层
    A.对
    B.错
    答:————
45.[判断题] Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
    A.对
    B.错
    答:————
46.[判断题] 云数据库不可以满足大企业的海量数据存储需求
    A.对
    B.错
    答:————
47.[判断题] Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
    A.对
    B.错
    答:————
48.[判断题] 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
    A.对
    B.错
    答:————
49.[判断题] 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
    A.对
    B.错
    答:————
50.[判断题] Storm框架是实时计算系统,所以不能使用数据库。
    A.对
    B.错
    答:————

转载注明 无忧答案网随机作业核对题目后下载答案
页: [1]
查看完整版本: 21春南开《大数据开发技术(一)》在线作业资料