21秋南开《大数据开发技术(二)》在线作业题目及答案
21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业1.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答:——A——
2.[单选题] Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
A.filter
B.foreach
C.map
D.mkString
答:——D——
3.[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答:——D——
4.[单选题] 以下哪个函数可以求两个RDD的笛卡尔积()
A.union
B.substract
C.intersection
D.cartesian
答:————
5.[单选题] Dstream窗口操作中()方法返回基于滑动窗口的DStream中的元素的数量
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
答:————
6.[单选题] Spark GraphX中类Graph的groupEdges方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
答:————
7.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
答:————
8.[单选题] GraphX中()方法可以查询度数
A.degrees
B.degree
C.vertices
D.edges
答:————
9.[单选题] 图结构中如果任意两个顶点之间都存在有向边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答:————
10.[单选题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,但是没有返回值的方法是()
A.map
B.foreach
C.flatten
D.flatmap
答:————
11.[单选题] 当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
A.transfer
B.change
C.map
D.build
答:————
12.[单选题] 在MLlib中,逻辑回归算法的输入值为()类型
A.Double
B.LabledPoint
C.Point
D.SGB
答:————
13.[单选题] Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()
A.filter
B.flatten
C.grouby
D.flatmap
答:————
14.[单选题] spark-submit配置项中()表示Driver程序使用的内存大小
A.--driver-memory MEM
B.--executor-memory MEM
C.--total-executor-cores NUM
D.--executor-coures NUM
答:————
15.[单选题] Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符()代替参数。
A.井号
B.下划线
C.斜杠
D.逗号
答:————
16.[单选题] Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
A.收集邻居顶点的顶点Id和顶点属性
B.收集邻居顶点的顶点Id
C.向指定顶点发送信息并聚合信息
D.将顶点信息更新到图中
答:————
17.[单选题] Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream
A.union
B.reduce
C.join
D.cogroup
答:————
18.[单选题] 请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端
A.join
B.zip
C.combineByKey
D.collect
答:————
19.[单选题] Mllib中线性会馆算法中的参数intercept表示()
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso 和ridge 的正规化参数
答:————
20.[单选题] var a=10;
for(a<-1 until 20){
println(a);
}
共循环了()次
A.10
B.11
C.20
D.19
答:————
21.[单选题] 请问RDD的()操作用来计算RDD中所有元素个数
A.count
B.num
C.length
D.number
答:————
22.[单选题] Scala中重写一个非抽象方法必须使用()修饰符。
A.extends
B.override
C.extend
D.overrides
答:————
23.[单选题] 以下哪个函数可以对RDD进行过滤()
A.sortBy
B.filter
C.distinct
D.intersection
答:————
24.[单选题] Scala列表中()可以表示为一个空列表
A.Nill
B.Nil
C.List
D.None
答:————
25.[单选题] Graph类中如果要根据分开存放的顶点数据和边数据创建图,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答:————
26.[多选题] Spark Streaming支持实时流式数据,包括()
A.Web服务器日志文件
B.社交网络数据
C.实时交易数据
D.类似Kafka的信息数据
答:————
27.[多选题] Scala中使用() 方法来连接两个集合
A.append
B.++
C.concat
D.Set.++()
答:————
28.[多选题] Scala中构造列表的两个基本单位是 ()
A.Nil
B.Nill
C.::
D.List
答:————
29.[多选题] MLBase包括()
A.Mllib
B.MLI
C.SparkR
D.GraphX
答:————
30.[多选题] Scala函数支持()
A.递归函数
B.高阶函数
C.柯里化
D.匿名函数
答:————
31.[多选题] Spark创建DataFrame对象方式有()
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
答:————
32.[多选题] Spark SQL可以处理()
A.RDD
B.Parquet文件
C.JSON文件
D.Hive表
答:————
33.[多选题] Spark Streaming能够处理来自()的数据
A.Kafka
B.Flume
C.Twitter
D.ZeroMQ
答:————
34.[多选题] Spark Core包含的功能有()
A.任务调度
B.内存管理
C.SQL查询
D.容错机制
答:————
35.[多选题] Scala支持()
A.显式参数
B.隐式参数
C.转换
D.多态方法
答:————
36.[判断题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
A.对
B.错
答:————
37.[判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A.对
B.错
答:————
38.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
A.对
B.错
答:————
39.[判断题] Spark Streming中DStream代表着一系列的持续的RDDs
A.对
B.错
答:————
40.[判断题] 用户可以在Apache Mesos上运行Spark
A.对
B.错
答:————
41.[判断题] Spark RDD 是惰性求值的, 如果需要对一个RDD 多次使用,那么调用行动操作时每次都需要重复计算RDD 以及它的依赖。
A.对
B.错
答:————
42.[判断题] Spark在同一个应用中不能同时使用Spark SQL和Mllib
A.对
B.错
答:————
43.[判断题] Scala中列表是可变的
A.对
B.错
答:————
44.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
A.对
B.错
答:————
45.[判断题] Spark的DataFrame只有在提交Action 操作时才会进行计算
A.对
B.错
答:————
46.[判断题] RDD的mapPartitions操作会导致Partitions数量的变化
A.对
B.错
答:————
47.[判断题] Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。
A.对
B.错
答:————
48.[判断题] RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
A.对
B.错
答:————
49.[判断题] Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数
A.对
B.错
答:————
50.[判断题] PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
A.对
B.错
答:————
页:
[1]