奥特曼 发表于 2021-11-10 08:32:32

21秋南开《大数据开发技术(二)》在线作业题目及答案

21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业
1.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()

    A.完全图
    B.有向完全图
    C.无向图
    D.简单图
    答:——A——
2.[单选题] Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
    A.filter
    B.foreach
    C.map
    D.mkString
    答:——D——
3.[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()
    A.完全图
    B.有向完全图
    C.无向图
    D.简单图
    答:——D——
4.[单选题] 以下哪个函数可以求两个RDD的笛卡尔积()
    A.union
    B.substract
    C.intersection
    D.cartesian
    答:————
5.[单选题] Dstream窗口操作中()方法返回基于滑动窗口的DStream中的元素的数量
    A.window
    B.countByWindow
    C.reduceByWindow
    D.reduceByKeyAndWindow
    答:————
6.[单选题] Spark GraphX中类Graph的groupEdges方法可以()
    A.反转图中所有边的方向
    B.按照设定条件取出子图
    C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
    D.合并边相同的属性
    答:————
7.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
    A.trainClassifier
    B.trainRegressor
    C.LogisticRegressionModel
    D.LabeledPoint   
    答:————
8.[单选题] GraphX中()方法可以查询度数
    A.degrees
    B.degree
    C.vertices
    D.edges
    答:————
9.[单选题] 图结构中如果任意两个顶点之间都存在有向边,那么称之为()
    A.完全图
    B.有向完全图
    C.无向图
    D.简单图
    答:————
10.[单选题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,但是没有返回值的方法是()
    A.map
    B.foreach
    C.flatten
    D.flatmap
    答:————
11.[单选题] 当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
    A.transfer
    B.change
    C.map
    D.build
    答:————
12.[单选题] 在MLlib中,逻辑回归算法的输入值为()类型
    A.Double
    B.LabledPoint
    C.Point
    D.SGB
    答:————
13.[单选题] Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()
    A.filter
    B.flatten
    C.grouby
    D.flatmap
    答:————
14.[单选题] spark-submit配置项中()表示Driver程序使用的内存大小
    A.--driver-memory MEM
    B.--executor-memory MEM
    C.--total-executor-cores NUM
    D.--executor-coures NUM
    答:————
15.[单选题] Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符()代替参数。
    A.井号
    B.下划线
    C.斜杠
    D.逗号
    答:————
16.[单选题] Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
    A.收集邻居顶点的顶点Id和顶点属性
    B.收集邻居顶点的顶点Id
    C.向指定顶点发送信息并聚合信息
    D.将顶点信息更新到图中
    答:————
17.[单选题] Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream
    A.union
    B.reduce
    C.join
    D.cogroup
    答:————
18.[单选题] 请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端
    A.join
    B.zip
    C.combineByKey
    D.collect
    答:————
19.[单选题] Mllib中线性会馆算法中的参数intercept表示()
    A.要运行的迭代次数
    B.梯度下降的步长
    C.是否给数据加干扰特征或者偏差特征
    D.Lasso 和ridge 的正规化参数
    答:————
20.[单选题] var a=10;
for(a<-1 until 20){
println(a);
}
共循环了()次
    A.10
    B.11
    C.20
    D.19
    答:————
21.[单选题] 请问RDD的()操作用来计算RDD中所有元素个数
    A.count
    B.num
    C.length
    D.number
    答:————
22.[单选题] Scala中重写一个非抽象方法必须使用()修饰符。
    A.extends
    B.override
    C.extend
    D.overrides
    答:————
23.[单选题] 以下哪个函数可以对RDD进行过滤()
    A.sortBy
    B.filter
    C.distinct
    D.intersection
    答:————
24.[单选题] Scala列表中()可以表示为一个空列表
    A.Nill
    B.Nil
    C.List
    D.None
    答:————
25.[单选题] Graph类中如果要根据分开存放的顶点数据和边数据创建图,应该用()方法
    A.Graph(vertices,edges, defaultVertexAttr)
    B.Graph.fromEdges(RDD], defaultValue)
    C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
    D.GraphLoader.edgeListFile(sc,filename)
    答:————
26.[多选题] Spark Streaming支持实时流式数据,包括()
    A.Web服务器日志文件
    B.社交网络数据
    C.实时交易数据
    D.类似Kafka的信息数据
    答:————
27.[多选题] Scala中使用() 方法来连接两个集合
    A.append
    B.++
    C.concat
    D.Set.++()
    答:————
28.[多选题] Scala中构造列表的两个基本单位是 ()
    A.Nil
    B.Nill
    C.::
    D.List
    答:————
29.[多选题] MLBase包括()
    A.Mllib
    B.MLI
    C.SparkR
    D.GraphX
    答:————
30.[多选题] Scala函数支持()
    A.递归函数
    B.高阶函数
    C.柯里化
    D.匿名函数
    答:————
31.[多选题] Spark创建DataFrame对象方式有()
    A.结构化数据文件
    B.外部数据库
    C.RDD
    D.Hive中的表
    答:————
32.[多选题] Spark SQL可以处理()
    A.RDD
    B.Parquet文件
    C.JSON文件
    D.Hive表
    答:————
33.[多选题] Spark Streaming能够处理来自()的数据
    A.Kafka
    B.Flume
    C.Twitter
    D.ZeroMQ
    答:————
34.[多选题] Spark Core包含的功能有()
    A.任务调度
    B.内存管理
    C.SQL查询
    D.容错机制
    答:————
35.[多选题] Scala支持()
    A.显式参数
    B.隐式参数
    C.转换
    D.多态方法
    答:————
36.[判断题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
    A.对
    B.错
    答:————
37.[判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
    A.对
    B.错
    答:————
38.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
    A.对
    B.错
    答:————
39.[判断题] Spark Streming中DStream代表着一系列的持续的RDDs
    A.对
    B.错
    答:————
40.[判断题] 用户可以在Apache Mesos上运行Spark
    A.对
    B.错
    答:————
41.[判断题] Spark RDD 是惰性求值的, 如果需要对一个RDD 多次使用,那么调用行动操作时每次都需要重复计算RDD 以及它的依赖。
    A.对
    B.错
    答:————
42.[判断题] Spark在同一个应用中不能同时使用Spark SQL和Mllib
    A.对
    B.错
    答:————
43.[判断题] Scala中列表是可变的
    A.对
    B.错
    答:————
44.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
    A.对
    B.错
    答:————
45.[判断题] Spark的DataFrame只有在提交Action 操作时才会进行计算
    A.对
    B.错
    答:————
46.[判断题] RDD的mapPartitions操作会导致Partitions数量的变化
    A.对
    B.错
    答:————
47.[判断题] Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。
    A.对
    B.错
    答:————
48.[判断题] RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
    A.对
    B.错
    答:————
49.[判断题] Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数
    A.对
    B.错
    答:————
50.[判断题] PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
    A.对
    B.错
    答:————


页: [1]
查看完整版本: 21秋南开《大数据开发技术(二)》在线作业题目及答案