|
19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业
1.[单选题] 采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A.架构设计更容易
B.更易突破物理极限
C.能更充分利用现有资源
D.功耗优势明显
正确答案:——B——
2.[单选题] n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
正确答案:——A——
3.[单选题] 一个并行算法是非代价最优的,则____改进为代价最优。
A.减少处理器数量必然能
B.减少处理器数量有可能
C.减少处理器数量也不可能
D.增大处理器数量必然能
正确答案:——B——
4.[单选题] n*n的两个矩阵相乘,问题规模为____。
A.n
B.n^2
C.2n^2
D.n^3
正确答案:————
5.[单选题] 并行计算还主要用于国防、工程研究等领域,这种说法是____。
A.正确的
B.错误的
正确答案:————
6.[单选题] MPI程序中发送和接收消息的两个进程必须____。
A.在同一个网段中
B.连接在同一个路由器上
C.在同一个通信域中
D.以上皆错
正确答案:————
7.[单选题] 关于omp single指令,下面说法错误的是____。
A.线程组中只有一个线程执行代码
B.用于I/O或初始化等任务
C.是保持数据依赖所必须的
D.入口或出口无隐式barrier
正确答案:————
8.[单选题] 超立方中相邻节点二进制编号____。
A.至少差1位
B.至多差1位
C.恰好差1位
D.差异不固定
正确答案:————
9.[单选题] 一个SSE寄存器可容纳____个短整型数。
A.2
B.4
C.8
D.16
正确答案:————
10.[单选题] 在下面问题中,SIMD并行最不适合____。
A.向量加法
B.向量中元素排序
C.矩阵向量乘法
D.矩阵加法
正确答案:————
11.[单选题] 主线程创建了4个从线程,对它们执行pthread_join,然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A.必然主线程前、从线程后
B.必然从线程前、主线程后
C.必然相互交织
D.各种顺序皆有可能
正确答案:————
12.[单选题] 对矩阵乘法进行多线程并行化,对矩阵采用____。
A.简单均匀块划分即可保证负载均衡
B.循环划分才能实现负载均衡
C.动态划分才能实现负载均衡
D.随机划分才能实现负载均衡
正确答案:————
13.[单选题] 对于向量化,以下说法错误的是____。
A.总会有打包/解包开销
B.若运算对象连续存储,可消除打包开销
C.若运算结果连续存储,可消除解包开销
D.打包/解包开销由数据存储决定
正确答案:————
14.[单选题] SSE intrinsics _mm_load_pd命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
正确答案:————
15.[单选题] 在128位的SIMD寄存器中,我们不能保存____。
A.16个8位整数
B.8个16位短整型
C.4个32位整型
D.16个字符的字符串
正确答案:————
16.[单选题] 对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。
A.在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可
B.线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果
C.太多本地运算,不能体现并行效果,不是好的模式
D.主线程汇总结果在性能上必然不如多线程并行汇总结果
正确答案:————
17.[单选题] 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A.创建和管理线程代码
B.循环划分给线程的代码
C.找出数据依赖的代码
D.线程同步的代码
正确答案:————
18.[单选题] OpenMP编译指示的作用范围是____。
A.其后一个语句
B.其后连续语句
C.其后直到函数结束
D.整个函数
正确答案:————
19.[单选题] SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。
A.将第一个源寄存器的第j个元素放在目标寄存器位置1
B.将第二个源寄存器的第j个元素放在目标寄存器位置1
C.将第一个源寄存器的第j个元素放在目标寄存器位置j
D.将第二个源寄存器的第j个元素放在目标寄存器位置j
正确答案:————
20.[单选题] 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
正确答案:————
21.[单选题] CUDA共享内存是由____共享。
A.Grid中所有线程
B.一个Block中所有线程
C.一个Warp中所有线程
D.GPU中所有线程
正确答案:————
22.[单选题] 记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A.pT'=T
B.E=Θ(1)
C.E=pT/T'
D.E=T'/pT
正确答案:————
23.[单选题] 天河1A和天河2号都是主要依靠____获得强大的计算能力。
A.单核CPU
B.多核CPU
C.众核CPU
D.众核协处理器
正确答案:————
24.[单选题] 在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
A.输入数据
B.中间结果
C.输出数据
D.临时数据
正确答案:————
25.[单选题] 静态任务划分相对于动态任务划分的优点是____。
A.确保负载均衡
B.任务粒度细
C.计算复杂度低
D.并行效率高
正确答案:————
26.[单选题] 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A.声明语句
B.条件分支语句
C.循环语句
D.输入输出语句
正确答案:————
27.[单选题] GPU相对于其他众核产品的优势不包括____。
A.平台普及
B.有CUDA这样易学的开发工具
C.性价比高
D.由英伟达公司一家把控
正确答案:————
28.[单选题] CUDA寄存器是由____。
A.Grid中所有线程共享
B.一个Block中所有线程共享
C.一个Warp中所有线程共享
D.每个线程独享
正确答案:————
29.[单选题] 采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A.串行生成一定规模的搜索树
B.当前每个叶结点为根的子树搜索分配给一个处理器
C.发现解的处理器通知其他处理器
D.将所有处理器的结果组合成最终解
正确答案:————
30.[单选题] 关于MPI是什么,以下说法错误的是____。
A.一种消息传递编程模型标准
B.一种共享内存编程模型标准
C.编程角度看是C++/Fortran等的库
D.基于SPMD模型
正确答案:————
31.[单选题] OpenMP是___架构下的一种编程工具。
A.SIMD
B.MISD
C.共享内存
D.分布式内存
正确答案:————
32.[单选题] 求解同一个问题的4个并行算法的等效率函数分析结果如下,其中____的可扩展性最优。
A.Θ(plogp)
B.Θ(p^2)
C.Θ(p^2logp)
D.Θ(p^3)
正确答案:————
33.[单选题] OpenMP归约指令采用的是一种____算法。
A.分治
B.贪心
C.动态规划
D.排序
正确答案:————
34.[单选题] 一个函数是“线程安全的”,其含义是该函数____。
A.多线程执行能抵御网络攻击
B.多线程执行能保护用户隐私数据
C.多线程执行结果也是正确的
D.以上皆错
正确答案:————
35.[单选题] for (i=0; i<10; i++) A[i] = A[i]+1; 此循环____数据依赖。
A.存在
B.不存在
C.不确定
D.以上皆错
正确答案:————
36.[单选题] 利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A.降低了访存延迟
B.隐藏了访存延迟
C.利用了cache空间局部性
D.利用了cache时间局部性
正确答案:————
37.[单选题] OpenMP最常见的编程方式是寻找串行程序中____结构进行并行化。
A.赋值语句
B.循环语句
C.递归
D.输出语句
正确答案:————
38.[单选题] CUDA程序中不包括____。
A.host代码
B.device代码
C.kernel
D.图形渲染代码
正确答案:————
39.[单选题] OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。
A.两者均为创建线程时传递参数
B.两者均通过特定API
C.前者创建线程时传递参数,后者通过特定API
D.前者通过特定API,后者创建线程时传递参数
正确答案:————
40.[单选题] 用GCC编译器编译SSE intrinsics程序,需使用编译选项
A.-march=corei7
B.-g
C.-O
D.-O2
正确答案:————
41.[单选题] 现代CPU中都具有指令乱序执行功能,其目的不包括____。
A.消除指令依赖,更充分利用多流水线
B.提高cache效率
C.改变计算结果
D.消除资源冲突
正确答案:————
42.[单选题] 并行计算的新兴应用领域不包括____。
A.制药
B.数字媒体
C.国防
D.游戏
正确答案:————
43.[单选题] 采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。
A.CPU内存
B.GPU显存
C.GPU共享内存
D.GPU寄存器
正确答案:————
44.[单选题] 对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
A.G1顶点权重之和小于G2
B.G1平均并发度大于G2
C.G1关键路径长度小于G2
D.G1顶点权重之和除以关键路径长度大于G2
正确答案:————
45.[单选题] 当问题规模不变时,随着处理器数量增大,加速比____。
A.必然增大
B.必然减小
C.必然不变
D.以上皆错
正确答案:————
46.[单选题] 关于OpenMP程序中的并行结构,以下说法正确的是____。
A.其结束时需程序员人为添加同步
B.其结束时OpenMP已默认添加隐式障碍
C.其结束时完全不需要同步
D.其结束时必须进行同步
正确答案:————
47.[单选题] 当前并行软件面临的主要挑战不包括____。
A.能耗
B.伸缩性
C.研发周期
D.可靠性
正确答案:————
48.[单选题] 关于互斥量mutex,下面说法错误的是____。
A.它将保护区域内的运算变成原子操作
B.任何时刻只允许一个线程进入保护区域
C.保险期间,对并发操作都应用互斥量保护
D.互斥量加锁、解锁开销远大于一般运算
正确答案:————
49.[单选题] SIMD架构未见于_____中。
A.多媒体扩展
B.图形和游戏处理器
C.计算机集群
D.协处理器
正确答案:————
50.[单选题] 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A.等于8
B.小于8
C.4到8之间
D.等于4
正确答案:————
|
|