100分 发表于 2020-10-19 09:36:47

20秋南开《并行程序设计》在线作业满分

20秋学期(1709、1803、1809、1903、1909、2003、2009)《并行程序设计》在线作业
1.[单选题] SSE intrinsics _mm_store_ps命令的功能是____。
无忧答案网答案资料下载,请参考帮助中心说明
    A.对齐向量存单精度浮点数
    B.未对齐向量存单精度浮点数
    C.对齐标量存单精度浮点数
    D.未对齐标量存单精度浮点数
    答:——A——
2.[单选题] for (i=0; i<16; i+=1) { L = A – B; D = D + abs(L); },此循环____。
    A.可完全向量化
    B.不可向量化
    C.不确定
    D.可部分向量化
    答:——D——
3.[单选题] 对这样的循环for (i=0; i<100; i+=1) A = A + B; 进行向量化,基本技术手段是____。
    A.循环划分
    B.循环消除
    C.循环展开
    D.以上皆错
    答:——C——
4.[单选题] MMX有____个专用寄存器。
    A.4
    B.8
    C.16
    D.32
    答:————
5.[单选题] 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
    A.创建和管理线程代码
    B.循环划分给线程的代码
    C.找出数据依赖的代码
    D.线程同步的代码
    答:————
6.[单选题] 创建线程时,我们通过____将线程号分别传递给每个线程。
    A.全局变量
    B.局部变量
    C.动态分配变量
    D.pthread_create的“线程函数参数”参数
    答:————
7.[单选题] 下列哪项不是这门课程的目标?
    A.学会肯定能优化程序性能的方法
    B.学会用并行思维思考问题
    C.学会常用的并行编程工具
    D.理解软件到并行架构的映射
    答:————
8.[单选题] 编写n个数求和的OpenMP程序,最高效的方法是____。
    A.多线程直接并发累加到共享变量
    B.将累加操作设置为临界区
    C.在累加操作前设置障碍
    D.采用归约指令
    答:————
9.[单选题] 静态线程编程模式的缺点是____。
    A.线程管理开销高
    B.系统资源利用率低
    C.线程负载不均
    D.线程通信开销高
    答:————
10.[单选题] 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是____。    福师答案请进 ap5u.com 或联系Q1647861640
    A.更有利于负载均衡
    B.减少了通信开销
    C.降低了计算次数
    D.减少了从进程空闲
    答:————
11.[单选题] MPI收发各一条消息的API是_____。
    A.MPI_Sendrecv
    B.MPI_Send
    C.MPI_Recv
    D.MPI_Replace
    答:————
12.[单选题] 两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是____。
    A.先将两个矩阵读入cache再进行乘法
    B.先转置第一个矩阵再进行乘法
    C.先转置第二个矩阵再进行乘法
    D.以上皆错
    答:————
13.[单选题] 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
    A.读取x存在数据依赖,不能并发进行
    B.累加顺序被改变,结果是错误的
    C.加法操作是简单运算,无需同步
    D.加法操作不是原子操作,需要同步保证数据依赖
    答:————
14.[单选题] 记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
    A.T'-T
    B.T-T'
    C.pT
    D.pT-T'
    答:————
15.[单选题] 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
    A.2
    B.4
    C.8
    D.16
    答:————
16.[单选题] 在下面问题中,SIMD并行更适合____。
    A.搜索
    B.排序
    C.矩阵乘法
    D.构建二叉排序树
    答:————
17.[单选题] 记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
    A.pT'=T
    B.E=Θ(1)
    C.E=pT/T'
    D.E=T'/pT
    答:————
18.[单选题] 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的___操作才能得到结果矩阵的一个元素。
    A.排列
    B.交换
    C.广播
    D.归约
    答:————
19.[单选题] 对于条件变量,下列说法错误的是____。
    A.可以用互斥量实现相同功能
    B.不能用互斥量实现相同功能
    C.较之互斥量方案节省资源
    D.较之互斥量方案代码更简洁
    答:————
20.[单选题] pthread_join的作用是____。
    A.强制终止指定线程
    B.检测指定线程是否结束
    C.等待指定线程结束才返回
    D.向指定线程发送数据
    答:————
21.[单选题] 以下____是MPI基本原语。
    A.MPI_barrier
    B.MPI_Comm_numprocs
    C.MPI_Comm_rank
    D.MPI_Comm_Send
    答:————
22.[单选题] n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
    A.O(logn)
    B.O(n)
    C.O(nlogn)
    D.O(n^2)
    答:————
23.[单选题] 以下超级计算机中,____不是SIMD架构。
    A.CDCSTAR-100
    B.757
    C.银河
    D.天河1号
    答:————
24.[单选题] 下面哪种架构最适合数据并行____。
    A.SISD
    B.SIMD
    C.MISD
    D.MIMD
    答:————
25.[单选题] 循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。
    A.循环变量应为带符号整数
    B.终止检测必须是与循环不变量的比较
    C.循环变量每步递增/递减一个循环不变量
    D.循环体无进/出控制流
    答:————
26.[单选题] 使用____无法直接实现“主线程唤醒4个从线程去执行任务”。
    A.1个信号量
    B.障碍
    C.1个互斥量
    D.4个互斥量
    答:————
27.[单选题] OpenMP编译指示的作用范围是____。
    A.其后一个语句
    B.其后连续语句
    C.其后直到函数结束
    D.整个函数
    答:————
28.[单选题] OpenMP不能实现的是____。
    A.负责创建和管理线程
    B.隐藏栈管理
    C.提供同步机制
    D.自动并行化
    答:————
29.[单选题] 采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
    A.按编号顺序依次从从进程接收结果
    B.按编号逆序依次从从进程接收结果
    C.按编号顺序、逆序交替从从进程接收结果
    D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
    答:————
30.[单选题] 对双精度浮点计算,AVX最高实现____路并行。
    A.2
    B.4
    C.8
    D.16
    答:————
31.[单选题] 对于效率E,下面描述错误的是____。
    A.理想并行E=1
    B.总是在0~1之间
    C.可能>1
    D.可能随着处理器数量增大趋向于0
    答:————
32.[单选题] 对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
    A.它最后执行
    B.外层循环中没有计算操作
    C.是随意选择的
    D.它的连续循环步是对不同元素进行相同运算
    答:————
33.[单选题] 在分布式内存架构编程中,进程间不能____。
    A.进行通信
    B.进行同步
    C.发送和接收消息
    D.通过读写变量交换数据
    答:————
34.[单选题] 新一代GPU重点提供的新特性不包括____。
    A.新型高速显存
    B.GPU间直接高速互联
    C.自动并行化
    D.人工智能计算专门优化
    答:————
35.[单选题] 在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
    A.初始化
    B.第二个矩阵转置循环
    C.矩阵元素乘—加计算的循环
    D.结果输出
    答:————
36.[单选题] 采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
    A.n
    B.t
    C.n-t
    D.n/t
    答:————
37.[单选题] 关于消息传递编程的特点,以下说法正确的是____。
    A.与共享内存一样有竞争条件
    B.编程简单
    C.需程序员考虑局部性
    D.无需考虑进程间通信
    答:————
38.[单选题] 华尔街是世界上超级计算机最密集的区域之一,原因是____。
    A.金融巨头支付得起
    B.与超算制造商有良好合作
    C.海量交易需要很高安全性
    D.海量交易处理需要并行计算
    答:————
39.[单选题] pthread_create函数中线程函数指针的正确类型是____。
    A.void (void *)
    B.void * (void *)
    C.int (void)
    D.void * (*)(void *)
    答:————
40.[单选题] 多线程是____架构下的并行模式。
    A.MIMD
    B.共享内存
    C.分布式内存
    D.分离式地址空间
    答:————
41.[单选题] OpenMP主要是通过____来更高层抽象的多线程编程。
    A.设计实现新的语言
    B.为现有语言提供大量库函数
    C.为现有语言扩展编译指示
    D.新编译器实现自动并行化
    答:————
42.[单选题] 执行pthread_rwlock_rdlock时,____的情况下加锁成功。
    A.已有一个线程上了写锁
    B.已有多个线程上了写锁
    C.已有多个线程上了读锁
    D.已有多个线程上了读锁和写锁
    答:————
43.[单选题] 有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
    A.SISD
    B.SIMD
    C.SPMD
    D.MIMD
    答:————
44.[单选题] 任务依赖图的平均并发度的定义是____。
    A.顶点权重之和
    B.顶点数
    C.各层平均顶点数
    D.顶点权重之和/关键路径长度
    答:————
45.[单选题] 一个AVX寄存器最多存放____个整型数。
    A.2
    B.4
    C.8
    D.16
    答:————
46.[单选题] n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
    A.肯定不是代价最优
    B.肯定是代价最优
    C.不确定是否代价最优
    D.以上皆错
    答:————
47.[单选题] 适合进行SIMD并行化的串行程序特点不包括____。
    A.大数据对象
    B.数据项连续存储
    C.流式计算
    D.算术计算密集
    答:————
48.[单选题] 我国最早夺得全球超级计算机计算能力冠军的是____。
    A.天河1号
    B.天河1A
    C.天河2号
    D.神威.太湖之光
    答:————
49.[单选题] 对单精度浮点计算,MMX最高实现____路并行。
    A.2
    B.4
    C.8
    D.16
    答:————
50.[单选题] 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。
    A._mm_set_ps
    B._mm_set1_ss
    C._mm_setzero_ss
    D._mm_setzero_ps
    答:————

无忧答案网 附件是答案,请核对题目下载
页: [1]
查看完整版本: 20秋南开《并行程序设计》在线作业满分