21秋南开《并行程序设计》在线作业答案
21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《并行程序设计》在线作业1.[单选题] 在SSE intrinsics程序中双精度浮点数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
答:——C——
2.[单选题] SIMD架构未见于_____中。
A.多媒体扩展
B.图形和游戏处理器
C.计算机集群
D.协处理器
答:——C——
3.[单选题] 关于omp single指令,下面说法错误的是____。
A.线程组中只有一个线程执行代码
B.用于I/O或初始化等任务
C.是保持数据依赖所必须的
D.入口或出口无隐式barrier
答:——C——
4.[单选题] 数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
A.大小
B.时序
C.时长
D.cache局部性
答:————
5.[单选题] 为了实现向量计算,SIMD架构还需提供____。
A.更大的内存容量
B.更快的内存传输
C.更宽的寄存器
D.更快的网络传输
答:————
6.[单选题] SSE intrinsics _mm_add_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法
B.寄存器间双精度浮点数向量加法
C.寄存器内单精度浮点数加法
D.寄存器内双精度浮点数加法
答:————
7.[单选题] 一个函数是“线程安全的”,其含义是该函数____。
A.多线程执行能抵御网络攻击
B.多线程执行能保护用户隐私数据
C.多线程执行结果也是正确的
D.以上皆错
答:————
8.[单选题] SPMD是为了简化____体系结构下的编程而提出的一种机制。
A.SISD
B.SIMD
C.MISD
D.MIMD
答:————
9.[单选题] 静态线程编程模式的优点是____。
A.线程负载均衡
B.线程通信效率高
C.线程管理开销低
D.系统资源利用率高
答:————
10.[单选题] 华尔街是世界上超级计算机最密集的区域之一,原因是____。
A.金融巨头支付得起
B.与超算制造商有良好合作
C.海量交易需要很高安全性
D.海量交易处理需要并行计算
答:————
11.[单选题] 矩阵每行排序的问题更适合使用MPI的____编程模型。
A.阻塞的
B.非阻塞的
C.对等的
D.主从的
答:————
12.[单选题] 当处理器数量和问题规模同时增大,____能保持效率恒定。
A.所有算法都
B.所有算法都不
C.部分算法
D.以上皆错
答:————
13.[单选题] OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
答:————
14.[单选题] OpenMP并行模型是一种____模式。
A.静态线程
B.对等式多线程
C.加锁-解锁
D.Fork-join
答:————
15.[单选题] 关于pthread_create函数,下列说法错误的是____。
A.它返回是线程创建成功与否的错误码
B.线程属性参数使用空指针表示使用默认参数
C.它成功创建线程后立刻执行线程函数等待其结束后返回
D.可通过它将参数传递给线程函数
答:————
16.[单选题] 在MPI中从/向虚拟进程收/发消息的实际效果是____。
A.与通信域根进程通信
B.与0号进程通信
C.像什么都没发生一样
D.以上皆错
答:————
17.[单选题] 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A.必然主线程前、从线程后
B.必然从线程前、主线程后
C.必然相互交织
D.各种顺序皆有可能
答:————
18.[单选题] 下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A.矩阵求和
B.矩阵相乘
C.矩阵向量相乘
D.高斯消去
答:————
19.[单选题] 在SSE intrinsics程序中整数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
答:————
20.[单选题] 指定线程间划分循环策略的OpenMP子句是____。
A.shared
B.reduction
C.schedule
D.nowait
答:————
21.[单选题] MPI是用于____系统的并行编程模型。
A.SIMD
B.MISD
C.共享内存
D.分布式内存
答:————
22.[单选题] SSE是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答:————
23.[单选题] 对于MPI中的点对点通信,下面错误的说法是____。
A.发送方的目的地址必须是接受方的进程编号
B.接受方的源地址可以不是发送方的进程编号
C.发送方和接受方的消息标签必须一致
D.接受方的消息标签可以是MPI_ANY_TAG
答:————
24.[单选题] CUDA生态环境的特点不包括____。
A.支持多种显卡架构
B.支持CPU、GPU自动混合并行
C.支持多种编程语言
D.支持多领域的库
答:————
25.[单选题] 从线程检查主线程是否要求它退出应采用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
答:————
26.[单选题] CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是____。
A.可利用cache时间局部性优化性能
B.可利用cache空间局部性优化性能
C.可通过矩阵分片优化性能
D.访存方面无优化可能
答:————
27.[单选题] 全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
A.单核CPU
B.多核CPU
C.FPGA
D.众核协处理器
答:————
28.[单选题] 对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用omp parallel for指令,第二种策略是对外层循环使用omp parallel指令,对内层循环使用omp for指令,后者相对于前者的优点是____。
A.保持了数据依赖
B.消除了大量线程创建、销毁开销
C.有利于负载均衡
D.减少了线程间交互
答:————
29.[单选题] n个模块的总线,并发通信能力为____。
A.1
B.O(logn)
C.O(n)
D.O(nlogn)
答:————
30.[单选题] MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
答:————
31.[单选题] 对于起泡排序程序两层循环是否存在数据依赖,下面说法正确的是____。
A.外层存在,内层不存在
B.外层不存在,内层存在
C.两层都不存在
D.两层都存在
答:————
32.[单选题] 在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
A.初始化
B.阻塞
C.继续执行
D.销毁
答:————
33.[单选题] 当前并行软件面临的主要挑战不包括____。
A.能耗
B.伸缩性
C.研发周期
D.可靠性
答:————
34.[单选题] SSE intrinsics _mm_load_ps命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答:————
35.[单选题] pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
A.它调用线程函数时可直接传递,性能更优
B.它需要预处理之后传递给线程函数
C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
D.没有特别用意
答:————
36.[单选题] 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A.等于8
B.小于8
C.4到8之间
D.等于4
答:————
37.[单选题] 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆错
答:————
38.[单选题] 在下面问题中,SIMD并行更适合____。
A.搜索
B.排序
C.矩阵乘法
D.构建二叉排序树
答:————
39.[单选题] n个处理器、n个内存模块的交叉开关构造成本为____。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
答:————
40.[单选题] 执行pthread_rwlock_rdlock时,____的情况下加锁成功。
A.已有一个线程上了写锁
B.已有多个线程上了写锁
C.已有多个线程上了读锁
D.已有多个线程上了读锁和写锁
答:————
41.[单选题] 传统科学和工程实验相对于计算机并行仿真的劣势不包括____。
A.成本太高
B.结果不准确
C.时间太长
D.太危险
答:————
42.[单选题] 对于并行程序设计,下面说法错误的是____。
A.天然具有复杂性
B.算法移植困难
C.软件开发标准环境发展相对之后
D.不应发展这个方向
答:————
43.[单选题] 两个矩阵相乘前将第二个矩阵转置,是使用利用数据访问的_____达到更高的cache命中率。
A.时间局部性
B.空间局部性
C.计算局部性
D.混合局部性
答:————
44.[单选题] n个节点的二维mesh构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答:————
45.[单选题] SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A, B, 0x05)后,C中元素为
A.A1 A2 B3 B4
B.B1 B2 A3 A4
C.A1 B2 A3 B4
D.B1 A2 B3 A4
答:————
46.[单选题] pthread_rwlock_wrlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
答:————
47.[单选题] 下列指令集中___不是SIMD指令集。
A.SSE
B.Neon
C.AVX
D.EMT64
答:————
48.[单选题] 有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
答:————
49.[单选题] 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A.创建和管理线程代码
B.循环划分给线程的代码
C.找出数据依赖的代码
D.线程同步的代码
答:————
50.[单选题] 下面哪种架构最适合数据并行____。
A.SISD
B.SIMD
C.MISD
D.MIMD
答:————
页:
[1]