桃子老师 发表于 2021-11-9 08:22:08

21秋南开《并行程序设计》在线作业答案

21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《并行程序设计》在线作业
1.[单选题] 在SSE intrinsics程序中双精度浮点数数据类型是____。

    A.__m128
    B.__m128f
    C.__m128d
    D.__m128i
    答:——C——
2.[单选题] SIMD架构未见于_____中。
    A.多媒体扩展
    B.图形和游戏处理器
    C.计算机集群
    D.协处理器
    答:——C——
3.[单选题] 关于omp single指令,下面说法错误的是____。
    A.线程组中只有一个线程执行代码
    B.用于I/O或初始化等任务
    C.是保持数据依赖所必须的
    D.入口或出口无隐式barrier
    答:——C——
4.[单选题] 数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
    A.大小
    B.时序
    C.时长
    D.cache局部性
    答:————
5.[单选题] 为了实现向量计算,SIMD架构还需提供____。
    A.更大的内存容量
    B.更快的内存传输
    C.更宽的寄存器
    D.更快的网络传输
    答:————
6.[单选题] SSE intrinsics _mm_add_ps命令的功能是____。
    A.寄存器间单精度浮点数向量加法
    B.寄存器间双精度浮点数向量加法
    C.寄存器内单精度浮点数加法
    D.寄存器内双精度浮点数加法
    答:————
7.[单选题] 一个函数是“线程安全的”,其含义是该函数____。
    A.多线程执行能抵御网络攻击
    B.多线程执行能保护用户隐私数据
    C.多线程执行结果也是正确的
    D.以上皆错
    答:————
8.[单选题] SPMD是为了简化____体系结构下的编程而提出的一种机制。
    A.SISD
    B.SIMD
    C.MISD
    D.MIMD
    答:————
9.[单选题] 静态线程编程模式的优点是____。
    A.线程负载均衡
    B.线程通信效率高
    C.线程管理开销低
    D.系统资源利用率高
    答:————
10.[单选题] 华尔街是世界上超级计算机最密集的区域之一,原因是____。   
    A.金融巨头支付得起
    B.与超算制造商有良好合作
    C.海量交易需要很高安全性
    D.海量交易处理需要并行计算
    答:————
11.[单选题] 矩阵每行排序的问题更适合使用MPI的____编程模型。
    A.阻塞的
    B.非阻塞的
    C.对等的
    D.主从的
    答:————
12.[单选题] 当处理器数量和问题规模同时增大,____能保持效率恒定。
    A.所有算法都
    B.所有算法都不
    C.部分算法
    D.以上皆错
    答:————
13.[单选题] OpenMP的优点不包括____。
    A.从头编写并行程序很自然
    B.串行程序并行化简单
    C.不必关心低层细节
    D.可移植、可扩展
    答:————
14.[单选题] OpenMP并行模型是一种____模式。
    A.静态线程
    B.对等式多线程
    C.加锁-解锁
    D.Fork-join
    答:————
15.[单选题] 关于pthread_create函数,下列说法错误的是____。
    A.它返回是线程创建成功与否的错误码
    B.线程属性参数使用空指针表示使用默认参数
    C.它成功创建线程后立刻执行线程函数等待其结束后返回
    D.可通过它将参数传递给线程函数
    答:————
16.[单选题] 在MPI中从/向虚拟进程收/发消息的实际效果是____。
    A.与通信域根进程通信
    B.与0号进程通信
    C.像什么都没发生一样
    D.以上皆错
    答:————
17.[单选题] 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
    A.必然主线程前、从线程后
    B.必然从线程前、主线程后
    C.必然相互交织
    D.各种顺序皆有可能
    答:————
18.[单选题] 下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
    A.矩阵求和
    B.矩阵相乘
    C.矩阵向量相乘
    D.高斯消去
    答:————
19.[单选题] 在SSE intrinsics程序中整数数据类型是____。
    A.__m128
    B.__m128f
    C.__m128d
    D.__m128i
    答:————
20.[单选题] 指定线程间划分循环策略的OpenMP子句是____。
    A.shared
    B.reduction
    C.schedule
    D.nowait
    答:————
21.[单选题] MPI是用于____系统的并行编程模型。
    A.SIMD
    B.MISD
    C.共享内存
    D.分布式内存
    答:————
22.[单选题] SSE是____平台的SIMD架构。
    A.x86
    B.POWER
    C.SPARC
    D.ARM
    答:————
23.[单选题] 对于MPI中的点对点通信,下面错误的说法是____。
    A.发送方的目的地址必须是接受方的进程编号
    B.接受方的源地址可以不是发送方的进程编号
    C.发送方和接受方的消息标签必须一致
    D.接受方的消息标签可以是MPI_ANY_TAG
    答:————
24.[单选题] CUDA生态环境的特点不包括____。
    A.支持多种显卡架构
    B.支持CPU、GPU自动混合并行
    C.支持多种编程语言
    D.支持多领域的库
    答:————
25.[单选题] 从线程检查主线程是否要求它退出应采用____。
    A.pthread_join
    B.pthread_cancel
    C.pthread_testcancel
    D.pthread_exit
    答:————
26.[单选题] CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是____。
    A.可利用cache时间局部性优化性能
    B.可利用cache空间局部性优化性能
    C.可通过矩阵分片优化性能
    D.访存方面无优化可能
    答:————
27.[单选题] 全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
    A.单核CPU
    B.多核CPU
    C.FPGA
    D.众核协处理器
    答:————
28.[单选题] 对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用omp parallel for指令,第二种策略是对外层循环使用omp parallel指令,对内层循环使用omp for指令,后者相对于前者的优点是____。
    A.保持了数据依赖
    B.消除了大量线程创建、销毁开销
    C.有利于负载均衡
    D.减少了线程间交互
    答:————
29.[单选题] n个模块的总线,并发通信能力为____。
    A.1
    B.O(logn)
    C.O(n)
    D.O(nlogn)
    答:————
30.[单选题] MPI基本原语不包括____。
    A.MPI_Barrier
    B.MPI_Comm_rank
    C.MPI_Comm_size
    D.MPI_Init
    答:————
31.[单选题] 对于起泡排序程序两层循环是否存在数据依赖,下面说法正确的是____。
    A.外层存在,内层不存在
    B.外层不存在,内层存在
    C.两层都不存在
    D.两层都存在
    答:————
32.[单选题] 在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
    A.初始化
    B.阻塞
    C.继续执行
    D.销毁
    答:————
33.[单选题] 当前并行软件面临的主要挑战不包括____。
    A.能耗
    B.伸缩性
    C.研发周期
    D.可靠性
    答:————
34.[单选题] SSE intrinsics _mm_load_ps命令的功能是____。
    A.对齐向量读取单精度浮点数
    B.未对齐向量读取单精度浮点数
    C.对齐向量读取双精度浮点数
    D.未对齐向量读取双精度浮点数
    答:————
35.[单选题] pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
    A.它调用线程函数时可直接传递,性能更优
    B.它需要预处理之后传递给线程函数
    C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
    D.没有特别用意
    答:————
36.[单选题] 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
    A.等于8
    B.小于8
    C.4到8之间
    D.等于4
    答:————
37.[单选题] 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
    A.肯定快于
    B.肯定慢于
    C.可能快于
    D.以上皆错
    答:————
38.[单选题] 在下面问题中,SIMD并行更适合____。
    A.搜索
    B.排序
    C.矩阵乘法
    D.构建二叉排序树
    答:————
39.[单选题] n个处理器、n个内存模块的交叉开关构造成本为____。
    A.O(logn)
    B.O(n)
    C.O(nlogn)
    D.O(n^2)
    答:————
40.[单选题] 执行pthread_rwlock_rdlock时,____的情况下加锁成功。
    A.已有一个线程上了写锁
    B.已有多个线程上了写锁
    C.已有多个线程上了读锁
    D.已有多个线程上了读锁和写锁
    答:————
41.[单选题] 传统科学和工程实验相对于计算机并行仿真的劣势不包括____。
    A.成本太高
    B.结果不准确
    C.时间太长
    D.太危险
    答:————
42.[单选题] 对于并行程序设计,下面说法错误的是____。
    A.天然具有复杂性
    B.算法移植困难
    C.软件开发标准环境发展相对之后
    D.不应发展这个方向
    答:————
43.[单选题] 两个矩阵相乘前将第二个矩阵转置,是使用利用数据访问的_____达到更高的cache命中率。
    A.时间局部性
    B.空间局部性
    C.计算局部性
    D.混合局部性
    答:————
44.[单选题] n个节点的二维mesh构造成本为____。
    A.O(logn)
    B.O(sqrt(n))
    C.O(n)
    D.O(nlogn)
    答:————
45.[单选题] SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A, B, 0x05)后,C中元素为
    A.A1 A2 B3 B4
    B.B1 B2 A3 A4
    C.A1 B2 A3 B4
    D.B1 A2 B3 A4
    答:————
46.[单选题] pthread_rwlock_wrlock是对读写锁进行____操作。
    A.加锁
    B.解锁
    C.加读琐
    D.加写锁
    答:————
47.[单选题] 下列指令集中___不是SIMD指令集。
    A.SSE
    B.Neon
    C.AVX
    D.EMT64
    答:————
48.[单选题] 有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
    A.SISD
    B.SIMD
    C.SPMD
    D.MIMD
    答:————
49.[单选题] 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
    A.创建和管理线程代码
    B.循环划分给线程的代码
    C.找出数据依赖的代码
    D.线程同步的代码
    答:————
50.[单选题] 下面哪种架构最适合数据并行____。
    A.SISD
    B.SIMD
    C.MISD
    D.MIMD
    答:————


页: [1]
查看完整版本: 21秋南开《并行程序设计》在线作业答案