《计算机系统结构》期末考试试卷(A) 一、单项选择题(每小题2分,共20分) 1. 对汇编语言程序员透明的是( )。
A. 指令寄存器 B.中断字寄存器 C.通用寄存器 D. 条件码寄存器 2. RISC不采用的实现技术是( )。
A.重叠寄存器窗口 B.以固件为主 C.优化编译 D.优化延迟转移
3. 对于浮点数,在字长和表数精度一定的条件下,尾数基值越大,表数效率( )。 A.变低 B.变高 C.不变 D.单调下降 4. 字节多路通道的“数据宽度”是( )。
A.单字节 B.双字节 C.定长数据块 D.不定长数据块
5. 在有通道处理机的I/O系统中,用户通过( )来向系统提出访问I/O设备的申请? A.通道指令 B.广义指令 C.无链通道指令 D.中断指令
6. 在先行控制技术的实现中,对主存储器操作优先级最高的部件是( )。 A.先行读数栈 B.后行写数栈 C.先行指令栈 D.先行操作栈
7. 在处理数据相关时,采用相关专用通道(旁路)技术,主要是解决( )相关。 A.RAW B.WAR C.WAW D.任何
8. 在页式虚拟存储器中,页面失效和页面争用有可能同时发生的条件是主存中的页面数( )。(注:下式中的p为主存地址中的实页字段)
A.大于2p页 B.等于2p页 C.小于2p页 D.不等于2p页 9. 在Cache-主存系统中,块冲突概率最高的地址映像方式是( )。 A.全相联映像 B.直接映像 C.组相联映像 D.段相联映像 10. 能够实现矩阵转置变换的单级互连网络是( )。 A.立方体 B.全混洗 C.PM2I D.交换 二、填空题(每小题2分,共20分)
1.在30MHz的标量处理机上执行一目标程序,设每条指令的平均CPI=1.9。其CPU速率为( )MIPS?
2.8位十六进制IEEE754单精度浮点数BE200000H,表示的十进制数为( )。 3.某I/O系统有两个选择通道,每个通道上都接有速率分别为500、450、600和500(KB/S)的四台设备。则I/O系统的实际流量为( )KB/S。
4.一模型计算机有7条指令,已知H=1.98,哈夫曼编码的平均码长L哈=2.05(位),信息冗余量约为( )%。5.某单体四字(每个字长32位)的存储器的访问周期为40ns,在不考虑任何冲突的情况下,其理想频宽为( )MB/S? 6.在N=16个处理器的单级互连网络中,当互连函数为PM2-2时,第9号处理器将与( )号处理器相连?
7.某用户的段页式虚拟存储器,虚地址中有2位段号、2位页号,则该用户共有( )个虚页?
8.一标量指令流水线,有“取指”、“译码”、“执行”和“写回”四个功能段,每段延迟分别为0.2、0.2、0.5、0.4(ns),流水线的最大吞吐率为( )MIPS?
9.在某页式虚拟存储器中,用散列变换方法实现对快表的访问。已知虚地址中的用户号为8位、虚页号为12位。快表有32行,每行1024位。那么,散列变换电路的输出位数应为( )位?
10.在CRAY-1型向量处理机上,设从存储器读数需6拍,打入寄存器需1拍,启动功能部件(包括存储器)需1拍。完成一个N=64的向量由存储器传送到某一向量寄存器所需要的总时间是( )拍?
三、(10分)有一字节多路通道连接磁盘,磁带,打印机三个设备,磁盘以20μs的间隔向控制器发DMA请求,磁带以25μs的间隔发DMA请求,打印机以40μs间隔发DMA请求。字节多路通道选择设备的时间为4.5μs,传送一个字节需要的时间为0.5μs。 (设起始时刻三个设备同时发出请求,且速率越快的设备优先级别越高)
(1)试问该通道能否正常工作? (2)画出通道工作时的示意图。 四、(10分)设某程序包含5个虚页,其页地址流为4,5,3,2,5,1,3,2,2,5,1,3。 (1)为获得最高的命中率,至少应该分配给该程序几个实页?其可能的最高命中率为多少? (2)假设在程序执行过程中每访问一个虚页,平均要对该虚页所在主存实页内的存储单元访问1024次,求访问主存存储单元的命中率。 五、(10分)在一个5功能段的流水线处理机上需经9△t才能完成一个任务,各段执行时间均为△t,任务处理过程对各段使用时间的预约表如下所示。 S1 S2 S3 S4 S5 T1 √ T2 √ T3 √ T4 √ √ T5 √ T6 √ T7 √ √ T8 √ T9 √ (1)画出流水线的状态有向图,并由状态图得出流水线的最优调度策略和最大吞吐率。 (2)按最优调度策略输入6个任务,求流水线的实际吞吐率、加速比和效率。 六、(10分)在64个处理器的STARAN 网络中,求: (1) 网络共有多少级?每级有多少个交换开关?
(2) 若将3号处理器连到第31号处理器,求级控信号。并说明各级开关的工作状态。 (3) 在(2)所求的级控信号下,31号处理器连到几号处理器? 七、(10分)分别计算下列两种情况下,在8个处理单元的双向环互连的并行处理机中,计
算点积 S= 所需要的时间:
(1)n=8; (2)n=16;
设相邻处理单元之间传送一次数据需要时间△t,完成一次加法需要时间2△t,完成一次乘法需要时间4△t。 八、(10分)某系统有3个部件可以改进其性能,且它们改进后的加速比分别为:30、20和10。
(1)如果部件1和部件2改进前的执行时间占系统的总时间的比例均为30%,那么部件3改进前的比例为多少时,才能使系统的加速比达到10?
(2)如果3个部件改进前的执行时间占系统总执行时间的比例分别为30%、30%和20%,那么改进后系统获得的加速比是多少?
《计算机系统结构》期末考试试卷(B) 一、填空题:(每空1分、共10分)
1.按照Flynn分类法,可将计算机系统分为四类。其中SIMD是指 计算机,MIMD是指 计算机。
2、RISC计算机实现的关键技术有 技术、采用流水和 技术、在逻辑上采用硬件实现为主和固件实现为辅的技术、采用优化编译技术。
3.在组相联的Cache 地址变换过程中,若E=6位、Q=4位、B=2位、W=7位,则块表的行
数为 行,每行有 位(二进制)。 4.有指令:
DEC R6 ;(R6)-1→R6 MUL R6,R7 ;(R6)×(R7)→R6
请指出以上两条指令间存在着 相关和 相关。
5.多级互连网络的三个关键技术是指 、 和控制方式。 二、单选题:(每小题2分、共20分) 1.自定义数据表示包括描述符和( )。
A、标志符数据表示 B、十进制数据表示 C、堆栈数据表示 D、向量数据表示 2.通过对浮点数尾数基值的分析,IEEE754浮点数中尾数基值采用的是( )。 A、二进制 B、八进制 C、十进制 D、十六进制
3.在CPU系统设计中,欲对ALU进行加速。经分析,已知ALU原运行时间占40%。并将ALU的速度提高到原来的10倍。则改进前后CPU的加速比是( )。 A、1.56 B、2.0 C、3.12 D、4.0。 4.非堆栈型的页面替换算法是( )。
A、FIFO B、LFU C、LRU D、OPT
5.一选择通道处理机上连接有速率分别为500、350、400和450(MB/S)的四台设备,则选择通道的实际吞吐率为( )(MB/S)。
A、500 B、350 C、1700 D、850
6.在页式虚拟存储器中,对于同一页地址流,当主存容量一定时,采用LRU替换算法,随着页面数的增加,主存命中率( )。
A、提高 B、降低 C、不变 D、至少不会下降
7. 在集中式总线控制方式中,分配速度最快、灵活性最好的控制方式是( )。 A、串行链接 B、计数查寻 C、定时查寻 D、独立请求
8.设一流水线由4个子过程组成,第1、3个子过程序时间为2Δt,第2个子过程序时间为3Δt,第4个子过程的时间为4Δt,则流水线每隔( )流出一结果。 A、Δt B、2Δt C、3Δt D、4Δt 9.在超标量超流水线中,每个时钟周期( )发送多条指令。
A、不同时发送 B、同时发送 C、分时发送 D、既同时又分时 10.当N=8时,蝶式函数的表达式为( )。 A)C)
B) D)
三、应用题:(共7题、共70分)
1. 将IEEE754单精度浮点数BFC00000H、C0A00000H转换成十进制数。(10分)
2.设一模型机有8条指令,它们的使用频度如下表所示。请设计出指令的Huffman编码和只有两种码长的扩展操作码编码,求其平均码长和信息冗余量。(已知H=2.35)(10分)
I1 I2 I3 I4 I5 I6 I7 I8 指令 使用频度 0.3 0.3 0.2 0.1 0.05 0.02 0.02 0.01 3.设主存的每个分体的存储周期为2us,每个分体的字长为4B,采用m个分体低位交叉编址。
由于各种原因,主存的实际频宽只能达到理想频宽的0.6倍,现要求主存实际频宽为4MB/S,问主存分体数应该取多少?(10分)
4.某处理机的指令字长为16位,有双地址、单地址和零地址指令三类,每个地址码长为6
位。如果双地址指令有15条,单地址和零地址指令的条数基本相同,那么单地址和零地址指令各有多少条?并为这三类指令分配操作码。(10分)
span style=\z-index:1; left:0px; margin-left:135.6667px; margin-top:29.2000px; width:429.0000px; height:97.0000px; \
5.有一浮点乘法流水线如下图所示。画出在该流水线上实行A×B×C×D运算的时空图,并求其实际吞吐率和效率。(10分)
6.已知有一非线性流水线的原始冲突向量为(10001101),试画出状态转移图,并求出平均延迟最小的最佳调度方案。(10分)
7.在CRAY-1型向量处机上,V为向量寄存器,长度为64;S为标量寄存器。所用浮点功能部件的执行时间分别为:加法需6拍,乘法需7拍,从存储器读数需6拍,求倒数近似值需14拍,打入寄存器需1拍,启动功能部件(包括存储器)需1拍。问下列各指令组中的哪些指令可以链接?哪些可以并行执行?说明 原因并分别计算各指令组全部完成所需的拍数。(10分)
(1) V0←存储器 ,V1←V2+V3,V4←V5×V6; (2) V3←存储器,V2←V0×V1,V4←V2+V3;
《计算机系统结构》期末考试(A)卷参考答案 一、单项选择题(每小题2分,共20分) A、B、B、A、B、B、A、B、B、B 二、填空题(每小题2分,共20分)
span style=\z-index:1; left:0px; margin-left:196.0000px; margin-top:15.5333px;
width:134.0000px; height:126.0000px; \1. 15.79
2. -5/32或-0.15625 3. 1200 4. 3.4 5. 400 三、(10分)(每小题5分) 解:(1)
通道的极限流量(2分)
通道的实际流量因为
,所以该通道能正常工作。(1分)
(2分)
(注:极限流量和实际流量都是近似值,如果相差不大则给全分)
(2)通道的工作示意图如下所示
span style=\z-index:1; left:0px; margin-left:28.0000px; width:463.0000px; height:141.0000px;
margin-top:0.0000px;
\
(此图是“示意图”,主要检查①每个设备的申请间隔;②每个申请的完成时间。如果①②都对则给5分;只有其中之一正确,则给3分;其它可酌情给分) 四、(10分)(7分+3分) 解(1)(7分)
(LRU法的堆栈处理过程略)至少应分配4个实页(4分) (注:如果过程不是堆栈处理则-2分,但不影响后面得分) 最高命中率H=7/12=58.3%(3分)
(2)单元的命中率H=(7×1024+5×1023)/12×1024=99.96%(3分) 五、(10分)(7分+3分) 解(1)(7分)
禁止表F=(8,4,3,1) (2分),初始冲突向量: C0=(10001101)(2分) 状态图如下:(2分)
(说明:有状态图,但不正确给1分;无状态图,此步不给分) 由此可得最佳的调度策略是(2,5),TPmax=1/3.5△t(1分) (2) (3分:每个结果得1分)
按最优调度策略输入6个任务,实际吞吐率: TP= 6/(9+2+5+2+5+2)△t =6/25△t 加速比 S= (6×9)△t / 25△t =2.16
流水线的效率= (6×9)△t / (5×25△t) = 0.432 六、(10分)(4+3+3分)
解(1)网络级数=log264=6,每级的开关数=64/2=32个。(4分) (2) PE3的二进制地址:000011 PE31的二进制地址: 011111
000011 ⊕ 011111 =011100 级控信号为K5 K4 K3 K2 K1 K0=011100;(结果正确给3分) (或直接说明:“K2、K3和K4级开关为交叉,其它为直连”,也给3分) (4)31号处理器连到3号处理器。(3分) 七、(10分)(每小题5分)
武汉大学计算机学院2004级系统结构试卷



