[整理]向量流水处理机教学讲义PPT课件.ppt

[整理]向量流水处理机教学讲义PPT课件.ppt

ID:62044348

大小:741.50 KB

页数:58页

时间:2021-04-13

[整理]向量流水处理机教学讲义PPT课件.ppt_第1页
[整理]向量流水处理机教学讲义PPT课件.ppt_第2页
[整理]向量流水处理机教学讲义PPT课件.ppt_第3页
[整理]向量流水处理机教学讲义PPT课件.ppt_第4页
[整理]向量流水处理机教学讲义PPT课件.ppt_第5页
资源描述:

《[整理]向量流水处理机教学讲义PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、向量流水处理机向量处理的基本概念向量流水处理机的结构提高向量流水处理机性能的方法2向量处理的基本概念从数学的概念上讲,标量是指单个量,而向量是指一组标量。例如,有一个数组A=(a1,a2,a3,…,an),其中括号内的每一个元素ai就是一个标量。而A称为向量,它由一组标量组成。一条向量指令可以处理N个或N对操作数。我们把这N个互相独立的数叫做向量,对这样一组数的运算叫做向量处理。因此,向量指令的处理效率要比标量指令的处理效率高得多。3纵向处理法向量计算是按列的方式自上而下纵向地进行。即先是所有B和C向量元素对的相加运算,中间结果暂存到k1~kN中;然后再

2、纵向加工所有对应元素的乘法运算。(b1+c1)(b2+c2)d1=a1×d2=a2×:dN=aN×(bN+cN)k1k2kN7纵向处理法用向量指令形式来表示,则变成:K=B+C   D=K×A只需要两条指令就能实现 VADDB,C,K VMULK,A,D显然,当采用流水方式计算时,数据相关在两条向量指令间仅有1次,而流水线加、乘功能的切换只需1次。因此,纵向处理方法可获得较高的吞吐率,适合于在向量处理机中应用。8纵横处理法当向量长度N大于向量寄存器长度n时,需要分组处理。分成k组,组内采用纵向处理方式,组间采用横向处理方式。分组方法:n=k*m+r

3、其中:m为每组长度,r为第k+1组剩余分量Bi+CiKi(1到m)Ki*AiDi(1到m)……Bi+CiKi(m+1到2m)Ki*AiDi(m+1到2m)……9纵横处理法每组用两条向量指令,每组发生相关两次,其中组内发生数据相关一次,组间切换时发生相关一次。主要优点:减少访问主存储器的次数 例如:中间变量K不写入主存储器10向量处理的基本概念向量流水处理机的结构提高向量流水处理机性能的方法11基本结构主存标量寄存器标量功能部件向量功能部件向量寄存器/向量缓冲器向量指令控制部件向量存取部件指令处理部件向量功能部件向量功能部件···控制部分:控制部件

4、和缓冲部件(中间REG)标量流水:功能部件和标量寄存器(S)向量流水:功能、存取部件和寄存器(V、VM、VL)向量流水处理机的结构12向量流水处理机的结构按向量元素和结果存放分M-M和R-R两类。存储器-存储器结构多个独立的存储器模块并行工作处理机结构简单对存储系统的访问速度要求很高寄存器-寄存器结构运算通过向量寄存器进行需要大量高速寄存器对存储系统访问速度的要求降低13存储器-存储器结构向量处理机的基本思想是把两个向量的对应分量进行计算,产生一个结果向量。参加运算的向量数据在存储器中,运算的结果也送到存储器中,其结构与数据流的示意图如下图所示。如果以向

5、量加法为例子:C=A+BABC流水线运算部件多端口存储系统一种能实现两个向量相加的流水结构的加法器14加法流水线部件M1M2M6AB1234C=A+Ba1b1M3M4M5c1M7M8A、B、C的向量长度为8,加法流水线分为4个功能段,主存储器采取了8个存储体多模块存储器系统的向量处理机15向量计算C=A+B的时空图假设一个存取周期等于两个时钟周期,并假设向量A、B、C各有8个,那么理想实现C=A+B向量计算的时空图如图所示。为了不发生读写冲突,各向量元素在存储模块中的位置是有意安排的。由于运算流水线分为4段,因此输入数据进入流水线4个时钟周期之后才能产生

6、相应的输出值。当数据充满后,流水线就一直处于忙碌状态。16功能部件4功能部件3功能部件2功能部件1存储体M8存储体M7存储体M6存储体M5存储体M4存储体M3存储体M2存储体M10123456789101112131415t12345678123456781234567812345678RB6RB6RA8RA8WC4WC4RB5RB5RA7RA7WC3WC3RB4RB4RA6RA6WC2WC2RB3RB3RA5RA5WC1WC1RB2RB2RA4RA4RB1RB1RA3RA3RA2RA2RA1RA1WC8WC8WC7WC7WC6WC6WC5WC5RB8R

7、B8RB7RB7C=A+B向量处理时序图17具有延迟缓冲器的向量流水线结构然而实际情况并非总和上述理想化的情况一样。假如结果向量C的第一个元素C1不是存放在我们想存放的模块M5而是在模块M6,那么将出现存储模块的读写冲突。为了消除争用存储器的现象,可在运算流水线的输入端和输出端增加可变延迟缓冲器,如图所示。 显然,有了输入输出缓冲器,可以实现向量操作无冲突地进行存储系统可变延迟器流水处理部件可变延迟器先启动读A,再启动读B,A延迟2个时钟进入加法器18寄存器--寄存器结构使主存有较高带宽的另一种方法是由一级或多级中间存储器形成一个层次结构的存储器系统,其

8、中带宽最高的这一级存储器安排在离处理器最近的位置。当处理器需要向量时,把向量从主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。