早教吧作业答案频道 -->数学-->
矩阵乘法的优化比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
题目详情
矩阵乘法的优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
▼优质解答
答案和解析
如果A确实能完全存入一级缓存,那么把B按列分块,一块一块乘就行了.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
看了 矩阵乘法的优化比如说两个矩阵...的网友还看了以下:
已知单项式2m乘x的a次方与-5n乘x的2a-3次方乘y是关于x,y的单项式,且它们是同类项.1求 2020-06-03 …
单项式2m乘x乘a次方乘y与-5n乘x的2a-3次方乘y是关于x与y的单项式,且它们是同类项求(7 2020-06-03 …
已知单项式2m乘x的a次方与-5n乘x的2a-3次方乘y是关于x,y的单项式,且它们是同类项.1求 2020-06-03 …
选择一句乘法口诀可以写()A.两个乘法算式B.一道乘法算式C.两道加法算式 2020-06-27 …
指数运算的问题-=、a,b,c都是正数,且至少有一个不为1,a^x*b^y*c^z=a^y*b^z 2020-07-22 …
定义:设A、B是两个集合,则集合{(x,y)|x属于A,y属于B}称为A与B的乘积,记为A叉乘B定 2020-07-26 …
1、已知f(x)=3的x次方,求证:(1)、f(x)乘以f(y)=f(x+y)(2)、f(x)除以 2020-07-30 …
1.如果(a+1)²乘x²乘y的n-1次方是关于x、y的五次单项式,求n、a应满足的条件2.如果( 2020-07-31 …
a^x乘b^y乘c^z=a^y乘b^z乘c^x=a^z乘b^x乘c^y=1求xyz的关系答案是x=y 2020-11-07 …
X个数的平均值为a,Y个数的平均值是b,则这(X+Y)个数的平均值是多少? 2020-12-31 …