早教吧作业答案频道 -->数学-->
矩阵乘法的优化比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
题目详情
矩阵乘法的优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
▼优质解答
答案和解析
如果A确实能完全存入一级缓存,那么把B按列分块,一块一块乘就行了.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
看了 矩阵乘法的优化比如说两个矩阵...的网友还看了以下:
O、A、B、C为空间四个点,又OA、OB、OC为空间的一个基底,则()A.O、A、B、C四点不共线 2020-05-14 …
分解因式(a-b-c)(a+b-c)-(b-c-a)(b+c-a)正确答案是这个:(a+b-c)( 2020-05-17 …
A在最上面压着B,B又压着C,C在地面上,水平.A重0.1kg,B重0.2kg,C重0.3kg.向 2020-06-05 …
谢谢天才们.我要有条理且详细的解答.某人用温度计量体温,一看是38°C,忘甩了.后来他的体温降至3 2020-06-17 …
英语翻译摘要:声乐艺术是音乐与语言的完美结合,语言是声乐的重要组成部分.欣唱的语言可以说是声乐的灵 2020-06-24 …
下列说法中不正确的是()A.σ键比π键的电子云重叠程度大,形成的共价键强B.s-sσ键与s-pσ键 2020-07-07 …
下列说法中不正确的是()A、σ键比π键的电子云重叠程度大,形成的共价键强B、s-sσ键与s-pσ键 2020-08-01 …
同济6版高数上册P310页正文倒数第五行括号中说C=正负e的C1次方,但c=O不也是方程的通解吗?. 2020-11-28 …
下面句子中成语使用有误的是[]A、中华民族是一个优秀的民族,心胸宽广,忍辱负重,但决不任人宰割。B、 2020-12-06 …
关于充要与必要条件的题目a是b的必要条件,b是d的充要条件,由d不可以推出c,但c可以推出d,c可以 2021-01-13 …