早教吧作业答案频道 -->数学-->
矩阵乘法的优化比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
题目详情
矩阵乘法的优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
▼优质解答
答案和解析
如果A确实能完全存入一级缓存,那么把B按列分块,一块一块乘就行了.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
看了 矩阵乘法的优化比如说两个矩阵...的网友还看了以下:
求教用excel计算,使得各种单价的数量相加后总数量为54,且数量乘以对应的单价后总金额金额为29 2020-03-31 …
某化工厂为了确定其生产的碳酸钠的含量某化工厂为了确定其生产的碳酸钠(含杂质)的等级,进行了如下分析 2020-05-14 …
某高中学校共有42个班级,每个年级都分为ABC三个层次的班级进行教学,其中A'7个班B14个班C2 2020-05-14 …
从本质上讲,国家是经济上占统治地位的阶级进行阶级统治的工具。(判断对错) 2020-05-16 …
下列关于“国家”的理解,正确的是()①国家维护统治阶级的政治统治和经济利益②社会性是国家的根本属性 2020-05-16 …
UNIX是最普遍使用的操作系统之一,下列说法正确的是A.UNIX系统的用户进程数目在逻辑上不受任何限 2020-05-24 …
UNIX是最普遍使用的操作系统之一,下列说法不正确的是A.UNIX系统的用户进程数目在逻辑上不受任何 2020-05-24 …
UNIX是最普遍使用的操作系统之一,下列说法不正确的是______。A.UNIX系统的用户进程数目在 2020-05-24 …
在一个单处理机中,若有6个用户进程,在非管态的某一时刻,处于就绪状态的用户进程最多有______个。 2020-05-26 …
在一单处理机中,若有5个用户进程,在非管态的某一时刻,处于就绪状态的用户进程最多有(37)个,最少 2020-05-26 …