本发明公开了一种基于龙芯3B的自适应矩阵乘法优化方法,先将龙芯3B的乘法矩阵和被乘矩阵按分块大小不大于二级缓存的原则划分成为两个子矩阵,利用龙芯3B芯片上的直接高速缓冲存储器存取器预取列长为M宽为K的乘法矩阵到高速缓冲区,同时将列长为K宽为N的被乘矩阵复制于二级高速缓冲区,用直接寄存器存取器从二级高速缓冲区中预取列长为l,宽为h的乘法矩阵以及长为h宽为g的被乘矩阵到寄存器,利用乘加指令完成乘加运算,通过访存状态收集模块获得信息并对分块参数M、K、N、l、h、g进行自适应调整,获得新的分块参数,从而实现龙芯3B平台上矩阵乘法运算的高效自适应优化。