在我的不懈努力之下,我终于卡过去力!!!
传参,赋值,取址优化基本都加齐了(矩乘内部的取址优化可能会负优化,因为本身内存池就不大)。
如果你在卡常的话,不妨试试以下几个方法:
将每个点的信息单独用一个类放在一起,或者说将代表点的下标放在二维数组的前面,提高内存命中率。
函数内部能引用就引用,减少赋值次数,其中乘法还可以写在某一个内部再减少一次传参。
乘法重载时暴力展开。