关于矩阵求逆的问题

最近自己写了一些非参数估计的函数，发现在做模拟的时候，每当sample size取的比较大，函数中涉及到矩阵求逆的部分运行速度都会比较慢，我想提高模拟的运行效率，不知道大家有没有什么好的解决方案？

矩阵求逆本身就是一个时间复杂度大于 O(2.x) 的操作，没有什么更好的办法优化。做模拟的话，可以考虑换用速度更快的 BLAS，以及在更大的粒度上做并行。

回复第2楼的肖楠：谢谢版主，追问，在更大的粒度上做并行如何实现？

就是把不同次的求逆运算分配到不同的核上去做，可以在模拟这一层上实现，只需要并行起来就好了。不过这个和求逆本身的优化没什么必然联系，只是因为求逆速度确实太慢，所以外层的模拟可以尽量使用并行来做。

替换默认 BLAS 是一项重要优化，好的 BLAS 在矩阵求逆这一项速度可以提高接近 10 倍。

很久以前做的一个 benchmark：

另外一个可行的办法是，你可以看看公式，能否通过解方程组的方法避免掉直接矩阵求逆。

回复第4楼的肖楠：That's great[s:13]