felix_lee 最近自己写了一些非参数估计的函数,发现在做模拟的时候,每当sample size取的比较大,函数中涉及到矩阵求逆的部分运行速度都会比较慢,我想提高模拟的运行效率,不知道大家有没有什么好的解决方案?
nan.xiao 就是把不同次的求逆运算分配到不同的核上去做,可以在模拟这一层上实现,只需要并行起来就好了。不过这个和求逆本身的优化没什么必然联系,只是因为求逆速度确实太慢,所以外层的模拟可以尽量使用并行来做。 替换默认 BLAS 是一项重要优化,好的 BLAS 在矩阵求逆这一项速度可以提高接近 10 倍。 很久以前做的一个 benchmark: http://www.road2stat.com/cn/r/optimize.html