大家都知道 Intel 在 12 代 CPU 开始引入了性能核心 (P核) 和能效核心 (E核) 的概念,苹果也在 M1 开始使用了类似的架构。
我的问题是,这种架构设计是否会影响并行计算的效率?对于高度并行的任务是否应该做任何特别的设置?以 R 中的 Future 框架支持的 multisession
和 multicore
这类常用的简单执行策略为例。
搜索了一下,网上有些讨论,包括 OpenMPI,但感觉并没有很详细的测试和确定的结论,而且经常一上来就引入调整 CPU affinity 这种底层参数,觉得有点超出我的认知水平。