Это маловероятно, но, возможно, кто-то сможет помочь. Я использую модель (SWAN) в Windows 10. Я использую версию MPI с использованием MPICH2 (1.4.1p1).

У меня есть два узла NUMA по 36 ядер в каждом. По какой-то причине я не могу запустить модель на всех 72 ядрах.

Я запускаю модель, используя mpiexec -n <np> swan.exe или swanrun inputfile <np>. Если я укажу mpiexec -n 72, модель запустит 72 процесса, но использует только 36 ядер одного узла. Даже если я запускаю 2 или более моделей одновременно, они работают на одном узле, оставляя 36 ядер в значительной степени простаивающими.

Я предполагаю, что сделал ошибку при установке MPICH2, но пока не могу понять, где я ошибся. Я просто установил MPICH2, используя предоставленный здесь двоичный файл (http://www.mpich.org /static/downloads/1.4.1p1/) Есть ли какой-то вариант, который я упустил, где мне нужно установить его для обоих узлов отдельно?

2
Hawky 3 Янв 2018 в 09:48

1 ответ

Лучший ответ

Покопавшись, я понял, что на моем компьютере установлено несколько версий MPI. Хотя я до сих пор не уверен, почему моя модель будет работать только на одном из узлов NUMA за раз (я не уверен, какая версия MPI mpiexec вызывала), я удалил все версии MPI и сделал чистую переустановить. Теперь я могу работать на всех 72 ядрах.

1
Hawky 9 Янв 2018 в 02:50