mpirun signal 9 (killed) Ошибка распределения памяти

Одна из самых трудноустраняемых ошибок
Администратор
Андрей Столяров
Медаль
Сообщений: 240
Санкт-Петербург
13 дней назад
Перевод материалов из документации:

mpirun signal 9 (killed)
Ошибка распределения памяти.
Решателю не удалось выделить память для анализа.

Строго говоря, нужно выбрать более крупную машину с меньшим количеством вычислительных ядер.

Эта ошибка возникает когда симуляция с большой сеткой была назначена машине с недостаточными ресурсами памяти.

Что можно сделать?
Вы можете выбрать более крупную машину для анализа:
Под машины с большим количеством ядер, как правило, выделяется больше памяти. Например, для сетки с более чем миллионом узлов, назначение анализа на 1,2 или 4 ядра при управлении имитацией, вероятно, приведет к ошибке выделения памяти. Попробуйте назначить не менее 8 ядер.

Увеличьте соотношение ОЗУ на процессор:
Если используется решатель линейного уравнения, это MUMPS или PETSC. Некоторые линейные решатели распараллеливаются таким образом, что ограничивающим фактором для потребления памяти является не общая доступная память устройства, а доступная память для каждого вычислительного ядра. Чтобы увеличить это, вы можете уменьшить количество ядер, используемых для вычисления, при подробных настройках количества вычислительных ядер.

Используйте встроенную функциональность памяти:
Если вы используете решатель уравнения MUMPS, вы можете активировать внешнее управление памятью в подробных настройках. Это позволяет оптимизировать управление памятью для минимального использования ОЗУ, но скорость вычислений будет уменьшена, так как некоторые данные записываются на жесткий диск.

Измените решатель уравнений:
Если вы используете прямой решатель, такой как MultFront, MUMPS или LDLT, и ни один из вышеперечисленных параметров не работает, вы можете попробовать переключиться на итеративный решатель, такой как PETSC или GCPC. Итеративные решатели обычно используют гораздо меньше памяти, чем прямые решатели, но в некоторых случаях они могут быть неустойчивыми.
|
Перейти на форум:
Быстрый ответ
Чтобы писать на форуме, зарегистрируйтесь или авторизуйтесь.