Проверьте использование ЦП / потоков для узла в диспетчере заданий Slurm.

  • / dev каталог содержит специальные файлы ( файлы устройств ), соответствующие физическим устройствам или системным компонентам.

  • / media - это обычный каталог, который обычно используется для монтирования съемных носители, такие как CD-ROM, дискеты и т. д.

  • / mnt - это обычный каталог, который по обычной практике используется для монтирования других файловых систем, обычно на короткий период времени

  • / dev важен для операционной системы и не может быть удален

    / media и / mnt - это только каталоги-заполнители; их удаление не повлияет на работу ядра операционной системы, но может вызвать ошибки в некоторых приложениях; например, когда вставлен съемный носитель или когда процесс пытается смонтировать файловую систему.

    В качестве примера различия: / dev содержит ссылку на физический привод CD-ROM, / mount может содержать подкаталог, через который вы можете получить доступ к файлам, хранящимся на диск вставлен в тот же привод CD-ROM.

3
26.07.2017, 21:08
2 ответа

Прошло несколько лет с тех пор, как я управлял кластером трущоб, но squeueдолжен дать вам то, что вы хотите. Попробуйте:

squeue --nodelist 92512 -o "%A %j %C %J"

(который должен предоставить ваш идентификатор задания, имя задания, процессор и потоки для ваших заданий на узле 92512)

Кстати, если вам не нужны сведения только об одном конкретном узле, возможно, вам лучше искать по идентификатору задания, а не по идентификатору узла.

Существует множество хороших сайтов с документацией по использованию slurm, доступных в Интернете, которые легко найти через Google -большинство университетов и т. д., использующих кластер высокопроизводительных вычислений, пишут свои собственные документы, справку и «шпаргалки» -, адаптированные к деталям их конкретного кластера (s )(, поэтому примите это во внимание и адаптируйте любые примеры к ВАШЕМУ кластеру ). Также есть хорошая общая документация по использованию slurmв https://slurm.schedmd.com/documentation.html

.
1
27.01.2020, 21:35

Я нахожу встроенные -инструменты SLURM очень простыми. Вместо этого вы можете использовать что-то вроде htopдля мониторинга (запущенного )задания в режиме реального времени.

  1. Найти, на каком узле выполняется задание:
$ scontrol show job $JOB_ID | grep ' NodeList'
   NodeList=<HOSTNAME>
  1. sshв узел:$ ssh <HOSTNAME>
  2. При необходимости запустите программу мониторинга, например,.$ htop
3
27.01.2020, 21:35

Теги

Похожие вопросы