Я нахожу встроенные -инструменты SLURM очень простыми. Вместо этого вы можете использовать что-то вроде htop
для мониторинга (запущенного )задания в режиме реального времени.
$ scontrol show job $JOB_ID | grep ' NodeList'
NodeList=<HOSTNAME>
ssh
в узел:$ ssh <HOSTNAME>
$ htop
Обычно это происходит из-за обрыва кабеля мыши или неисправности вилки. Мышь отключается и снова подключается. Он недоступен между этими двумя событиями, поэтому он может выглядеть нервным или ненадежным.
Вы можете проверить, так ли это, выполнив:
$ sudo tail -f /var/log/kern.log
и перемещая кабель или мышь. Если это приводит к переподключению, то проблема (аппаратная ).