У меня есть учетная запись в вычислительном кластере, который использует планировщик SLURM. У меня есть несколько заданий в очереди, и я использую команду «наблюдать», чтобы увидеть их статус:
watch squeue -u myUserName
Постоянное выполнение этой команды сильно нагружает планировщик?
Каждая командаsqueue
запускает RPC к демону управления Slurm(slurmctld
). Это создаст нагрузку на управляющий демон, но, не зная мощности вашего контроллера или загруженности вашей системы, трудно сказать, насколько константа squeue
повлияет на него.
Если у вас есть организация из 500+ пользователей, постоянно использующих watch "squeue -u $USER_NAME"
, то это создаст значительную нагрузку на систему по сравнению с тем, что вы запускаете ее только на мощной системе.
Лучше использовать время, если бы вы должны были правильно рассчитать время своей работы, так что, если вы знаете, что через x минут вы должны быть в состоянии completing
, вы можете запустить что-то вроде sleep x; squeue -u $USER_NAME
. Или даже сделайте еще один шаг и узнайте, как включить сообщения о статусе электронной почты -в свои задания, которые будут пинговать вас, когда определенная задача будет завершена или ваша работа достигнет определенного этапа. Командаwatch
также настраивается для частоты ее запуска с использованием опции -n
.
Всякий раз, когда вы просто смотрите другие задания и не хотите мешать, например, с top
, или iostat
, или systat
или чем-то еще, всегда приятно использоватьnice
:
nice watch squeue -u myUserName
Это запускает ваш процесс с пониженным приоритетом (по сравнению с уровнем приоритета по умолчанию ). Предполагая, что кластерные задания выполняются с нормальным приоритетом,nice
-ing вашего процесса сообщает планировщику, что вы готовы принять только то свободное процессорное время, которое осталось после того, как все вышеперечисленные задания получили свое процессорное время.
Если вы делаете что-то с низким -приоритетом на сильно -загруженной машине, всегда важно:
$ nice bash -l
так что все, что вы делаете, выполняется с более низким приоритетом, чем "реальные задания", которые кластер уже выполняет.