Нагружает ли планировщик команда «наблюдать»?

У меня есть учетная запись в вычислительном кластере, который использует планировщик SLURM. У меня есть несколько заданий в очереди, и я использую команду «наблюдать», чтобы увидеть их статус:

watch squeue -u myUserName

Постоянное выполнение этой команды сильно нагружает планировщик?

0
25.05.2019, 21:19
2 ответа

Каждая командаsqueueзапускает RPC к демону управления Slurm(slurmctld). Это создаст нагрузку на управляющий демон, но, не зная мощности вашего контроллера или загруженности вашей системы, трудно сказать, насколько константа squeueповлияет на него.

Если у вас есть организация из 500+ пользователей, постоянно использующих watch "squeue -u $USER_NAME", то это создаст значительную нагрузку на систему по сравнению с тем, что вы запускаете ее только на мощной системе.

Лучше использовать время, если бы вы должны были правильно рассчитать время своей работы, так что, если вы знаете, что через x минут вы должны быть в состоянии completing, вы можете запустить что-то вроде sleep x; squeue -u $USER_NAME. Или даже сделайте еще один шаг и узнайте, как включить сообщения о статусе электронной почты -в свои задания, которые будут пинговать вас, когда определенная задача будет завершена или ваша работа достигнет определенного этапа. Командаwatchтакже настраивается для частоты ее запуска с использованием опции -n.

0
28.01.2020, 03:39

Всякий раз, когда вы просто смотрите другие задания и не хотите мешать, например, с top, или iostat, или systatили чем-то еще, всегда приятно использоватьnice:

nice watch squeue -u myUserName

Это запускает ваш процесс с пониженным приоритетом (по сравнению с уровнем приоритета по умолчанию ). Предполагая, что кластерные задания выполняются с нормальным приоритетом,nice-ing вашего процесса сообщает планировщику, что вы готовы принять только то свободное процессорное время, которое осталось после того, как все вышеперечисленные задания получили свое процессорное время.

Если вы делаете что-то с низким -приоритетом на сильно -загруженной машине, всегда важно:

$ nice bash -l

так что все, что вы делаете, выполняется с более низким приоритетом, чем "реальные задания", которые кластер уже выполняет.

0
28.01.2020, 03:39

Теги

Похожие вопросы