Это попытается войти на все узлы и распечатать процессы пользователя1:
for hostList in $(sinfo -h | awk '{print $6}' | sort -u); do
for host in $(scontrol show hostname $hostList); do
echo $host; ssh $host "ps aux | grep user1";
done;
done;
Однако, поскольку вы, вероятно, не хотите входить в автономные узлы, расширьте команду sinfo до:
for hostList in $(sinfo -h | grep -v down | awk '{print $6}' | sort -u); do
Возможно, есть еще лучшие способы сделать это, лучше зная sinfo / scontrol, но этот сценарий должен справиться с этой задачей.
Однако, если это происходит часто, вы можете обсудить это со своими администраторами, так как потерянные процессы плохо влияют на производительность кластера в целом. В идеале они должны очищаться системой автоматически на регулярной основе.
Они должны быть взаимозаменяемыми.
Хорошее обсуждение, например,. ld
и gold
можно найти здесь:https://stackoverflow.com/questions/3476093/replacing-ld-with-gold-any-experience
Также проверьте это:https://stackoverflow.com/questions/29361801/is-the-lld-linker-a-drop-in-replacement-for-ld-and-gold
Есть также LLD из проекта LLVM, который обещает быть самым быстрым из всех.