Если бы Ваш сценарий умирает и просто ронял бы к оболочке, можно использовать сценарий обертки для каждого экземпляра:
while [ 1 == 1 ] ; do /path/to/script ; done
или Вы пишете некоторую обертку, которая разветвляет сценарии и использование wait/waitpid
поймать мертвые процессы.
Вы могли использовать что-то как Munin или Cacti для контроля хостов через snmp. Вы могли выполнить его на одном хосте, который периодически проверяет хосты и представляет Вас веб-страница.
Если Вы хотите контролировать и автоматически предупредить Вас, Вы могли бы использовать что-то как nagios.
Nagios является мощной системой контроля, которая позволяет организациям определить и разрешить проблемы инфраструктуры ИТ, прежде чем они будут влиять на критические бизнес-процессы.
Функции (с веб-сайта Nagios)
Может быть загружен непосредственно отсюда.
cron
задание, которое собрало бы информацию, Вы нуждаетесь и отправляете их по почте Вам (возможно зашифрованный)
сценарий оболочки, который соединяется с рассматриваемыми машинами через ssh
(основанная на ключе аутентификация), выполняет команду и передает его по каналу в файл на Вашей машине, предупреждая Вас, если что-то неожиданное происходит.