Я думаю, проблема в том, что у вас снова auto ens33 вместо auto ens33: 0 во второй строфе. В настоящее время ваша конфигурация должна позволять вам выполнить ifup ens33: 0 , чтобы запустить его вручную.
Для мониторинга/восстановления контроля над «нестабильным»/зависшим сервером я бы посоветовал использовать аппаратное обеспечение или, если это не удается, программный сторожевой таймер; в Debian вы можете установить его с помощью:
sudo apt-get install watchdog
Затем вы редактируете /etc/watchdog.conf
и добавляете пороги или тесты; по моему мнению, сторожевой таймер также активируется таким образом, что если ядро не видит его в течение некоторого времени, оно перезагружается. например если программная подпрограмма не общается в фиксированное время с /dev/watchdog0
или чем-то подобным.
Например, вы можете определить пороги нагрузки в /etc/watchdog.conf
:
max-load-1 = 40
max-load-5 = 18
max-load-15 = 12
Имейте в виду, что некоторые платы/чипсеты поставляются со встроенными сторожевыми таймерами; если я не ошибаюсь, Arm A20 — один из них.
От man watchdog
Ядро Linux может перезагрузить систему, если возникнут серьезные проблемы. обнаружено. Это может быть реализовано с помощью специального сторожевого устройства или через чуть менее надежный программный сторожевой таймер внутри ядра. В любом случае должен быть демон, сообщающий ядру система работает нормально. Если демон перестанет это делать, система перезагрузить.
сторожевой пес — такой демон. Он открывает /dev/watchdog и продолжает писать в достаточно часто, чтобы ядро не сбрасывалось, по крайней мере, один раз за минута. Каждая запись откладывает время перезагрузки еще на одну минуту. После минута бездействия аппаратного сторожевого таймера вызовет сброс. В в случае программного сторожевого таймера возможность перезагрузки будет зависеть от состояние машин и прерываний.
Демон сторожевого таймера может быть остановлен без перезагрузки, если устройство /dev/watchdog закрыто корректно, если только ваше ядро не скомпилировано с включенной опцией CONFIG_WATCHDOG_NOWAYOUT.
см. также Raspberry Pi и Arduino: создание надежных систем с помощью сторожевых таймеров