Отслеживание / мониторинг недолговечных процессов, интенсивно загружающих процессор, на одном процессоре

Linux может работать и лучше — в ядре есть параметр командной строки для проверки всей памяти как части последовательности загрузки и блокировки плохих блоков — по необходимости это добавит несколько минут к вашей последовательности загрузки, где коробка не отвечает. (флаг memtest=n — см. https://www.kernel.org/doc/Documentation/admin-guide/kernel-parameters.txt)

Как только вы узнаете, где находятся плохие блоки, вы можете скажите linux избегать их с помощью флага badram=.

Существует также онлайн тестер для проверки памяти (man memtester), и у вас также есть прямое окно в ваш IPMI (который должен помечать любой бадрам на любом полуприличном сервере – на моих серверах Intel любой ipmi- обнаруженные ошибки ECC были записаны в системный журнал)

1
29.03.2016, 04:18
0 ответов

Теги

Похожие вопросы