Аппаратная ошибка паники ядра - какие аппаратные средства ответственны?

Во всей честности я только что настроил основанную на ключе аутентификацию, отключите аутентификацию по паролю и не беспокойство о людях, пугающих ручку двери. Если Вы сохраняете свой секретный ключ, секрет, все будут хорошо. Этот вопрос подходит много, и во многих случаях он мотивирован озабоченностью по поводу помехи в файлах журнала; в то время как это является раздражающим, это - также демонстрация, что Ваша политика безопасности работает.

При реальной необходимости в sshd, чтобы быть видимыми только к ноутбуку, Вы могли бы создать OpenVPN между ним и сервером и затем настроить sshd так, чтобы он связал с интерфейсом бочки/касания а не с физическим. Но затем Вы шифруете весь свой трафик дважды, который походит на трату энтропии мне.

3
12.09.2013, 16:21
4 ответа

Да, это - аппаратная проблема, главным образом из-за кольцевого буферного вывода, который говорит, [Hardware Error].

Я подозревал бы системную плату, сокет ЦП или ЦП...

У Вас есть какие-либо детали об аппаратных средствах? Что следующее представляет отчет в виде строки?

dmidecode -t 1 -t 3 -t 4 | egrep '(Manufacturer|Product|Serial|Socket|Version)'
2
27.01.2020, 21:23

Похож у Вас есть ошибки RAM. Можно проверить это путем выполнения memtest86.

Кроме того, если Вам установили mcelog пакет, проверьте/var/log/mcelog для получения дополнительной информации.

Я рекомендовал бы переместиться в материнскую плату класса сервера, которая может обработать RAM ECC.

1
27.01.2020, 21:23
  • 1
    я выполнил memtest86 +, он не возвратил ошибок. Теперь, что? –  MERM 13.09.2013, 23:58

Я только что столкнулся с этой ошибкой на Dell XPS 420 Core2 Quad Q6600

У этой машины в прошлом были проблемы с дыханием от предыдущих владельцев, она была очень грязной внутри (курильщики) и нагревалась до точки случайной перезагрузки. . Я не уверен, как долго это продолжалось.

Я зашел в BIOS и отключил 2 ядра на процессоре, и теперь все вроде работает нормально - похоже, что процессор настолько перегрелся, что фактически сгорело 2 (или 1, поскольку я могу отключить только 2) ядра. .

Машина теперь отлично работает как двухъядерный.

0
27.01.2020, 21:23

Я вижу Исключение проверки компьютера . Это означает, что ЦП обнаружил проблему.

Для MCE достаточно просто прочитать данные из кеша, увидеть ошибку ECC и повторить попытку. Подобные ошибки случаются время от времени. (Вот почему ЦП повторяет попытку ограниченное количество раз).

В вашем случае мы также видим:

Data Cache Error: Data/Tag DWR error.
cache level: L1, tx: DATA, mem-tx: DWR

Это ошибка с кешем первого уровня (который находится рядом с ядром ЦП и на том же кристалле). Это не ошибка основной памяти.

Остальной транскрипт показывает несколько ошибок, некоторые одного типа, но не всегда с одним и тем же ядром. На этом этапе я бы начал беспокоиться, что процессор выходит из строя. Первое, что нужно проверить, - не перегревается ли процессор.

Как определить, какое оборудование вызывает проблему? (или это программное обеспечение)

Ошибки MCE часто бывают аппаратными. Что, похоже, соответствует полученным вами ошибкам.


Если у вас есть запасной процессор, попробуйте его.

В противном случае убедитесь, что система должным образом охлаждается, и контролируйте температуру с течением времени.

Если вы еще этого не сделали, установите mcelog и подготовьте эту статью в Википедии .

0
27.01.2020, 21:23

Теги

Похожие вопросы