Отказ ядра с программным обеспечением RAID 1 должное к единственному диску считал ошибки

Попробовать ctrl+d это должно уничтожить оболочку.

4
21.10.2013, 23:43
1 ответ

1) Почему все перенесенные секторы были бы точно 8 независимо?

Такие разрывы в номерах секторов должны ожидаться, вопрос состоит больше в том, насколько большой те разрывы были бы (4k или больше). 8x 512 байтов являются 4k, который является размером сектора большая часть работы файловых систем с. Таким образом, файловая система, вероятно, запросила считать 4k из RAID, RAID спрашивает /dev/sdb для тех данных. Первый сектор того чтения сбои (это - номер сектора, который Вы видите в своих журналах), RAID переключается на /dev/sda и служит 4k оттуда. Затем запросы к файловой системе для чтения следующего 4k, назад к /dev/sdb с номером сектора +8, который перестал работать снова, который является снова, что Вы видите в своих журналах...

2) Почему ядро стало бы безразличным и потребовало бы перезагрузки?

Не должен обычно происходить. Проблема состоит в том, что ситуация с перераспределением о самом дорогом, которое можно получить. Каждое чтение, которое перестало работать, должно быть перенаправлено к другому диску, должен быть переписан на исходном диске, и т.д. Если это заполняет Ваш файл журнала одновременно, вызывая в свою очередь новые запросы записи, которые в свою очередь должны быть перераспределены снова и т.д. Было бы более дешево просто выгнать диск полностью в этом случае.

Это - также вопрос того, как остальная часть аппаратных средств (таких как контроллер SATA) обрабатывает сбойные диски. Если сам контроллер заболеет отклонением от него, то это повредит производительность еще больше.

Трудно сказать то, что произошло точно, если нет никакой записи в журнале; это - слабое место ядра Linux, нет никакого простого решения сохранить те последние сообщения, когда дела действительно идут на юг.

3) Почему был бы нечитабельные и офлайновые некорректируемые количества сбрасывать спустя только 23 часа после того, как пересинхронизация набега была завершена?

Некоторые значения обновляются только, когда Вы делаете офлайновый сбор данных (столбец UPDATED Offline), который может занять время. Если диск установлен сделать это автоматически, он зависит от диска, например, каждые четыре часа. Если Вы не хотите полагаться на диск, необходимо установить его использующий smartmontools.

2
27.01.2020, 21:00
  • 1
    "Не должно обычно происходить": За исключением того, что, в то время как я нахожусь в процессе замены этого диска, это произошло дважды теперь, и я полностью ожидаю, что это произойдет снова. То программное обеспечение RAID-1 Linux позволяет целой системе умереть вместо того, чтобы просто выгнать диск, действительно неутешительно. Спасибо за Ваши объяснения. –  Raman 07.11.2013, 17:24

Теги

Похожие вопросы