• Регистрация

1,110 вопросов

1,476 ответов

1,315 комментариев

8,885 пользователей

Добро пожаловать на Ubuntu Ответы, где вы можете задать вопросы и получить ответы от других пользователей сервиса.

Ошибка после смены дисков и установки RAID 1

0 голосов
Добрый день

помогите разобраться проблема такая:

Сервер: HP DL145 G2 2x Dual Core 2.4Ghz 16GB RAM 1U SATA Server 2x500GB

Стояли 250x250G винты работал без проблем, сменил винты на 2 по 500GB новые поставил RAID 1 и обнаружил что они начали ошибку показывать.
Code:
Message from syslogd@unn-95-168-193-190 at Apr 29 12:45:50 ... kernel:[Hardware Error]: MC4_STATUS[-|CE|-|-|AddrV|CECC]: 0x943b410041080a13 Message from syslogd@unn-95-168-193-190 at Apr 29 12:45:50 ... kernel:[Hardware Error]: Northbridge Error (node 1): DRAM ECC error detected on the NB. Message from syslogd@unn-95-168-193-190 at Apr 29 12:45:50 ... kernel:[Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-pro c: RES (no timeout) Message from syslogd@unn-95-168-193-190 at Apr 29 13:03:20 ... kernel:[Hardware Error]: MC4_STATUS[-|CE|-|-|AddrV|CECC]: 0x943b410041080a13 Message from syslogd@unn-95-168-193-190 at Apr 29 13:03:20 ... kernel:[Hardware Error]: Northbridge Error (node 1): DRAM ECC error detected on the NB. Message from syslogd@unn-95-168-193-190 at Apr 29 13:03:20 ... kernel:[Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-pro c: RES (no timeout)

Хотя сервер не падает все работает. Как можно решить эту проблему?
Вопрос Apr 29, 2012 от Roby Новичок (180 баллов) в категории Серверные системы
Редактирование Apr 29, 2012 от sir_mcnellan
   
Обратите внимание, ваша проблема обсуждалась тут: http://serverfault.com/questions/334065/linux-hardware-error-message-from-kernel
Память нужно менять.
Спасибо за информацию попробую это сделать а как тогда обьяснить то что когда были винты по 250GB все работало без сбоев?  

Я вот еще тут почитал что сервер http://www.proliant.ru/catalog/servers/DL/servery_snjatye_s_proizvodstva/hp_proliant_dl145_g2.html

поддерживает накопители
Накопители 80 GB, 160GB, 250GB SATA 7200 1"HDD, 36GB 15K HDD, или 36GB 15K, 72GB 10K, 146GB 10K SCSI HDD (все – non-Hot Plug)

может быть он не поддерживает 500GB накопители?
Человек, который разбирал ваш сервер не позаботился о защите от статического электричества. Случайно задел планку памяти и прошел разряд, вот и все. По поводу жестких дисков - они тут непричем.
то есть получаеться спалил плату?
Во-первых, почему же сразу "спалил" ? Сервер ведь работает :)
Во-вторых, не факт что виноват человек, статикой могло пробить еще как то. Может скачек напряжения был после включения сервера и т.п. Но факт налицо - память нужно менять.
ок щас сделаю тест напишу тогда что опказал я так понимаю, если что то не то с памятью то должны быть ошибки указаны?
а может такую проблему смена батарейки в биосе вызвать?
Это и указано: "DRAM ECC error detected"
Добрый день, поменял память и плату материнскую, проблема осталась. Разве такое может быть?
Ну что делать, значит согласно методу исключения нужно заменить и процессор.

1 ответ

0 голосов
Добрый день. У вас проблема не с жесткими дисками и не с RAID контроллером, а с памятью. Как видно из сообщений syslog, ошибки в модуле оперативной памяти и северном мосте (north bridge) материнской платы. Вам необходимо остановить сервер и запустить memtest. По результатам теста станет понятно что следует заменить - память или же материнскую плату вместе с памятью.
Ответ Apr 29, 2012 от sir_mcnellan Ветеран (9,210 баллов)
сейчас сделаю тест проверю но до этого вроде все ок было... может быть винт как то ошибку дают или может в биосе что то не так? Так как я еще поменял батарейку на сервере...в биосе может что дернул не так?
Биос тут ни при чем.
...