• Регистрация

1,060 вопросов

1,418 ответов

1,278 комментариев

8,702 пользователей

Добро пожаловать на Ubuntu Ответы, где вы можете задать вопросы и получить ответы от других пользователей сервиса.

На работающем сервере диск переводится в RO

0 голосов

Добрый день.

Есть сервер Ubuntu 14.04.3 LTS (GNU/Linux 3.19.0-43-generic x86_64), 2 SATA HDD на одном раздел / , на втором только /home. Диск с  /home 2014 года выпуска. 

На сервере стоят различные небольшие сервисы (web, backup), и работает 24/7. В последнее время, примерно с конца ноября стал замечать , что OS переводит этот диск в режим RO. После перезагрузки все работает, до нового перевода в RO. Сегодя при перезагрузки система не смогла определить HDD и соответственно не смогла загрузить /home и предложила мне продолжить без него, нажав на S. Подождал, пока загрузится, погасил сервер, на всякий случай поменял БП и шлейфы. в БИОСе диск определися корректно, запускаю систему - грузится минут 20. Загрузился, диск определился и подмонтировался корректно.

На всякий случаю полностью обновил систему, Обновились "grub-common, grub-pc, grub-pc-bin, grub2-common, libgnutls-openssl27, libgnutls26, libpng12-0, owncloud, owncloud-config-apache, owncloud-server"на всякий случай запустил еще dist-upgrade, дополнительно обновились "linux-generic-lts-vivid, linux-headers-generic-lts-vivid, linux-image-generic-lts-vivid".

Извините, что логи картинками иначе я привышаю  лимит в 8к символов.

После обновлений запустил:

Запускаю тестирование:

Дожидаюсь и запускаю:

Т.е. ошибок на диске не нашли.

Запустил расширенный просмотр:

Да, вроде все нормально.

На всякий случай проверяем время (один раз такое было.)

Время стоит корректное и синхронизируется.

Проверяем FS

А вот тут я не понял. что означает 0,1%. Он что-то нашел и исправил, если да, то что?

И вообще можно как-то еще посмотреть, почему OS внезапно переводит диск в режим RO? Скачков напряжения нет, электричество не вырубали (на сколько мне известно). Я даже как-то в смятении немного.

Вопрос Jan 11, 2016 от susnake Профессионал (1,090 баллов) в категории Серверные системы
   

1 ответ

+1 голос
 
Лучший ответ
Хотя ваш смарт тест не показал проблем, если файловая система перелючается в read-only, это означает что скоро умрет жесткий диск. Скорее всего аппаратные проблемы с хардом. Делайте бекап, меняйте диск...
Ответ Jan 12, 2016 от and3001 Гуру (23,620 баллов)
selected Jan 12, 2016 от susnake

Но проблема в том, что в СЦ запустят смарт-тест, он напишет, что все ОК и тупо пошлют. Я и хотел выяснить можно ли узнать еще где-то в логах почему переводит система диск в РО?

Может в syslog или kern.log где-то это указано, но я не знаю по каким параметрам смотреть.

Например в kern у меня много строк выделено красным, типа:

Jan 11 09:56:41  kernel: [    0.642705] ACPI PCC probe failed.

Jan 11 09:56:41  kernel: [    8.261725] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
Jan 11 09:56:41  kernel: [    8.723782] EXT4-fs (sda3): mounted filesystem with ordered data mode. Opts: (null)
Jan 11 09:56:41  kernel: [    8.966530] EXT4-fs (sda2): mounted filesystem with ordered data mode. Opts: (null)
Jan 11 09:56:41  kernel: [   23.151421] EXT4-fs (sdb1): mounted filesystem with ordered data mode. Opts: errors=remount-ro

Jan 11 09:58:14  kernel: [  117.312080] ata4.00: failed command: WRITE DMA EXT
Jan 11 09:58:14  kernel: [  117.312106] ata4.00: cmd 35/00:08:f8:0e:85/00:00:71:00:00/e0 tag 0 dma 4096 out
Jan 11 09:58:14  kernel: [  117.312106]          res 51/84:08:f8:0e:85/84:00:71:00:00/e0 Emask 0x30 (host bus error)
Jan 11 09:58:14  kernel: [  117.312168] ata4.00: status: { DRDY ERR }
Jan 11 09:58:14  kernel: [  117.312187] ata4.00: error: { ICRC ABRT }
Jan 11 09:58:14  kernel: [  117.312211] ata4: soft resetting link
Jan 11 09:58:14  kernel: [  117.492321] ata4.00: configured for UDMA/33
Jan 11 09:58:14  kernel: [  117.492335] sd 3:0:0:0: [sdb] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jan 11 09:58:14  kernel: [  117.492338] sd 3:0:0:0: [sdb] Sense Key : Aborted Command [current] [descriptor]
Jan 11 09:58:14  kernel: [  117.492342] sd 3:0:0:0: [sdb] Add. Sense: Scsi parity error
Jan 11 09:58:14  kernel: [  117.492344] sd 3:0:0:0: [sdb] CDB:
Jan 11 09:58:14  kernel: [  117.492346] Write(10): 2a 00 71 85 0e f8 00 00 08 00
Jan 11 09:58:14  kernel: [  117.492354] blk_update_request: I/O error, dev sdb, sector 1904545528
Jan 11 09:58:14  kernel: [  117.492388] EXT4-fs warning (device sdb1): ext4_end_bio:317: I/O error -5 writing to inode 59506692 (offset 0 size 0 starting block 238068192)
Jan 11 09:58:14  kernel: [  117.492392] Buffer I/O error on device sdb1, logical block 238067935

 

 

Но я, к сожалению не могу понять относится ли это к диску или нет.

Да, эти сообщения напрямую относятся к интерфейсу обмена данными с жестким диском. Вот здесь указано что проблемы с протоколом прямого доступа к памяти контроллера жесткого диска (DMA, Direct Memory Access):

Jan 11 09:58:14  kernel: [  117.312080] ata4.00: failed command: WRITE DMA EXT

Кстати, проблема может быть не в жестком диске, а с материнской платой. Потому smart анализ ничего не показал. 

Спасибо.

Я заменил шлейфы, еще до того как написать вопрос, вроде пока еще работает.

Значит предположение, что проблема не в диске была верной.

Благодарю.
...