[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

OT: un error lógico (Gnu/Linux+filesystem)de disco puede producir sectores defectuosos?



    Hola
    Esto esto esta mas asociado mas a un tema de harddisk+Gnu/Linux
que a Debian, pero como de nuevo necesito de su experiencia aquí estoy
escribiendo otro OT.

    Tengo un Disco (SAMSUNG HD103SJ de 1TB) que coloque "casi-nuevo"
en un servidor (HP DL120 G5), a las 3 semanas el disco fallo con
errores de sectores que no se podían leer (end_request: I/O error) y
el disco dejo de estar disponible (el fdisk mostraba el disco sin
particiones y /dev/xxx no respondía al mount). Para hacer que vuelva
andar se tuvo que reiniciar el servidor.
    Me puse a analizar el disco (en otro equipo) y no encontré errores
de smart, ni sectores  reallocated, según smart el disco esta OK.
también corrí badblocks -wsv /dev/xxx. y no encontró errores.
    Los checkeos que hice dan entender que el disco esta bien, pero me
sale la duda si este tipo de problemas puede ser producto de algún
error lógico/kernel/etc o algún problema de la controladora de disco.
    Este disco (SAMSUNG HD103SJ de 1TB) lo coloque en el servidor como
remplazo de otro que tuvo un comportamiento similar, solo que el disco
anterior si estaba dañado, con sectores reasignados y fallaba con
badblocks.

    Y mi pregunta es si este tipo de errores puede ser producido por
errores lógicos (algún bug del kernel o del filesystem)?
    o tendría que pensar en algún problema de hard del servidor?



filesystem del disco:  reiserfs
Errores dmesg
		Nov 26 00:42:05 bcs kernel: [2120549.696037] ata2.00: status: { DRDY }
		Nov 26 00:42:11 bcs kernel: [2120555.536086] ata2.00: link is slow
to respond, please be patient (ready=0)
		Nov 26 00:42:15 bcs kernel: [2120559.736158] ata2.00: SRST failed (errno=-16)
		Nov 26 00:42:21 bcs kernel: [2120565.572252] ata2.00: link is slow
to respond, please be patient (ready=0)
		Nov 26 00:42:25 bcs kernel: [2120569.772318] ata2.00: SRST failed (errno=-16)
		Nov 26 00:43:13 bcs kernel: [2120617.709165] ata2.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
		Nov 26 00:43:13 bcs kernel: [2120617.709170] ata2.00: failed command: SMART
		Nov 26 00:43:13 bcs kernel: [2120617.709175] ata2.00: cmd
b0/d0:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
		Nov 26 00:43:13 bcs kernel: [2120617.709176]          res
40/00:02:08:08:00/00:00:00:00:00/b0 Emask 0x4 (timeout)
                ...
                ...
		Nov 26 06:14:16 bcs kernel: [2140480.206924] Buffer I/O error on
device sdb1, logical block 98234685
		Nov 26 06:14:16 bcs kernel: [2140480.206926] lost page write due to
I/O error on sdb1
		Nov 26 06:14:16 bcs kernel: [2140480.206929] Buffer I/O error on
device sdb1, logical block 98234686
		Nov 26 06:14:16 bcs kernel: [2140480.206931] lost page write due to
I/O error on sdb1
		Nov 26 06:14:16 bcs kernel: [2140480.207062] end_request: I/O error,
dev sdb, sector 785878503
		Nov 26 06:14:17 bcs kernel: [2140480.207188] end_request: I/O error,
dev sdb, sector 785879527
		Nov 26 06:14:17 bcs kernel: [2140480.207377] end_request: I/O error,
dev sdb, sector 785880551
		Nov 26 06:14:17 bcs kernel: [2140480.207508] end_request: I/O error,
dev sdb, sector 785881575


Reply to: