Re: OT: un error lógico (Gnu/Linux+filesystem)de disco puede producir sectores defectuosos?
El Fri, 07 Dec 2012 10:37:24 -0300, Flako escribió:
> Hola
> Esto esto esta mas asociado mas a un tema de harddisk+Gnu/Linux
> que a Debian, pero como de nuevo necesito de su experiencia aquí estoy
> escribiendo otro OT.
Okay :-)
> Tengo un Disco (SAMSUNG HD103SJ de 1TB) que coloque "casi-nuevo"
> en un servidor (HP DL120 G5), a las 3 semanas el disco fallo con errores
> de sectores que no se podían leer (end_request: I/O error) y el disco
> dejo de estar disponible (el fdisk mostraba el disco sin particiones y
> /dev/xxx no respondía al mount). Para hacer que vuelva andar se tuvo que
> reiniciar el servidor.
> Me puse a analizar el disco (en otro equipo) y no encontré errores
> de smart, ni sectores reallocated, según smart el disco esta OK.
> también corrí badblocks -wsv /dev/xxx. y no encontró errores.
> Los checkeos que hice dan entender que el disco esta bien, pero me
> sale la duda si este tipo de problemas puede ser producto de algún error
> lógico/kernel/etc o algún problema de la controladora de disco.
> Este disco (SAMSUNG HD103SJ de 1TB) lo coloque en el servidor como
> remplazo de otro que tuvo un comportamiento similar, solo que el disco
> anterior si estaba dañado, con sectores reasignados y fallaba con
> badblocks.
>
> Y mi pregunta es si este tipo de errores puede ser producido por
> errores lógicos (algún bug del kernel o del filesystem)?
> o tendría que pensar en algún problema de hard del servidor?
(...)
Te recomiendo que antes de nada analices el disco con la herramienta del
fabricante (ahora Seagate) y le pases el "test largo". Si te da algún
error y el disco es nuevo y está en garantía, gestiona un RMA y que te
manden uno nuevo.
Si el test no detecta fallos, los errores que mencionas pueden ser
debidos a factor externos: cables y conexiones del disco en mal estado
(doblados, forzados o partidos), fuente de alimentación, placa base,
voltajes... tendrías que descartar uno a uno estos elementos.
Por último, quedaría un error/problema de software. Probar con un kernel
nuevo sería una posible opción para descartar alguna incompatibilidad
entre la controladora del disco duro y el driver utilizado (libata, ahci,
etc...).
Saludos,
--
Camaleón
Reply to: