Bonjour,
Je suis face à un cas un peu particulier, j’ai eu le / de ce serveur qui s’est remonté en ro suite à des erreurs d’I/O, j’ai donc effectué un fsck depuis un rescue pour corriger les erreurs : https://paste.swordarmor.fr/raw/KNnE
Par contre au reboot, je continue à avoir des erreurs : https://paste.swordarmor.fr/raw/Q3Zd
Et le smartctl ne montre rien d’alarmant : https://paste.swordarmor.fr/raw/ajDD
Vous avez une idée de la provenance éventuelle ces erreurs si le disque va bien ? Ou alors pour vous smartctl est à la ramasse et le disque est bel et bien bon pour la casse ?
Bonjour,
un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi. A ce niveau, ça peut être intéressant de voir directement avec le support: ils doivent avoir pas mal d'expérience sur ce genre de cas pénibles.
Hello,
Le 11 janvier 2017 à 03:57, Vincent vincent@logaweb.fr a écrit :
un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi.
Généralement on voit le compteur "UDMA_CRC_Error_Count" monter dans ces cas là, ici il est à 0.
Si c'est pas la nappe SATA, et que ça semble pas être le disque, Google me suggère de soupçonner l'alimentation, ou un faux contact sur le connecteur d'alim du disque.
On Wed Jan 11 05:09:05 2017, Etienne R. wrote:
Hello,
Le 11 janvier 2017 à 03:57, Vincent vincent@logaweb.fr a écrit :
un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi.
Généralement on voit le compteur "UDMA_CRC_Error_Count" monter dans ces cas là, ici il est à 0.
Si c'est pas la nappe SATA, et que ça semble pas être le disque, Google me suggère de soupçonner l'alimentation, ou un faux contact sur le connecteur d'alim du disque.
Merci pour vos pistes, je vais tenter de proposer ça au support :)
Je confirme déjà avoir eu ce genre de comportement avec une nappe foireuse.
Avant que ça m'arrive, je pensais pas que c'était possible, car pour moi, ça marche ou ça marche pas, mais pas un micmac fucké entre le deux.
Bon courage
Le 10 janvier 2017 13:57:23 GMT-05:00, Vincent vincent@logaweb.fr a écrit :
Bonjour,
un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi. A ce niveau, ça peut être intéressant de voir directement avec le support: ils doivent avoir pas mal d'expérience sur ce genre de cas pénibles.
Liste de diffusion du FRsAG http://www.frsag.org/
Hello,
J'ai régulièrement des cas où le disque est défaillant, mais smartctl ne remonte pas d'erreur. Souvent, le symptôme est un disque anormalement lent, un smartctl long à afficher les résultats. Systématiquement un dd if=mondisque of=/dev/null a fait apparaître des erreurs "uncorrected read"dans le smart. Maintenant, ce sont des disques SAS, je ne sais pas si cela peut se produire sur des SATA...
Le 10/01/2017 à 21:56, MrJK a écrit :
Je confirme déjà avoir eu ce genre de comportement avec une nappe foireuse.
Avant que ça m'arrive, je pensais pas que c'était possible, car pour moi, ça marche ou ça marche pas, mais pas un micmac fucké entre le deux.
Bon courage
Le 10 janvier 2017 13:57:23 GMT-05:00, Vincent vincent@logaweb.fr a écrit :
Bonjour, un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi. A ce niveau, ça peut être intéressant de voir directement avec le support: ils doivent avoir pas mal d'expérience sur ce genre de cas pénibles. ------------------------------------------------------------------------ Liste de diffusion du FRsAG http://www.frsag.org/
Liste de diffusion du FRsAG http://www.frsag.org/
Cadeau bonus : la plupart du temps ces erreurs sont remontées via dmesg/kern.log
Le 11/01/2017 à 19:54, David COURTOIS a écrit :
Hello,
J'ai régulièrement des cas où le disque est défaillant, mais smartctl ne remonte pas d'erreur. Souvent, le symptôme est un disque anormalement lent, un smartctl long à afficher les résultats. Systématiquement un dd if=mondisque of=/dev/null a fait apparaître des erreurs "uncorrected read"dans le smart. Maintenant, ce sont des disques SAS, je ne sais pas si cela peut se produire sur des SATA...
Le 10/01/2017 à 21:56, MrJK a écrit :
Je confirme déjà avoir eu ce genre de comportement avec une nappe foireuse.
Avant que ça m'arrive, je pensais pas que c'était possible, car pour moi, ça marche ou ça marche pas, mais pas un micmac fucké entre le deux.
Bon courage
Le 10 janvier 2017 13:57:23 GMT-05:00, Vincent vincent@logaweb.fr a écrit :
Bonjour, un câble sata avec un contact pas franc doit pouvoir faire ce genre de choses aussi. A ce niveau, ça peut être intéressant de voir directement avec le support: ils doivent avoir pas mal d'expérience sur ce genre de cas pénibles. ------------------------------------------------------------------------ Liste de diffusion du FRsAG http://www.frsag.org/
Liste de diffusion du FRsAG http://www.frsag.org/
Liste de diffusion du FRsAG http://www.frsag.org/
On Wed Jan 11 19:54:21 2017, David COURTOIS wrote:
Hello,
J'ai régulièrement des cas où le disque est défaillant, mais smartctl ne remonte pas d'erreur. Souvent, le symptôme est un disque anormalement lent, un smartctl long à afficher les résultats. Systématiquement un dd if=mondisque of=/dev/null a fait apparaître des erreurs "uncorrected read"dans le smart. Maintenant, ce sont des disques SAS, je ne sais pas si cela peut se produire sur des SATA...
C’est presque ça. Le support m’a dit qu’ils avaient le cas sur toute une série de serveurs. Ils m’en propose un autre à la place, et plus cher évidemment !
Hint : c’est pas chez toi, c’est chez ton plus gros concurrent ;)
J'avais lu un article intéressant il y a longtemps, il doit toujours être d'actualité je présume... selon cet article, SMART serait quasiment useless : http://storagemojo.com/2007/02/19/googles-disk-failure-experience/
On 11/01/2017 22:28, Alarig Le Lay wrote:
On Wed Jan 11 19:54:21 2017, David COURTOIS wrote:
Hello,
J'ai régulièrement des cas où le disque est défaillant, mais smartctl ne remonte pas d'erreur. Souvent, le symptôme est un disque anormalement lent, un smartctl long à afficher les résultats. Systématiquement un dd if=mondisque of=/dev/null a fait apparaître des erreurs "uncorrected read"dans le smart. Maintenant, ce sont des disques SAS, je ne sais pas si cela peut se produire sur des SATA...
C’est presque ça. Le support m’a dit qu’ils avaient le cas sur toute une série de serveurs. Ils m’en propose un autre à la place, et plus cher évidemment !
Hint : c’est pas chez toi, c’est chez ton plus gros concurrent ;)
Liste de diffusion du FRsAG http://www.frsag.org/