D'expérience sur un parc de 20 000 disques :
- SMART ne permet pas de prédire une panne. Un disque avec 30 000 heures peut tenir encore 20 000 heures sans problème, alors qu'un disque avec 2000 heures au compteur peut tomber en panne demain 
- SMART ne se trompe quasiment jamais quand il dit qu'il y a un problème. Si smartctl râle, c'est probablement déjà trop tard. Changez le disque maintenant, ou comptez sur votre backup 
- les erreurs dans le dmesg sont souvent une bonne indication pour prédire une panne. 
- les performances qui s'écroulent sont une très bonne indication de la probable panne du disque. Et de toute façon, vous ne voulez pas garder un disque qui ralentit votre grappe RAID, donc il faut le remplacer sans tarder. C'est aussi une donnée pas toujours évidente à mesurer, surtout quand l'activité des I/O est faible

Il y a généralement plusieurs façons pour un disque de tomber en panne :
- plus rien ne fonctionne d'un coup 
- le disque devient de plus en lent 
- le disque n'arrive plus à lire certains secteurs 

Quand smartctl dit que le disque a un problème, vous ne le verrez pas forcément. Peut-être que vous vous en rendrez compte quand le disque sera plein. C'est donc un risque inutile de ne pas le changer. 

Et n'oubliez pas : un disque dur tombe toujours (un jour)  en panne. On ne sait juste pas prédire quand avec précision... 



On Jan 11, 2017 22:44, "merlin8282" <merlin8282@gmail.com> wrote:
J'avais lu un article intéressant il y a longtemps, il doit toujours
être d'actualité je présume... selon cet article, SMART serait quasiment
useless : http://storagemojo.com/2007/02/19/googles-disk-failure-experience/


On 11/01/2017 22:28, Alarig Le Lay wrote:
> On Wed Jan 11 19:54:21 2017, David COURTOIS wrote:
>> Hello,
>>
>> J'ai régulièrement des cas où le disque est défaillant, mais smartctl ne
>> remonte pas d'erreur. Souvent, le symptôme est un disque anormalement lent,
>> un smartctl long à afficher les résultats. Systématiquement un dd
>> if=mondisque of=/dev/null a fait apparaître des erreurs "uncorrected
>> read"dans le smart.
>> Maintenant, ce sont des disques SAS, je ne sais pas si cela peut se produire
>> sur des SATA...
>
> C’est presque ça. Le support m’a dit qu’ils avaient le cas sur toute une
> série de serveurs. Ils m’en propose un autre à la place, et plus cher
> évidemment !
>
> Hint : c’est pas chez toi, c’est chez ton plus gros concurrent ;)
>
>
>
> _______________________________________________
> Liste de diffusion du FRsAG
> http://www.frsag.org/
>

_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/