Et je complète encore avec mes derniers résultats:

J’ai sorti un des SSD du pool ZFS, je l’ai remis en mode RAID au lieu de HBA, j’ai créé un VD RAID0 avec ce SSD.
Quand je fais des tests de lecture sur le VD dans la zone des secteurs qui posent problème: aucune erreur pour le moment.

Donc ça ressemble à un firmware IBM avec une saloperie que le contrôleur RAID de DELL sait gérer, mais pas le driver megaraid….

Le 25 mars 2022 à 13:55, David Ponzone <david.ponzone@gmail.com> a écrit :

Je complète, car je viens de découvrir que c’est beaucoup plus tordu que ça!

Je fais un dd read de 256 secteurs à partir de 3028949200: dmesg m’envoie un erreur de read sur le secteur 3028949432.
Je refais un dd read de 2560 secteurs à partir de 3028949200: PAS d’ERREUR !
Je refais un dd read de 256 secteurs à partir de 3028949200: PAS d’ERREUR !!!!

Donc en gros, si je fais un gros read, ça élimine le problème (provisoirement ou pas, aucune idée, je vais ré-essayer un read de 256 dans quelques heures)

Y a un truc pourri dans mon royaume….

David

Le 25 mars 2022 à 13:36, David Ponzone <david.ponzone@gmail.com> a écrit :


J’y ai pensé, mais si c’était le cas, ça commencerait à merder après le secteur X (X dans mon cas étant autour de 3028949248).
Mais j’ai pu faire des lectures sans erreurs sur des secteurs après cette zone là.

Et pour répondre à Emmanuel hier, les IBM-SSG c’est du HGST Enterprise prévu pour 8 ou 10 écritures complètes par jour pendant des années, je sais pas où il est allé chercher que c’était du SSD GP :)

Le 25 mars 2022 à 13:26, Dominique Rousseau <d.rousseau@nnx.com> a écrit :

Le Wed, Mar 23, 2022 at 01:26:43PM +0100, David Ponzone [david.ponzone@gmail.com] a écrit:
J???avance.

Je me permets de vous tenir au courant parce que en dehors des idées
que vous pourriez avoir, ça peut un jour aider quelqu???un.

J???ai fini par comprendre que le problème se produit toujours sur des
secteurs de la fin des SSD (vers 1.55To sur un SSD 1.6To).

Peut-etre que tes SSD ne font pas réellement 1.6To "réels" mais que
c'est une capacité "brute" pour de la réallocation, et que le firmware
est buggé et ne le gere pas correctement ( en annoncant une taille plus
petite, du coup ) ?
</speciulations>



--
Dominique Rousseau
Neuronnexion, Prestataire Internet & Intranet
6 rue des Hautes cornes - 80000 Amiens
tel: 03 22 71 61 90 - fax: 03 22 71 61 99 - http://www.neuronnexion.coop
_______________________________________________
Liste de diffusion du %(real_name)s
http://www.frsag.org/