J’avance.
Je me permets de vous tenir au courant parce que en dehors des idées que vous pourriez avoir, ça peut un jour aider quelqu’un.
J’ai fini par comprendre que le problème se produit toujours sur des secteurs de la fin des SSD (vers 1.55To sur un SSD 1.6To). Je n’ai pas encore pu le voir sur des secteurs du début ou du milieu. C’est d’ailleurs comme ça que je le provoque: en faisant des DD qui remplissent le pool, ZFS finit par devoir taper dans ces secteurs là.
Alors, on va me dire: tes SSD ont des secteurs défectueux. Le problème c’est que je vois souvent le même secteur sortir sur plusieurs SSD. Et les secteurs sont toujours dans la même zone (248 secteurs entre le premier et le dernier). Et si je compare entre les 2 serveurs, ils sont toujours dans le même coin, voir identiques:
SERVEUR 1: 3028949248 3028949256 3028949264 3028949320 3028949328 3028949336 3028949344 3028949368 3028949376 3028949384 3028949392 3028949400 3028949424 3028949432 3028949440 3028949448 3028949456 3028949464 3028949472 3028949480 3028949488 3028949496
SERVEUR 2 (j’ai beaucoup moins joué avec, il y a des VM en prod dessus): 3028949392 3028949416 3028949424 3028949480
Donc je ne crois pas à un hasard, c’est statistiquement inimaginable.
Si quelqu’un sait pourquoi il y aurait des secteurs interdits sur un SSD IBM (OEM HGST), alors qu’ils ne sont pas en fin de disque dans une zone réservée, mais vers la fin de la partition 1 de ZFS (donc la partition data), je suis preneur.