Bonjour,
J'ai identifié 3 grosses séries de pannes sur les serveurs HP Proliant, contrairement au matériel informatique grand public, HP ne veut pas les reconnaitre comme des défauts de fabrication.
1/ HP Proliant DL320 G5 / DL160 G5 : alimentation qui claque au bout de 3 ans =============================================================================
Par chance je n'avais qu'une poignée de machines de cette génération et ça n'a pas loupé, toutes les alimes ont cramé. J'en ai ouverte une qui était hors garantie et on voyait bien un condensateur gonflé : http://twitpic.com/4poesn
Ikoula a cramé 150 alimes comme ça sur des DL160 G5, HP leur disait que ça venait de leur réseau électrique alors ils l'ont fait analysé toute la chaine électrique pour rien.
Ça arrive à tout le monde d'acheter des condensateur merdiques mais le minimum est de reconnaitre ses erreurs et ne pas être trop regardant vis à vis de la garantie.
2/ HP Proliant DL320 G6 : alimentation buggée qui se met en défaut ==================================================================
Là c'était assez fun. J'ai découvert ce "petit bug" en déménageant tous mes serveurs d'une salle à l'autre l'an dernier. Après un certaine temps en fonctionnement, le serveur refuse de démarrer si on l'a débranché. J'avais 6 serveurs en production, 5 ont été touchés (même révision de l'alimentation) en même temps.
3/ HP Proliant DL320 G5p : port réseau qui déconne au bout de 2 à 3 ans ========================================================================
Sur ces machines, au bout de 2 à 3 ans, le serveur commence à perdre ses interfaces réseau (broadcom Tigon3) avec plein d'erreurs :
eth0 Link encap:Ethernet HWaddr 00:21:5a:xx:xx:xx inet adr:79.99.164.xx Bcast:79.99.164.127 Masque:255.255.255.192 adr inet6: fe80::221:5aff:fe0d:70b8/64 Scope:Lien UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:2383708444609 errors:794568949575 dropped:794568949575 overruns:0 frame:3972844747875 TX packets:2383708125949 errors:794568949575 dropped:0 overruns:0 carrier:0 collisions:794568949575 lg file transmission:1000 RX bytes:794738815192 (740.1 GiB) TX bytes:795647734714 (741.0 GiB)
ça le fait une fois, la machine revient en redémarrant puis replante au bout de quelques jours voir quelques heures et au final le BIOS ne voit même plus les interfaces réseau. La solution est le changement de carte mère.
J'ai eu 3 serveurs touchés et, ce week end, une machine dont la carte mère avait été changée a planté avec les mêmes symptômes. Donc HP nous a changé une carte mère défectueuse avec une autre carte défectueuse. J'ai 17 machines comme ça en production, ça fait vraiment peur.
Ça commence à faire beaucoup, aujourd'hui nous n'achetons que des DL360 qui fonctionnent très bien.
Avez vous des expériences là dessus, est-ce que Dell est plus fiable et assume ses défauts ?
Frédéric.