Bonjour,
    
    sur l'ensemble de mes serveurs Dell, j'ai 9 serveurs R410 en
    production depuis plusieurs mois. 4 ont planté lamentablement dans
    le mois d'octobre, de manière aléatoire.
    
    Rien dans les logs, le serveur reboot et stop juste après le BIOS
    sur le message "System fatal error - press F1 to continue or F2 for
    setup".
    Un diagnostique Dell donne ces erreurs :
    
      - Critical interrupt sensor (PCIE Fatal Err) Bus Fatal Error
      
 
      - Processor sensor (CPU Machine Chk) transition to
        non-recoverable
      
 
    
    
    Je suis en contact avec Dell, ai envoyé pas mal de logs et de
    rapports DSET, mais pour l'instant ils n'ont pas de piste, le bug
    est "escaladé"...
    
    La seule chose que j'ai faite après avoir supprimé les logs IPMI,
    c'est de mettre à jour le BIOS en 1.8.2, depuis pas d'erreurs, mais
    comme ça faisait déjà plusieurs mois qu'ils tournaient sans
    problème, ce "bug" peut potentiellement revenir ...
    
    J'ai aussi des R{2,5,7}10 mais seul les R410 m'ont posé ce soucis.
    
    Je fais donc appel à la liste : avez vous déjà rencontré ce problème
    ? 
    -- 
Greg