[Linux] Disques durs

Hervé Eychenne rv@::1
Jeu 8 Mar 00:20:04 CET 2007


On Wed, Mar 07, 2007 at 07:18:48PM +0100, Christophe Courtois wrote:

> Pierre THIERRY a écrit :
> >L'observation est beaucoup plus simple et bien moins concluante.
> >Simplement, les machines éteintes régulièrement ont des disques qui
> >meurent en moyenne beaucoup plus vite que celles restant en général
> >allumées de longues période.
> >Ce n'est en aucun manière une observation scientifique avec groupe
> >témoin et analyse statistique des résultats.

> Au passage, la seule étude scientifique que je connaisse sur le 
> comportement des disques durs a été publiée par Google récemment. PAs de 
> bol, ils laissent tourner leurs disques durs en permanence dans les 
> serveurs, ces gens-là :o)
>  (Pour ceux qui n'auraient pas lu, les conclusions étaient en gros : le 
> taux de panne ne dépend étonnamment pas de la température ni de 
> l'intensité d'utilisation, mais les erreurs remontées par SMART sont un 
> signe qu'il vaut mieux changer très vite le disque).

Je rajoute à cela :

Pour autant, l'absence d'erreurs SMART ne prouve absolument pas qu'un
disque ne puisse pas "casser" du jour au lendemain.
Rajoutons à cela que le taux de panne des disques jeunes est
étonnamment élevé.
La courbe de fiabilité a approximativement cette forme :

F
^
|
|                        __/
|                     __/
|\                 __/
| \             __/
|  \___________/
|
----------------------------> t (ans)
0    2        5

Amusant : la fiabilité constatée est 10 à 15 fois moins bonne que celle
annoncée par les constructeurs (tiens donc...)
Et les disques estampillés plus fiables (SCSI, etc.) ne le sont pas
beaucoup plus que les disques grand public.
Enfin, il est intéressant de noter que la corrélation entre les pannes
de disques d'une même série est assez importante. En pratique, cela
implique que la probabilité pour qu'on "perde" deux disques d'un RAID5
de 3 disques est très souvent sous-estimée.

Voilà à peu près la synthèse des quelques enseignements que j'ai pu
tirer des lectures récentes sur le sujet.

Ce qui ressort de tout cela, c'est le manque de connaissance que l'on
a sur les causes réelles d'une panne disque, et la cruelle absence de
statistiques valables tirées d'un large échantillon (en fonction
des variables suivants : marque, série, type, données SMART, intensité
d'utilisation, arrêts, etc.). On ne me fera pas croire que Google n'a
pas réalisé une telle étude (sur les séries ou en tout cas les marques).
"Evidemment", Google s'est bien gardé de publier des noms... ;-/

Au final, choisir un "bon" disque et prévoir autant que possible sa
fiabilité relève encore assez largement du chamanisme...

 Hervé


Plus d'informations sur la liste de diffusion linux