Pourquoi l’archivage sur bande est toujours d’actualité

Aujourd’hui quand on pense à l’archivage, la bande est loin de venir directement à l’esprit comme support à privilégier. Mais même si le disque est plus rapide, la bande a l’avantage de pouvoir sauvegarder plus de données et de les conserver en l’état beaucoup plus longtemps.

Intérieur d’une cartouche LTO-2, ayant un taux d’erreur en bits irrécupérables à peu près équivalent à une erreur tous les 1,25 Eo. (Crédit : Austin Murphy / Wikipédia)

Cela en surprendra plus d’un si on vous dit que, malgré la popularité du stockage sur disque dur, la quantité de données actuellement enregistrées sur bande continue d’augmenter. Par exemple, en 2017, plus d’un million de pétaoctets ont été sauvegardées sur bandes LTO. Soit cinq fois plus qu’en 2008 !

Parallèlement le système de sauvegarde et récupération sur disque est devenu la norme. Mais alors, comment expliquer l’augmentation de la quantité de bandes expédiées ? La réponse peut surprendre mais il faut dans un premier temps revenir sur les avantages et inconvénients de ce système.

La bande est moins chère que le disque

Malgré toutes les avancées réalisées dans la déduplication – qui est principalement utilisée sur les disques durs et la flash – la bande reste moins chère au gigaoctet pour plusieurs raisons. La première vous permet de différencier le support d’enregistrement du matériau où seront stockées les données. Ainsi il est possible d’acheter un seul lecteur et des milliers de bandes.

Ces dernières n’ont pas non plus besoin d’alimentation ou de refroidissement pour conserver les données qui y sont stockées. En fait, certains ont avancé que même si le disque dur était gratuit, il coûterait toujours plus cher en raison des économies d’énergies réalisées grâce à la bande.

La bande retranscrit mieux les données

Lors de l’écriture des bits dans la mémoire, il peut se produire une erreur irrémédiable lorsque que le périphérique enregistre un 1 au lieu d’un 0 (ou inversement) et qu’elle n’est pas corrigée. Ce que la plupart des gens ne comprennent pas à propos de la bande, c’est que son taux d’erreur de transcription des bits est meilleur que celui de tout autre support d’enregistrement.

Les lecteurs de bande LTO-7/8 et Oracle T10000 ont tous deux un taux d’erreur en bits irrécupérables de 1/1019, ce qui correspond à peu près à une erreur tous les 1,25 Eo. Les lecteurs de disques durs d’entreprise ont, eux, un taux d’erreur avoisinant les 1/1015 ou une erreur tous les 125 TB. En somme, la bande est mille fois meilleure en écriture de 0 et de 1 que la meilleure unité sur disque.

Pour les curieux, les SSD vont de 1/1016 à 1/1018. Donc la bande est toujours 10 fois supérieure que ces supports de stockage. Il est possible de traiter les différences entre la bande et le disque dur avec des processus de contrôle de données plus approfondis, mais il n’empêche que la bande reste nativement plus sûre.

La bande conserve mieux les données

Une question de base de la physique de l’enregistrement est de savoir comment la bande conserve les données. Tous les bits magnétiques se dégradent avec le temps. La question est à quelle vitesse cela va se produire ? Les plus familiers avec cette technologie parlent d’une « énergie de blocage » qui empêche un bit magnétique de changer de position avec le temps. Ce qui est exprimé dans la formule KuV/kt. Les deux valeurs à retenir ici sont le volume de la particule magnétique (V) et la température à laquelle elle est stockée (K). Plus on maintient la température basse à mesure que la particule magnétique grossit, mieux c’est.

Par rapport au disque dur, les lecteurs de bande contiennent de très grosses particules magnétiques et la bande est stockée à température ambiante. Les lecteurs de disque contiennent des particules magnétiques plus petites et fonctionnent à des températures plus élevées. Ces derniers ont donc une énergie de blocage moins élevés que les lecteurs sur bande qui peuvent donc conserver des données plus longtemps. D’aucuns préconisent de ne pas stocker un fichier plus de cinq ans sur un disque. Alors que le même fichier pourra être gardé pendant trente ans sur bande.

Le disque a un meilleur temps d’accès aléatoire

Les gens se sont habitués aux restaurations très rapides de leurs données grâce à Time Machine et la protection continue de leurs informations. C’est avec un temps d’accès aléatoire plus court du disque dur que ces choses sont possibles. Ce support est littéralement mille fois plus rapide que la bande pour atteindre le premier bloc de données. En fonction de l’utilisation de la bande, la restauration peut prendre d’une minute à des heures supplémentaires. Par exemple, si votre logiciel de sauvegarde effectue plusieurs recherches au cours d’une restauration, le temps d’accès à la bande devient extrêmement long.

Une meilleure vitesse de sauvegarde sur disque dur

Le souci de la bande, c’est de suivre le rythme de la plupart des sauvegardes. Le taux de transfert compressé de la technologie de stockage sur bande LTO-8 standard est de 750 Mo par seconde. Le problème est que la plupart des sauvegardes sont incrémentielles et fournissent quelques mégaoctets par seconde, ce qui est tout simplement incompatible avec la bande.

Le disque dur peut, lui, exécuter des centaines de sauvegardes simultanément à cette vitesse tout en conservant chaque sauvegarde dans un emplacement distinct. La bande ne peut pas faire ça. En cela, le disque dur est beaucoup plus approprié pour la sauvegarde que la bande.

Utilisation pour l’archivage

Mais donc, si personne n’utilise la bande comme système de sauvegarde, d’où viennent toutes ces bandes ?! Le stockage secondaire. La bande est de plus en plus utilisée pour stocker de grandes quantités de données de référence qui doivent être conservées de manière fiable pendant de longues périodes et le moins cher possible. Des sociétés dans le divertissement et la biotechnologie, qui gèrent de gros fichiers (et où la question du temps d’accès aléatoire n’a vraiment aucune importance), achètent d’énormes bibliothèques pour les remplir de milliers de bandes.

Vous voulez plus surprenant ? Même les fournisseurs de cloud qui utilisent la bande dans le même but. Pourquoi pensez-vous que les délais d’accès à certains des services de stockage moins coûteux sont si longs ? Certains d’entre eux utilisent des bandes en arrière-plan pour fournir un stockage fiable à long terme des données auxquelles vous accédez rarement.

chevron_left
chevron_right