Now Reading
Very BIG Data : stocker les données dans l’ADN
0

Very BIG Data : stocker les données dans l’ADN

by Cloud Guru20 novembre 2017

L’inflation de production de données étant semble-t-il sans fin, et suivant une croissance exponentielle, la question du stockage de ces données devient cruciale.

Selon un rapport IBM Marketing Cloud 2016, 90% des données existantes aujourd’hui ont été créées au cours des deux dernières années. Chaque jour, nous générons 2,5 milliards d’ octets (2,5 × 10 18 ) d’informations supplémentaires.

On peut par exemple se demander comment il sera possible de stocker la totalité des données produites dans les prochaines années de façon pérenne (les disques durs n’ont pas une durée de vie particulièrement longue), avec un impact sur l’environnement relativement faible (et pourquoi pas nul), et dans un espace minimal.

C’est pourquoi la piste du stockage ADN est de plus en plus étudiée, et un article du site cosmosmagazine fait le point sur ces recherches. En voici quelques extraits traduits :

[…] La chanson « Smoke on the Water » fait à nouveau l’histoire. En septembre 2017, elle a été l’un des premiers éléments des archives de la Mémoire du Monde à être stocké sous forme d’ADN puis reproduit avec une précision de 100%. Le projet est un effort conjoint entre l’Université de Washington, Microsoft et Twist Bioscience, une société de fabrication d’ADN basée à San Francisco.

La démonstration a été présentée comme une «proof of concept» – preuve de la faisabilité mais trop chère pour être commercialisée. Du moins pour l’instant.

ADN : la nature a optimisé le format

De nombreux experts prédisent que c’est juste une question de temps avant que l’ADN ne soit utilisé comme le moyen ultime de stocker des données. Il est compact, efficace et résilient. Après tout, cette méthode à été mise au point pendant des milliards d’années pour devenir le référentiel parfait pour l’information génétique. Cela ne deviendra jamais obsolète, car tant qu’il y aura de la vie sur Terre, nous serons intéressés par le décodage de l’ADN. « La nature a optimisé le format », explique Bill Peck, directeur technique de Twist Bioscience. […]

À l’heure actuelle, tous nos bits et octets se déversent dans de gigantesques fermes de serveurs, sur des disques durs ou des bobines de bandes magnétiques à la pointe de la technologie. Ces substrats physiques occupent beaucoup d’espace.

Comparez cela à l’ADN. Le génome humain entier, un code de trois milliards de paires de bases d’ADN, ou 3 000 mégaoctets, s’insère dans un volume qui est invisible à l’œil nu – le noyau de la cellule. Un gramme d’ADN – la taille d’une goutte d’eau sur votre doigt – peut stocker au moins l’équivalent de 233 disques durs d’ordinateur pesant plus de 150 kilogrammes. Pour stocker toutes les informations génétiques dans un corps humain – 150 zettaoctets – sur bande ou disques durs, vous auriez besoin d’une installation couvrant des milliers, voire des millions de pieds carrés.

La totalité des données jamais produites dans… 2 camionnettes

Et puis il y a la durabilité. Parmi les prétendants au stockage actuel, la bande magnétique a la meilleure durée de vie, environ 10-20 ans. Les disques durs, les CD, les DVD et les lecteurs flash sont moins fiables, dépassant difficilement les cinq à dix ans. L’ADN a prouvé qu’il peut survivre des milliers d’années indemnes.

[…] À l’heure actuelle, il en coûte 10 cents par lettre pour synthétiser l’ADN (trois si vous achetez en gros). La PDG de Twist Bioscience, Emily LeProust, estime qu’il faudrait tomber à 0,001 centime par lettre avant que l’ADN puisse raisonnablement concurrencer la bande magnétique pour le stockage à long terme. des investissements massifs et une perspective de marché lucrative pourraient fournir l’impulsion nécessaire.

[…] En mars 2017, Yaniv Erlich de Columbia University et Dina Zielinski du New York Genome Center ont codé six fichiers de données en utilisant un nouvel algorithme capable de coder significativement plus de données par nucléotide que les méthodes précédentes, tout en renvoyant 100% des fichiers originaux. Leur technique «DNA Fountain» adapte un algorithme de streaming de vidéo sur smartphone et a permis d’enregistrer 215 petabytes (215 millions de gigaoctets) par gramme d’ADN. À cette densité, toutes les données jamais enregistrées par les humains pourraient tenir dans un conteneur de la taille de deux camionnettes !

 

Pour en savoir plus :
> L’article de cosmosmagazine, en anglais

Pour nous contacter sur ce sujet :

Vos nom et prénom (obligatoire)

Votre email (obligatoire)

Votre téléphone (facultatif)

Votre entreprise (obligatoire)

Votre demande

{lang: 'fr'}
About The Author
Cloud Guru

Vous souhaitez réagir sur cet article ?