Nous sommes peut-être à l’aube de la prochaine avancée majeure dans les technologies de stockage. Des chercheurs américains, par exemple, rapportent que l’ADN produit synthétiquement peut être utilisé pour intégrer un vaste ensemble de données, même dans un espace microscopique.
La prochaine grande avancée
Si l’on jette un coup d’œil aux supports de stockage d’il y a dix ans, il est parfois surprenant de constater les grands progrès réalisés par la science en ce laps de temps relativement court. Cela ne s'applique pas seulement à la vitesse des supports de données, qui a considérablement augmenté en raison du passage des disques durs magnétiques (HDD) à la mémoire flash sous forme de disques SSD (Solid State Drives). L'espace de stockage disponible a également considérablement augmenté. Mais dernièrement, on a l’impression que les chercheurs en informatique ont lentement atteint le bout du chemin dans le domaine des SSD. Mais aujourd’hui, le feu vert est venu des rangs de la science et, en même temps, l’espoir d’une avancée technologique gigantesque.
Les chercheurs ont enfin trouvé un moyen de stocker d’énormes quantités de données dans un très petit espace. Et le corps humain joue à cet égard un rôle modèle. Plus précisément, la science s’inspire de notre code génétique – l’ADN. Alors que chez l’homme, il stocke les informations les plus importantes sur la constitution génétique, dans le domaine de la technologie, il pourrait servir de parfait magasin de données grâce à sa conception ingénieuse. Il ne doit pas seulement pouvoir offrir beaucoup d’espace. De plus, les chercheurs promettent une durée de stockage fiable de plusieurs milliers d’années. C’est pourquoi les scientifiques recherchent actuellement fébrilement des moyens d’imiter l’ADN de manière synthétique.
Les bases en sont au cœur
Ceux qui se souviennent encore vaguement de leurs cours de biologie se rappellent peut-être que l’ADN est composé de trois bases différentes. Outre l'adénine et la guanine, la cytosine et la thymine en font également partie. Les informations sur le matériel génétique de chaque être vivant sont codées par une combinaison presque infinie de ces quatre bases. Des chercheurs américains de l’Université de l’Illinois à Urbana-Champaign ont désormais pris ce principe comme modèle. Après une longue période de recherche, les scientifiques peuvent désormais annoncer leurs premières découvertes. En plus des quatre bases du modèle naturel, ils ont réussi à produire sept autres bases.
C'est ce que révèle un article technique du magazine Nano Letters. Étant donné que l’ADN synthétique produit par les scientifiques contient près de trois fois plus de bases que l’ADN trouvé dans la nature, il existe naturellement beaucoup plus de combinaisons possibles. Kasra Tabatabaei a brièvement exposé l'idée derrière l'ADN synthétique et l'expansion des bases. Il est membre de l'équipe de recherche de l'université américaine. Tabatabaei a dit :
« Au lieu de convertir les zéros et les uns en A, G, C et T, nous pouvons convertir les zéros et les uns en A, G, C, T et les sept nouvelles lettres de l'alphabet mémoriel. »
Ce n'est que le début
Cependant, la nouvelle façon de stocker les données développée par les chercheurs américains prendra du temps à arriver. Jusqu’à présent, en fait, avec la réplique de l’ADN, seule la construction de base est en place. Outre le concept de stockage lui-même, il est également important que les données stockées puissent être lues. La raison en est que la méthode ADN est un principe complètement nouveau. Il n'existe actuellement aucun système capable de gérer les données stockées. Mais les chercheurs disposent déjà d’une solution adaptée à ce problème. L’accent est mis ici sur la méthode passionnante du « Deep Learning ». En combinaison avec un séquençage spécial utilisant des nanopores, cela devrait permettre la lecture des données. Les scientifiques s’appuient donc sur les possibilités que leur révèle l’intelligence artificielle. Ils déclarent à ce propos :
«Nous avons essayé 77 combinaisons différentes des 11 nucléotides, et notre méthode a pu parfaitement distinguer chacune d'entre elles (…) Le cadre du deep-learning est universel dans le cadre de notre méthode d'identification des différents nucléotides, ce qui permet de généraliser notre approche beaucoup d'autres applications »
Plus de densité de mémoire et moins de latence
La méthode peut sembler révolutionnaire et extrêmement passionnante. Mais le résultat final devrait plaire non seulement à la communauté scientifique, mais également aux utilisateurs finaux. L’utilisation d’ADN synthétique offre en effet de nombreux avantages pour le support de stockage. D’une part, il y a la densité de stockage. Si l’on en croit les déclarations des scientifiques, on peut probablement s’attendre ici à un doublement. Ce serait vraiment impressionnant. Mais il ne suffit pas de pouvoir stocker davantage de données sur un support de stockage. De plus, la latence est censée être bien plus faible. Ce qui suit ressort de l’article de Nano Letters à cet égard :
« Dans l'ensemble, l'alphabet moléculaire élargi peut potentiellement offrir une densité de stockage presque multipliée par deux et éventuellement une réduction de la latence d'enregistrement du même ordre de grandeur, permettant ainsi de nouvelles implémentations de dispositifs d'enregistrement moléculaire. »
Il y a encore quelques chantiers
Jusqu’à présent, tout cela ressemble systématiquement à une percée dans la technologie de la mémoire. Mais les scientifiques en sont évidemment encore aux premiers stades de leur réflexion. Dans le domaine des infrastructures de données en particulier, il leur reste en effet encore quelques chantiers à aborder. En termes simples, il manque encore aujourd’hui de supports de stockage adaptés sur lesquels la technologie basée sur l’ADN peut être hébergée. La lecture et le simple stockage des données restent un défi majeur pour les chercheurs. D'ailleurs, l'Institut Fraunhofer, inventeur entre autres du fichier MP3, a également commenté le sujet :
« Par rapport aux supports de stockage conventionnels, les étapes du processus sont complexes et coûteuses, difficiles à automatiser et difficiles à intégrer dans des systèmes mobiles pratiquement utilisables. C'est pourquoi ils sont particulièrement adaptés à l'archivage stationnaire de grands volumes de données sur de longues périodes. D’un point de vue technique, ils devraient déjà être utilisables ici à moyen terme.»
De futures fermes de serveurs plus petites ?
Le fait que les supports de stockage correspondants ne puissent probablement être rendus mobiles que de manière trop compliquée ne devrait pas déranger au début. Après tout, la technologie spéciale DNA offre notamment la possibilité de créer des fermes de serveurs beaucoup plus petites que ce n'est le cas actuellement. Ici, on peut jeter un œil à un exemple produit par les collègues de Golem. Grâce à la nouvelle technologie de stockage, les données de l'ensemble d'Internet pourraient théoriquement être stockées dans une seule petite boîte à chaussures. Cependant, un inconvénient risque de faire obstacle à la réalisation de ce rêve : le taux de transmission.
En 2019, la startup CATALOG s’essayait déjà à la méthode ADN. Les employés de la petite entreprise se sont chargés de stocker la base de données Wikipédia sur l'ADN. A cette époque, les données de l’édition anglaise de l’encyclopédie en ligne comptaient 16 Go. Lorsqu’ils ont voulu le stocker sur la mémoire ADN fabriquée, ils ont remarqué le faible taux de transfert. C'était à peu près 0,5 Mo/s. Ici aussi, les chercheurs américains doivent absolument trouver une solution adaptée. En tout cas, nous sommes curieux de savoir s’ils travaillent actuellement sur les supports de stockage du futur et nous vous tiendrons au courant.