Le LHC va révolutionner la physique. Peut-il aussi révolutionner Internet?

Pin
Send
Share
Send

Nous savons déjà que le Grand collisionneur de hadrons (LHC) sera l'expérience de physique la plus grande et la plus coûteuse jamais réalisée par l'humanité. La collision de particules relativistes à des énergies jusque-là inimaginables (jusqu'à la marque 14 TeV à la fin de la décennie) générera des millions de particules (connues et à découvrir), qui doivent être suivies et caractérisées par d'énormes détecteurs de particules. Cette expérience historique nécessitera un effort massif de collecte et de stockage des données, réécrivant les règles de traitement des données. Toutes les cinq secondes, les collisions avec le LHC généreront l'équivalent d'un DVD de données, soit un taux de production de données d'un gigaoctet par seconde. Pour mettre cela en perspective, un ordinateur domestique moyen avec une très bonne connexion peut télécharger des données à un ou deux mégaoctets par seconde (si vous êtes très chanceux, j'obtiens 500 kilo-octets / seconde). Les ingénieurs du LHC ont donc conçu un nouveau type de méthode de traitement des données qui peut stocker et distribuer pétaoctets (millions de gigaoctets) de données aux collaborateurs du LHC dans le monde (sans vieillir et devenir gris en attendant un téléchargement).

En 1990, l'Organisation européenne pour la recherche nucléaire (CERN) a révolutionné notre façon de vivre. L'année précédente, Tim Berners-Lee, physicien au CERN, a rédigé une proposition de gestion électronique de l'information. Il a avancé l'idée que les informations pourraient être facilement transférées sur Internet en utilisant quelque chose appelé «hypertexte». Au fil du temps, Berners-Lee et son collaborateur Robert Cailliau, ingénieur système également au CERN, ont constitué un réseau d'information unique pour aider les scientifiques du CERN à collaborer et à partager les informations de leurs ordinateurs personnels sans avoir à les enregistrer sur des périphériques de stockage encombrants. Hypertexte a permis aux utilisateurs de parcourir et de partager du texte via des pages Web en utilisant hyperliens. Berners-Lee a ensuite créé un éditeur de navigateur et s'est vite rendu compte que cette nouvelle forme de communication pouvait être partagée par un grand nombre de personnes. En mai 1990, les scientifiques du CERN appelaient ce nouveau réseau collaboratif le Internet. En fait, le CERN était responsable du premier site Web au monde: http://info.cern.ch/ et un premier exemple de ce à quoi ressemblait ce site se trouve sur le site Web du World Wide Web Consortium.

Le CERN n'est donc pas étranger à la gestion des données sur Internet, mais le tout nouveau LHC nécessitera un traitement spécial. Comme l'a souligné David Bader, directeur exécutif du calcul haute performance au Georgia Institute of Technology, la bande passante actuelle permise par Internet est un énorme goulot d'étranglement, ce qui rend d'autres formes de partage de données plus souhaitables. "Si je regarde le LHC et ce qu'il fait pour l'avenir, la seule chose que le Web n'a pas pu faire est de gérer une richesse phénoménale de données», A-t-il déclaré, ce qui signifie qu'il est plus facile d'enregistrer de grands ensembles de données sur des disques durs de téraoctets, puis de les envoyer par courrier aux collaborateurs. Bien que le CERN ait abordé la nature collaborative du partage de données sur le World Wide Web, les données que le LHC générera surchargeront facilement les petites bandes passantes actuellement disponibles.

C'est pourquoi la grille de calcul du LHC a été conçue. La grille gère la vaste production d'ensembles de données du LHC en plusieurs niveaux, le premier (Niveau 0) est situé sur place au CERN près de Genève, en Suisse. Le niveau 0 consiste en un immense réseau informatique parallèle contenant 100 000 processeurs avancés qui ont été configurés pour stocker et gérer immédiatement les données brutes (1 et 0 du code binaire) pompées par le LHC. Il convient de noter à ce stade que toutes les collisions de particules ne seront pas détectées par les capteurs, seule une très petite fraction peut être capturée. Bien que seul un nombre relativement petit de particules puisse être détecté, cela se traduit toujours par un énorme rendement.

Le niveau 0 gère des parties des données produites en les dynamisant via des lignes de fibre optique dédiées de 10 gigabits par seconde à 11 Niveau 1 sites en Amérique du Nord, en Asie et en Europe. Cela permet à des collaborateurs tels que le collisionneur d'ions lourds relativistes (RHIC) du Brookhaven National Laboratory à New York d'analyser les données de l'expérience ALICE, en comparant les résultats des collisions d'ions plomb du LHC avec leurs propres résultats de collisions d'ions lourds.

À partir des ordinateurs internationaux de niveau 1, les ensembles de données sont empaquetés et envoyés à 140 Niveau 2 des réseaux informatiques situés dans des universités, des laboratoires et des entreprises privées du monde entier. C'est à ce stade que les scientifiques auront accès aux ensembles de données pour effectuer la conversion du code binaire brut en informations utilisables sur les énergies et les trajectoires des particules.

Le système de niveaux est très bien, mais il ne fonctionnerait pas sans un type de logiciel très efficace appelé «middleware». Lorsqu'il essaie d'accéder aux données, l'utilisateur peut souhaiter des informations qui sont réparties sur plusieurs pétaoctets de données sur différents serveurs dans différents formats. Une plate-forme middleware open source appelée Globus aura l'énorme responsabilité de recueillir les informations requises de manière transparente, comme si ces informations se trouvaient déjà à l'intérieur de l'ordinateur du chercheur.

C'est cette combinaison du système à plusieurs niveaux, d'une connexion rapide et d'un logiciel ingénieux qui pourrait être étendue au-delà du projet LHC. Dans un monde où tout devient «à la demande», ce type de technologie pourrait rendre Internet transparent à l'utilisateur final. Il y aurait un accès instantané à tout, des données produites par des expériences de l'autre côté de la planète, à la visualisation de films haute définition sans attendre la barre de progression du téléchargement. Tout comme l'invention de HTML par Berners-Lee, la grille informatique du LHC pourrait révolutionner la façon dont nous utilisons Internet.

Sources: Scientific American, CERN

Pin
Send
Share
Send