Référentiel de données scientifiques ouvertes de la NASA dans le domaine de la biologie spatiale et de la santé en mission spatiale se développement rapide, devenant essentiel pour les futures missions vers la Lune, Mars et au-delà. Les risques biomédicaux accrus et les nouveaux débits des missions en espace lointain nécessaire des avancées en recherche biomédicale, en contre-mesures sanitaires et en technologies de support vie. Pour faciliter ces missions, les données biologiques et médicales doivent être FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables), avec une gouvernance allant de l’accès reste à l’open data.
Dépuis dix ans, la base de données NASA GeneLab un joué un rôle clé dans la collection et l’analyse des données omiques en biologie spatiale, favorisant des découvertes majeures (dysfonctions mitochondriales, effets des vols spatiaux sur la santé humaine, microbiote intestinal, etc). En 2021, l’intégration de GeneLab avec les archives ALSDA a donné naissance au NASA Open Science Data Repository (OSDR), qui regroupe des termes des données omiques et non-omiques (physiologiques, cliniques, télémétrie, imagerie, etc).
Une architecture de base de données étendue et nouvelles fonctionnalités
1-Contenu et utilisation de la base de données
L’OSDR défend la gestion des données pour permettre à toute l’humanité de participer à la découverte et à l’exploration en rendant les données plus équitables et accessibles à tous. En octobre 2024, l’OSDR hébergeait plus de 500 études, dont près de 1 000 ensembles de données de vols spatiaux ou d’analogies spatiales, avec des données provenant de plus de 80 tests différents, englobant à la fois ‘des tests omiques et physiologiques/phénotypiques.
Les données hébergées sur OSDR sont liées à 105 publications scientifiques originales évaluées par des pairs et ont permis 92 publications, ce qui représente un retour sur investissement (ROI) de 88 %, mesuré par le nombre de publications autorisées par rapport aux publications primaires.
Le dépôt est également en train de rassembler des données provenant d’autres agences spatiales et entreprises, telles que l’Agence Spatiale Européenne (ESA). Il propose des études sur le repos au lit en position couchée, l’immersion à sec humaine, les organismes modèles exposés aux rayonnements spatiaux simulés ainsi que d’autres organismes modèles envoyés dans la Station Spatiale Internationale (ISS).
En plus d’encourager un accès plus JUSTE/ouvert aux données, l’OSDR permet de comparer des centaines d’ensembles de données provenant d’espèces, de missions et d’études distinctes. En améliorant les connaissances biomédicales recueillies à partir de données partagées, cette capacité augmente considérablement la valeur scientifique de l’exploration spatiale.
2-Flux de travail de gestion des données
Pour améliorer la réutilisabilité, l’accessibilité et la planification des données biologiques issues d’expériences spatiales, la NASA a étendu le portail de soumission original de GeneLab à l’environnement de gestion des données biologiques (BDME).
Les dernières mises à jour du BDME (Biological Data Management Environment) permettent la soumission continue des données et des métadonnées pendant la recherche, évitant ainsi les ruées de dernière minute et garantissant une meilleure qualité des données tout en préservant la confidentialité.
Le cadre flexible du RDSA et de l’OSDR permet aux chercheurs de maximiser l’utilité des données tout en gardant le contrôle de l’accessibilité. En dissociant la soumission de la publication publique, la NASA équilibre les principes de la science ouverte avec l’autonomie des chercheurs, favorisant ainsi des ensembles de données réutilisables de haute qualité pour la biologie spatiale et la recherche en santé
3-Les nouvelles collectes de données
L’intégration des données ALSDA dans OSDR a nécessité le développement de nouveaux schémas de données pour gérer divers enregistrements tels que les expériences, les échantillons biologiques, le matériel, la charge utile et les données de mission. Pour y parvenir, OSDR a étendu la base de données existante de GeneLab pour créer un schéma reliant les études à leurs collections de données de référence correspondantes.
Pour les projets financés par la NASA, le processus suit une approche structurée à trois niveaux :
1-les chercheurs soumettent d’abord un accord de soumission de données de recherche (RDSA) avec des métadonnées au niveau de la subvention.
2-documentez ensuite les expériences individuelles et leurs relations.
3-avant de finalement soumettre des ensembles de données via des flux de travail guidés ou indépendants, les chercheurs non membres de la NASA peuvent saisir directement au niveau de la soumission de l’ensemble de données.
La source : Gebre, Samrawit G., et al. “NASA open science data repository: open science for life in space.” Nucleic Acids Research 53.D1 (2025): D1697-D1710.