Mercredi 27 Novembre 2024

Publication de données Diversifier le modèle de données GBIF metabarcoding ADN

Le métabarcodage des échantillons d'ADN environnemental ou des échantillons en vrac est l'une des principales sources de nouvelles données sur la biodiversité, et le GBIF étudie les moyens d'étendre son soutien aux communautés intéressées par la publication de données sur la biodiversité dérivées de l'ADN et d'augmenter leur visibilité et leur réutilisation au-delà des référentiels et archives moléculaires.

À l'occasion de la mise à jour de notre guide sur le partage de ces données via des plateformes de biodiversité – qui comprennent désormais une section spéciale sur la publication de données sur l’ADNe marin – le GBIF invite les personnes qui détiennent des données de métabarcodes ADN à nous aider à piloter un outil expérimental de publication de données qui répond aux récents commentaires de la communauté omics.

D'ici le 1er novembre 2023, nous invitons les volontaires à nous contacter et à envoyer les données de métabarcoding ADN traitées à l'équipe pilote ADN du GBIF à DNA@gbif.org. Idéalement, ces jeux de données métabarcoding/eDNA proviendront directement de personnes ayant une solide compréhension de la structure et des origines de leurs données (plus d’informations sur les attentes en matière de données ci-dessous). En fonction de la demande, nous pouvons donner la priorité au traitement des jeux de données candidats des pays du réseau GBIF ou celles qui comblent les lacunes en matière de connaissances spatiales et taxonomiques. Nous utiliserons les jeux de données fournis pour tester et affiner l'outil expérimental et élaborer des lignes directrices concernant son utilisation future. De plus, nous travaillerons sur les processus de publication de données du GBIF pour garantir que tous les jeux de données contribués soient publiés sur le GBIF à la suite de ce projet pilote.

 

Pourquoi partager les données de métabarcoding de l'ADN sur gbif.org

  • Les données seront réutilisées pour la recherche et l'élaboration de politiques, augmentant ainsi l'impact sur les connaissances scientifiques et la compréhension de la biodiversité mondiale.
  • Le système de suivi des citations du GBIF enregistre chaque réutilisation de données dans les publications scientifiques.
  • Le partage de données via GBIF.org offre aux chercheurs et autres utilisateurs de données une voie supplémentaire pour découvrir les travaux et publications scientifiques sous-jacents.
  • Les créateurs de données gèrent les crédits académiques et l'attribution et contrôlent à la fois la fréquence et l'ampleur des modifications et des mises à jour.
  • Le GBIF attribue à chaque ensemble de données un identifiant d'objet numérique (DOI), un identifiant persistant et un lien vers l'ensemble de données.

 

Que faire si vous êtes intéressé

Considérez les jeux de données d'ADN de métabarcoding qui pourraient et devraient être accessibles à un public plus large. Envoyez les données à dna@gbif.org, et nous vous contacterons si nous avons besoin de plus d'informations ou de précisions. Une fois que nous aurons traité les jeux de données, nous vous fournirons un aperçu des données afin que vous puissiez les examiner et les ajuster.

 

Données attendues

Les jeux de données pilotes de métabarcoding/ADN électronique devraient provenir directement de ceux qui connaissent le mieux et personnellement la structure des données et leurs origines. Idéalement, les éléments de données suivants constituent un point de départ, sous forme de tableaux séparés ou fusionnés, de feuilles de calcul Excel ou de texte délimité par tabulation/csv :

  • Tableau OTU/ASV (obligatoire) : un tableau d'abondance ou une matrice espèces/sites avec le nombre de lectures de séquences de chaque "espèce moléculaire" détectée dans chacun des échantillons (ou sites). Utilisez les identifiants des échantillons comme en-têtes de colonne et les identifiants des OTU comme noms de ligne, ou vice-versa. Les séquences peuvent être utilisées comme identifiants d'OTU.
  • Données sur les échantillons/sites (obligatoire) : un tableau contenant des métadonnées pour chacun des échantillons (ou sites). La position géographique de chaque échantillon est requise (de préférence sous forme de latitude et de longitude décimales), et les identifiants des échantillons doivent correspondre à ceux du tableau des OTU.
  • Tableau de taxonomie (facultatif) : un tableau contenant des informations sur chaque OTU. Au minimum, la séquence de l'OTU est nécessaire si elle n'est pas utilisée en tant qu'identifiant de l'OTU. Si une taxonomie a été attribuée aux OTU, le nom scientifique déduit de chaque OTU peut être fourni.
  • Données de l'étude (recommandé) : des informations sur l'étude / la génération de données OU un lien vers une publication ou une autre source d'où les informations (marqueur/gène, plateforme de séquençage, type d'échantillons, etc...) peuvent être extraites.

 

Exemples de jeux de données de métabarcoding de l'ADN électronique sur gbif.org

 

Lire l'article original

Revenir en haut