Lundi 25 Novembre 2024

open data

Le Secrétariat du GBIF recherche des candidatures de personnes ou d'institutions susceptibles d'améliorer la qualité et la réutilisabilité des données disponibles sur GBIF.org dans des environnements de cloud computing.

Avec un financement via une subvention du programme informatique mondial GEO-Microsoft, le/la contractant(e) sélectionné(e) mettra en œuvre des protocoles d'analyse de la diversité phylogénétique sur l'environnement Microsoft (MS) Azure à l'aide du logiciel Biodiverse, des données d'occurrence du réseau GBIF et des phylogénies d'OpenTree of Life (OToL).

Le Secrétariat du GBIF dirigera le projet avec le soutien de Shawn Laffan (logiciel Biodiverse | Université de Nouvelle-Galles du Sud) et Emily Jane McTavish (OpenTree of Life | Université de Californie Merced) et en partenariat avec le Groupe de travail sur la diversité phylogénétique (PDTF) de la Commission de la survie des espèces de l'UICN.

 

Date limite de candidature : 15 novembre 2021

 

 

Contexte et dimension des travaux

En mai 2021, le GBIF a commencé à placer des instantanés mensuels des occurrences du GBIF dans le catalogue de données Microsoft Azure. La personne ou l'institution sous-traitée élargira ce travail, d'abord en implémentant le logiciel Biodiverse dans MS Azure, puis en développant et en évaluant la qualité des flux de filtrage pour les données d'occurrence accessibles via le GBIF dans le catalogue de données Microsoft Azure.

Le sous-ensemble de données filtré sera ensuite associé à la dernière phylogénie Open Tree of Life, produisant des produits de diversité phylogénétique spatialement explicites pour l'analyse de divers clades et zones géographiques. Le PDTF aidera à évaluer la qualité des produits de données résultants.

L'objectif du projet est de générer des produits de données mensuels automatisés, pouvant être utilisés dans la recherche sur la diversité phylogénétique d'ici la fin de la période de subvention.

Les tâches principales comprennent :

    Préparer des workflows pour le filtrage des données accessibles via le GBIF
    Évaluer la qualité des données filtrées
    Etablir la correspondance des noms entre les données véhiculées par OToL et GBIF
    Exécuter et évaluer des métriques sur la diversité phylogénétique intégrant les données d'occurrence accessibles via l'OToL et le GBIF à l'aide de Biodiverse
    Rédiger un manuscrit en tant que premier auteur basé sur ce travail, soit dans un article méthodologique ou comme analyse d'un grand clade

Le candidat sélectionné devra effectuer le travail à distance ou dans son établissement d'accueil. Les candidats doivent démontrer leur capacité à travailler de manière autonome et à rencontrer virtuellement des chefs de projet sur trois continents.

 

Compétences et expérience souhaitées

Le titulaire doit posséder des compétences exceptionnelles en bioinformatique, une bonne connaissance des données accessibles via le GBIF et une compréhension de l'informatique "cloud" et des analyses phylogénétiques.

Les compétences souhaitées incluent :

    Expérience dans l'analyse des données véhiculées par le GBIF
    Connaissance de R, Perl ou Python et des API
    Expérience démontrable du développement de logiciels open source et de flux de travail de traitement de données reproductibles
    Connaissance de la diversité phylogénétique, étayée par d'autres analyses de biodiversité phylogénétiques et spatialement explicites
    Expérience dans les systèmes de calcul distribués ou basés sur le cloud
    Diplôme supérieur dans un domaine pertinent lié à la biodiversité, à l'informatique ou au travail du GBIF, ou expérience équivalente
    Compétence professionnelle complète en anglais
    Expérience démontrée dans la rédaction de publications scientifiques
    Capacité à travailler à distance avec une supervision limitée

 

 

Rémunération

Le paiement du contrat s'élèvera à 60 000 USD, la durée de son mandat dépendant de l'expérience de l'entrepreneur et de la réalisation des livrables du projet. Le contrat et les livrables doivent être achevés en un an.

 

Plus de détails sur cet appel à propositions sur cette page (en anglais)

Le GBIF France vous invite au webinaire : Encourager les acteurs du secteur privé à partager leurs données de biodiversité via le réseau mondial GBIF

 

Cet événement se tiendra le Mercredi 27 janvier 2021 de 14h à 16h et abordera les sujets suivants :

  • Le rôle que jouent le GBIF France et le département Espaces & Partenariats de l’UMS PatriNat dans l'accès aux informations sur la biodiversité au niveau national
  • Le projet OpenPSD dont l'objectif est d'encourager la publication de données par le secteur privé
  • Les avantages de la publication de données sur la biodiversité via le GBIF
  • Les étapes à suivre pendant le processus.
  • Des retours d'expérience d'entreprises privées (TOTAL, IMERYS et EUROVIA, projet Data4Nature AFD)

 

Plus d'informations et inscription sur cette page.

Challenge Ebbe-Nielsen 2017 du GBIF

Le GBIF Ebbe Nielsen Challenge 2017 décernera des prix pour un total de 14 000€  aux développeurs et scientifiques créant des outils pour améliorer l'accessibilité et l'interopérabilité des données de biodiversité disponibles dans les entrepôts de données libres, permettant ainsi de plus vastes explorations scientifiques et réutilisations de celles-ci.

Le Challenge repose sur l'adoption croissante de stratégies open data par les journaux scientifiques et les organismes de financement de la recherche. Afin de respecter ces règles, les chercheurs doivent mettre en libre accès les données à l'origine de leurs travaux, la plupart du temps en déposant leurs jeux de données dans des entrepôts de données en accès libre comme Dryad et Figshare.

Le Ebbe Nielsen Challenge 2017 demande aux participants de développer des applications web, scripts ou autres outils pour automatiser la découverte et l'extraction des données de biodiversité pertinentes dans les entrepôts de données en libre accès. Ces outils doivent permettre de générer des jeux de données prêts pour la publication sur le GBIF.org grâce à l'une des méthodes suivantes :

  • Recherche automatique de données ouvertes disponibles dans les entrepôts de données publics
  • Extraction efficace des informations nécessaires pour générer des checklists, des jeux de données d'occurrences d'espèces ou d'échantillonnage (par exemple nom scientifique, date, localisation de l'occurrence, etc.) à partir des jeux de données dans ces entrepôts
  • Correspondance (mapping)des en-têtes de colonnes et/ou de leur contenu avec les termes du standard Darwin Core
  • Conversion automatisée des données formatées en Archives Darwin Core prêtes pour la publication sur le GBIF.org

Beaucoup de jeux de données accessibles dans des entrepôts de données ont une structure tabulaire et contiennent les informations de base nécessaires à la génération de données d'occurrences d'espèces : noms scientifiques, dates, localisations géographiques, quantités, ainsi que d'autres éléments intéressants pouvant être standardisés. Si les jeux de données possèdent une licence CC0, CC BY ou CC BY-NC (utilisées dans le réseau GBIF), ils sont adaptés à être réutilisés, republiés et partagés (avec citation adéquate) avec un public très large de chercheurs du monde entier.

Les soumissions pour le Challenge doivent concevoir des processus pour préparer ces jeux de données au format Darwin Core Archive (DwC-A), qui permet actuellement la publication de quasiment 800 millions enregistrements d'occurrences d'espèces dans le réseau GBIF, qui comprend plus de 1000 institutions éditrices de données.

Le jury provisoire pour l'édition 2017 du Challenge inclut :

La période de soumission va du 15 juin au 05 septembre 2017. Les participants doivent enregistrer chaque membre de l'équipe sur DevPost, qui héberge tous les documents et règles liés au Challenge. Allez sur le site https://gbif2017.devpost.com pour plus de détails sur les conditions de participation.

Revenir en haut