Le Secrétariat du GBIF recherche des candidatures de personnes ou d'institutions susceptibles d'améliorer la qualité et la réutilisabilité des données disponibles sur GBIF.org dans des environnements de cloud computing.
Avec un financement via une subvention du programme informatique mondial GEO-Microsoft, le/la contractant(e) sélectionné(e) mettra en œuvre des protocoles d'analyse de la diversité phylogénétique sur l'environnement Microsoft (MS) Azure à l'aide du logiciel Biodiverse, des données d'occurrence du réseau GBIF et des phylogénies d'OpenTree of Life (OToL).
Le Secrétariat du GBIF dirigera le projet avec le soutien de Shawn Laffan (logiciel Biodiverse | Université de Nouvelle-Galles du Sud) et Emily Jane McTavish (OpenTree of Life | Université de Californie Merced) et en partenariat avec le Groupe de travail sur la diversité phylogénétique (PDTF) de la Commission de la survie des espèces de l'UICN.
Contexte et dimension des travaux
En mai 2021, le GBIF a commencé à placer des instantanés mensuels des occurrences du GBIF dans le catalogue de données Microsoft Azure. La personne ou l'institution sous-traitée élargira ce travail, d'abord en implémentant le logiciel Biodiverse dans MS Azure, puis en développant et en évaluant la qualité des flux de filtrage pour les données d'occurrence accessibles via le GBIF dans le catalogue de données Microsoft Azure.
Le sous-ensemble de données filtré sera ensuite associé à la dernière phylogénie Open Tree of Life, produisant des produits de diversité phylogénétique spatialement explicites pour l'analyse de divers clades et zones géographiques. Le PDTF aidera à évaluer la qualité des produits de données résultants.
L'objectif du projet est de générer des produits de données mensuels automatisés, pouvant être utilisés dans la recherche sur la diversité phylogénétique d'ici la fin de la période de subvention.
Les tâches principales comprennent :
Préparer des workflows pour le filtrage des données accessibles via le GBIF
Évaluer la qualité des données filtrées
Etablir la correspondance des noms entre les données véhiculées par OToL et GBIF
Exécuter et évaluer des métriques sur la diversité phylogénétique intégrant les données d'occurrence accessibles via l'OToL et le GBIF à l'aide de Biodiverse
Rédiger un manuscrit en tant que premier auteur basé sur ce travail, soit dans un article méthodologique ou comme analyse d'un grand clade
Le candidat sélectionné devra effectuer le travail à distance ou dans son établissement d'accueil. Les candidats doivent démontrer leur capacité à travailler de manière autonome et à rencontrer virtuellement des chefs de projet sur trois continents.
Compétences et expérience souhaitées
Le titulaire doit posséder des compétences exceptionnelles en bioinformatique, une bonne connaissance des données accessibles via le GBIF et une compréhension de l'informatique "cloud" et des analyses phylogénétiques.
Les compétences souhaitées incluent :
Expérience dans l'analyse des données véhiculées par le GBIF
Connaissance de R, Perl ou Python et des API
Expérience démontrable du développement de logiciels open source et de flux de travail de traitement de données reproductibles
Connaissance de la diversité phylogénétique, étayée par d'autres analyses de biodiversité phylogénétiques et spatialement explicites
Expérience dans les systèmes de calcul distribués ou basés sur le cloud
Diplôme supérieur dans un domaine pertinent lié à la biodiversité, à l'informatique ou au travail du GBIF, ou expérience équivalente
Compétence professionnelle complète en anglais
Expérience démontrée dans la rédaction de publications scientifiques
Capacité à travailler à distance avec une supervision limitée
Rémunération
Le paiement du contrat s'élèvera à 60 000 USD, la durée de son mandat dépendant de l'expérience de l'entrepreneur et de la réalisation des livrables du projet. Le contrat et les livrables doivent être achevés en un an.
Plus de détails sur cet appel à propositions sur cette page (en anglais)