Le protocole Wetlands souffre-t-il de faiblesses statistiques d’échantillonnage biaisant en partie l’interprétation de ses résultats ? Un article français paru dans la revue Ecology & Evolution pose la question qui fâche.
C’est toujours amusant de lire des papiers de personnes avec qui j’échange fréquemment sur twitter. Et quand ça parle de biostatistiques et de canards plongeurs, je tenais là un duo gagnant pour occuper mon dimanche après-midi. Bon, comme l’article aborde surtout traitement statistique de données et biais de protocoles terrain dans cet article, commençons par égayer cet article de blog avec la star de ce papier, le Fuligule milouin (Aythya ferina). Profitez-en, le rapport avec cet Anatidé est bien moins évident par la suite !
Un problème de protocole dans le Wetlands ?
Ce travail s’intéresse donc aux problèmes d’analyses des données dans le cadre de gros programmes de suivis naturalistes. Ici, le cas du comptage comptage Wetlands International des oiseaux d’eau. En France, le suivi national est d’ailleurs assuré par la LPO. Votre serviteur y participa d’ailleurs lorsque cela lui fut possible par le passé.
Alors, que reprochent ces auteurs au programme Wetlands ? Pas son principe je vous rassure. Mais pour faire simple, le vieil adage du Diable dans les détails se vérifie ici. Car ces grands programmes demeurent cruciaux pour comprendre l’impact de l’homme et du réchauffement climatique sur les oiseaux d’eau. Mais ces enquêtes souffrent, selon les mots des auteurs eux-mêmes, de faiblesses de méthodologie statistique. En résumé, le plan était un peu brouillon au démarrage, et forcément ça fait tâche à l’arrivée.
Un problème initial d’échantillonnage
On va faire simple pour éviter le plus d’équations possibles ici. Pour les auteurs il y a un problème avec l’échantillonnage spatial des points observés et l’abondance relative des populations. Concrètement, cela veut dire quoi ? Comme chaque observateur prend un spot lors des comptages Wetlands, et fait en sorte de collecter le plus de données d’oiseaux d’eaux possibles lors des dates proposées au cours de l’hiver.
Seulement voilà, l’échantillonnage des sites (on peut pas tout couvrir) par maille de territoire attribuée n’est pas parfait, il souffre de biais statistiques qui vont légèrement biaiser au final les tendances du comptage. Ce qui est un peu gênant quand on se penche dessus. Pour vérifier cela, les auteurs ont créé un modèle des variations spatiales pour le Fuligule milouin et testé leur autocorrélation spatiale.
L’autocorrélation spatiale permet de rechercher la corrélation statistique entre les mesures géographiquement voisines d’un phénomène mesuré. Ils ont repris comme exemple de données les comptages Wetlands de Fuligules milouins sur un jeu de mailles de 75×75 km et regardé les comptages sur les sites prospectés pour cette espèce de canard plongeur. Enfin, ils ont effectué des test de Moran pour vérifier cette autocorrélation spatiale.
Un modèle qui vient bousculer les jeux de données Wetlands
Les auteurs ont ensuite comparé leur modèle aux résultats du protocole Wetlands. Bonne nouvelle, il indique lui aussi les mêmes tendances pour le Fuligule milouin. Donc ils peuvent en conclure que leur modèle est robuste. Ils s’en sont ainsi servi pour discuter des problèmes rencontrés avec les jeux de données Wetlands. Or ce modèle n’a de cesse de souligner le problème de départ des données Wetlands. Le plan et le protocole d’échantillonnage ne sont pas si corrects que cela. Il va cependant être difficile de détricoter ce protocole largement mis en œuvre par les associations sur le terrain !
Seulement voilà, le protocole Wetlands a tendance à ne pas assez prendre en compte les changements spatio-temporels dans la démographie des oiseaux aquatiques. C’est à dire, si les populations se décalent un peu des sites échantillonnés, il existe un risque que ce soit trop pris comme un déclin. Ainsi, on ne pas totalement exclure que le déclin du Fuligule milouin dans le nord-ouest de l’Europe ne soit pas dû aussi au fait que les individus restent plus près de leurs aires de reproduction. Cette tendance vient alors biaiser l’interprétation des données Wetlands.
Faut-il abandonner le programme Wetlands ?
Pour conclure, cette étude de @OFBiodiversite propose un cadre statistique pratique pour évaluer quantitativement les changements spatiaux et temporels des tendances démographiques. Mais elle ne peut pas faire de miracles si la méthode d’échantillonnage n’était pas suffisamment robuste. Or c’est un peu le « pavé dans la mare au canard » de cette étude. Il manque au programme Wetlands et de manière plus générale pour ces programmes de science participative une véritable stratégie d’échantillonnage standardisée.
Ce qui, selon le but visé par les auteurs, permettrait d’empêcher les problèmes de représentativité de l’échantillon et d’hétérogénéité spatiale de l’effort d’échantillonnage avant même que ne débute la collecte des données. Bref, les auteurs ne récusent pas le principe de ces enquêtes participatives. Mais leurs faiblesses d’échantillonnage et donc leurs biais statistiques qui les rend perfectibles. Les auteurs notent aussi qu’aux USA, les ornithologies préfèrent abandonner les anciens protocoles d’échantillonnage pour tout remettre à plat avec de nouveaux échantillonnages standardisés. Un exemple à suivre aussi chez nous ?