La validation spatiale révèle la faible performance prédictive des modèles de cartographie écologique à grande échelle

Telles sont les conclusions, publiées dans la revue Nature d'une équipe de biométriciens au sein de laquelle figurent plusieurs membres de l'UPR Forêt et Sociétés. L'équipe révèle l'existence de biais conduisant à devoir relativiser le pouvoir prédicteur de tels modèles lorsqu'ils sont conduits à grande échelle.

La cartographie de la biomasse forestière est essentielle pour évaluer le bilan mondial du carbone. Cependant, les cartes à grande échelle actuelles montrent de fortes disparités, malgré de bonnes statistiques de validation de leurs modèles sous-jacents.

Les auteurs de cette publication attribuent cette contradiction à une faille dans les méthodes de validation, qui ignorent l'autocorrélation spatiale (SAC) des données, ce qui conduit à une évaluation trop optimiste du pouvoir prédictif des modèles.

Pour illustrer ce problème, les auteurs ont reproduit l'approche des études de cartographie à grande échelle utilisant un ensemble de données d'inventaire forestier massif de 11,8 millions d'arbres en Afrique centrale pour former et valider un modèle forestier aléatoire basé sur des variables multispectrales et environnementales. Une méthode standard de validation non spatiale suggère que le modèle prédit plus de la moitié de la variation de la biomasse forestière, tandis que les méthodes de validation spatiale prenant en compte l'autocorrélation spatiale révèlent en revanche un pouvoir prédictif quasi nul.

Cette étude souligne comment une pratique courante dans les grandes études de cartographie de données montre un pouvoir prédictif apparemment élevé, même lorsque les prédicteurs ont de mauvaises relations avec la variable écologique d'intérêt, ce qui peut conduire à des cartes et des interprétations erronées.

Publiée : 27/10/2020