Cet article fait suite à une première publication datant du début de semaine, dans laquelle Marc Rameaux se penche sur la nécessité de l’IA dans le monde agricole, sa compatibilité avec le vivant et les limites de l’exploitation industrielles des champs.
1. Une IA bien différente pour l’agriculture
Les notions de voisinage topologique, d’effet de renforcement entre des unités connexes comme le sont les automates cellulaires, de « clusters » intermédiaires entre l’élément unitaire et la totalité du champ ont fait réapparaître un type d’IA qui avait presque disparu du paysage des sciences cognitives : les cartes auto-adaptatives de Teuvo Kohonen.
Actuellement, l’IA est presque intégralement assimilée au « Machine Learning » et plus précisément encore à l’apprentissage par réseaux neuronaux, supervisé ou par renforcement, c’est-à-dire les différentes variantes de l’algorithme de rétropropagation du gradient.
Il ne faut pas nier les très grandes percées scientifiques dues au « Deep Learning », aux réseaux à très grands nombres de couches en mode supervisé ou renforcé. J’ai eu l’occasion dans ces colonnes même de faire l’éloge d’AlphaZero [1], l’IA de Google qui a émerveillé tous les amateurs de jeux de stratégie. De même, les DNN (Deep Neural Networks) ont rendu possible la reconnaissance de l’écriture manuscrite ou de patterns dans une image à des niveaux de fiabilité décisifs pour l’industrie.
Mais il est réducteur de confondre toute l’IA avec cette seule technologie. Les méthodes par inférence (logique floue, réseaux bayésiens, théorie des jeux, …) ou les autres techniques de pattern matching (algorithmes génétiques, support vector machines, …) forment avec les DNN le corpus cohérent des technologies d’IA.
Or, il est extrêmement instructif de comprendre pourquoi il faut appliquer une algorithmie plutôt qu’une autre, selon le domaine d’application. Ce sont de bonnes raisons qui nous font employer les cartes auto-adaptatives de Kohonen pour l’agriculture, plus que d’autres techniques, en particulier les DNN.
Il est plaisant de voir récompensés les travaux de Teuvo Kohonen, chercheur finlandais inclassable, ayant eu le courage de poursuivre les approches neuronales quand plus personne n’y croyait, personnalité haute en couleur, parfois injuste dans sa détestation exotique des mathématiciens mais ayant le mérite de soulever de vraies questions par son attitude provocante, auteur enfin d’algorithmes les plus originaux parmi les sciences cognitives.
Nous ne rentrerons pas dans le détail technique de ce que sont les algorithmes de Kohonen, bien résumés sous Wikipedia et sous les liens académiques associés[2]. Nous nous contenterons d’en faire comprendre la philosophie et pourquoi celle-ci est en relation étroite avec un domaine tel que l’agriculture et plus généralement avec tout écosystème.
Une carte auto-adaptative de Kohonen ne comporte qu’une seule couche de neurones. Cette couche va représenter l’espace de toutes les variables du phénomène observé, en respectant sa topologie.
Un algorithme de calcul de distance fait en sorte que les neurones situés dans un même voisinage sur la carte représentent des vecteurs proches dans l’espace de départ, par une compétition entre les neurones répondant au mieux au stimuli qu’est un vecteur de l’espace observé, en sélectionnant un neurone vainqueur pour qu’il se spécialise dans la représentation de cette partie de l’espace étudié et en spécialisant ses neurones proches en une zone cohérente.
Une carte de Kohonen peut donc être considérée comme une projection d’un espace à un très grand nombre de variables sur un espace plus petit et facilement visualisable, mais respectant toutes les notions de proximité de l’espace de départ. L’algorithme donne des propriétés mésoscopiques à la carte : chaque neurone n’est pas une individualité sans aucun rapport avec les autres : ils se regroupent dans des voisinages locaux en « clusters » spécialisés dans la représentation d’une partie du phénomène étudié.
Dans l’exemple de l’agriculture, l’espace d’entrée serait l’image spatiale du champ capturée par satellite ou drone, mais dont chaque pixel serait associé à un vecteur d’état complexe : signature spectrale du sol, mesure de la composition du sol à cet endroit, présence d’une plante à cet endroit, constantes biologiques de la plante, variables de contexte météorologiques au moment de l’observation, variables d’interaction avec les insectes au moment de l’observation, etc.
Le phénomène observé n’est donc pas un champ géométrique mais un champ de forces au sens physique du terme, fait de variables d’état complexes mesurant à la fois l’état du champ à chaque position et le contexte dans lequel il est plongé. Ajoutons que les variables d’état évoluent bien sûr dans le temps : chaque capture faite par un satellite ou un drone l’est à l’instant t, c’est l’évolution de l’état de la plante, de l’état du sol et des contextes météorologiques et d’interaction avec les insectes ou d’emploi de pesticides et engrais qui nous intéresse.
L’on peut rajouter cette dimension temporelle à l’apprentissage en décrivant les vecteurs d’état sur des pas de temps discrétisés. L’état du champ dans une certaine parcelle à l’instant t1 peut ainsi être proche de l’état d’une autre parcelle, lointaine géographiquement, mais proche sur le plan de l’état biologique. Cette proximité apparaitra dans la carte et permettra de mesurer les évolutions et propagation d’état dans les différentes parcelles.
Il faut noter que les cartes auto-adaptatives de Kohonen s’inspirent de façon la plus rapprochée connue des mécanismes réels du vivant, bien plus que les réseaux de neurones à couches du DNN : ces derniers ont montré la présence d’optimisation discriminante non-linéaire dans la cognition, nullement que les neurones biologiques réels agissaient comme un DNN.
Les algorithmes de Kohonen en revanche, bien qu’ils ne représentent qu’une toute petite partie de la réalité neuronale, sont calqués sur les fonctions de spécialisation cellulaire que l’on rencontre dans les organismes vivants, incluant le fait que les entités élémentaires que sont les cellules se regroupent en « clusters » locaux formant un tout, spécialisés dans la reproduction d’une fonction.
2. L’agriculture et l’induction du vivant
Un très bon exemple d’application des cartes de Kohonen nous est donné par l’étude suivante, concernant l’évolution de l’occupation hivernale des sols en Bretagne : Cf [3].
Les cartes de Kohonen permettent d’interpoler les clichés pris par satellite en complétant les intervalles de temps trop importants ou les précisions insuffisantes en résolution spatiale et spectrale, par recoupement entre des images précises mais prises à intervalles lointains et des images plus grossières capturées plus fréquemment.
L’IA de Kohonen donnent ainsi une très grande cohérence d’ensemble aux différentes mesures industrielles de l’agriculture 2.0, recoupant les données satellite, drones, météorologiques, entomologiques, d’état du sol et de constantes biologiques des plantes.
Les modèles prédictifs tiennent ainsi compte des interactions complexes entre les différentes parcelles : propagation, contagion, en bien comme en mal, seraient représentées, permettant de simuler et calculer les conséquences d’une application de pesticides ou de labourage de telle ou telle partie du champ sur telle autre.
La résurgence des travaux de Kohonen en agriculture est instructive vis-à-vis des rapports entre l’IA et le vivant. Les méthodes « classiques » d’apprentissage supervisé ou renforcé ne peuvent s’appliquer, car il faudrait pouvoir indiquer ce qu’est le résultat « exemplaire » en agriculture, réalité encore trop complexe.
Les méthodes supervisées donnent toute leur puissance dans des jeux sémantiquement fermés comme ceux de stratégie. L’agriculture, parce que son objet est le vivant, nous confronte à des réalités ouvertes, où le contexte change aussi rapidement que le phénomène étudié. Elle nécessite pour cette raison des technologies non supervisées, inductives, de pure observation avant la modélisation.
L’ « AGR-IA » nous enseigne ainsi que l’IA du futur devrait combiner DNN et cartes de Kohonen, de façon complémentaire : apprentissage supervisé et non supervisé, modélisation et observation pure, extraction des concepts clés par le DNN, harmonisation de ces concepts tenant compte de l’holistique du vivant.
Une fois encore, l’IA nous en apprend beaucoup sur ce qui différencie le vivant d’une industrie mécanisable, sans pour autant que le vivant ne se résume à l’IA.
Entre positivisme étroit et phénomène de mode des techno-prophètes du transhumanisme, la juste voie équilibrée ouvre de nouvelles ambitions, mais en conservant une certaine humilité.
[1] https://www.europeanscientist.com/fr/opinion/ia-nouvelle-renaissance/
[2] https://fr.wikipedia.org/wiki/Carte_auto_adaptative
[3] https://journals.openedition.org/cybergeo/3617?lang=fr&file=1
This post is also available in: EN (EN)