DOCUMENTS

Documents publiés

Compte rendu du séminaire décision

Compte rendu du séminaire décision



Le séminaire décision a eu lieu le 16 avril 2013 dans les locaux de Dassault Aviation à Saint Cloud (voir les planches de l’ordre du jour). Son objectif était de permettre à un public majoritairement non académiques (voir la liste associée) d’avoir un aperçu de l’état des lieux de la recherche dans le domaine de la décision dans les systèmes en interaction (systèmes artificiels aussi bien que opérateurs humains de ces systèmes). Pour ce faire, les trois premiers exposés ont été consacrés à une présentation de problématiques générales. Les deux exposés de l’après midi ont porté l’attention sur deux points, d’une part, l’apprentissage comme processus partie prenante de la problématique de la décision et ,d’autre part, des informations sur un projet ambitieux en cours (projet RESSAC) qui montre l’application d’un certain nombre de technologies pour la problématique de décision dans le cadre d’une collaboration engins aériens / engins sols.

Les organisateurs de ce séminaire étaient Abdel-Illah Mouaddib (abdel-illah.mouaddib@unicaen.fr) du GREYC et Bruno Patin (bruno.patin@dassault-aviation.com) de Dassault Aviation.

Les membres du club qui ont un accès privilégié au site du GDR pourront trouver au bas de la page les liens sur les présentations ainsi que la liste des participants.

Matinée



Exposé Décision et Robotique



Il a permis de présenter le cadre général de la problématique de la décision dans le contexte précisé en s’appuyant fortement sur l’approche POMDP (Partially Observable Markovian Decision Process) afin de classer les  différents types de défis posés par la décision et mettre en exergue les difficultés principales posées. Dans la problématique d’interaction il faut absolument pouvoir gérer les différentes modalités de l’autorité qui peuvent être nécessaire ;

Question : ce qui a été présenté concerne principalement la problématique de déplacement dans l’espace. Comment gérer d’autres considérations comme la coordination d’actions ? les contraintes liées à l’usage d’effecteurs ?
Réponse : chaque type de problème pose ses questions. Il n’y a donc pas de réponse a priori sinon la capacité à modéliser n’importe quel problème en terme du formalisme Markovien. Le point fondamental réside dans la définition de la fonction de récompense. Beaucoup de travaux existent cependant qui donnent des pistes sérieuses de travail.

Question : est-il possible de réaliser une approche multi-critères ?
Réponse : oui, encore une fois à partir de l’expression de la fonction de récompense.

Question : Peut-on hors ligne ou en ligne gérer la résolution ?
Réponse : le suivi de la variation de l’espérance peut être une méthode. Ce point reste à creuser néanmoins.

Question : peut-on estimer le temps de résolution ?
Réponse : En tout les cas on peut regarder a posteriori sur un jeu d’expérimentation la répartition des temps en fonction des paramètres d’entrée.

Exposé Modèles d’environnement pour la décision



l’un des axes forts de la recherche actuellement dans le domaine de la décision est de lier la décision à l’environnement dans lequel elle se construit et la nécessité majeure de bien conditionner la représentation de cet environnement pour un type de décision donné. Ce problème est central lors de la prise de décision dans un système distribué car il faut que la connaissance de l’environnement soit « correctement » partagée. L’exposé précise ce que cela signifie et présente les voies de recherche actuelles ;
Commentaire : Le modèle d’environnement inclus la dynamique des autres ET de soi.
Commentaire : La cohérence spatio-temporelle des informations est essentielle à tout processus de gestion d’un environnement pour la décision.

Question : dans le cadre du PEA action, un maillage est retenu afin de discrétiser l’environnement. Comment le choisit-on ?
Réponse : cela est une fonction de la tâche à accomplir. Dans le cas qui nous concerne il s’agit d’une surveillance d’objets de d’environnement et donc ce maillage doit être tel que l’on ne pourra pas oublier un de ces objets.
Commentaire : dans les problématiques de modèles d’environnement, on utilise pour la prédiction des simulateurs mettant en œuvre des modèles de l’environnement. Pour être pertinent, ces modèles peuvent devenir très complexes et amener à des temps de calcul rédhibitoires.

Question : comment organiser l’ensemble de l’information acquise ?
Réponse : ceci est un point dur. On sait cependant dans le cycle décisionnel à quel moment on se place (Observe/Orient).

Question : pourquoi ne pas intégrer les connaissances a priori comme des cartes d’obstacle ?
Réponse : la construction de l’environnement sans a priori est à un extrême du spectre. Il est bien évident qu’utiliser des connaissances en amont sera toujours une aide. Cela introduit un mécanisme supplémentaire de vérification si un écart entre la perception et la connaissance se fait jour.

Question : d’un point de vue pratique, quelle taille doit-on s’attendre à manipuler en mémoire ?
Réponse : cela dépend bien sur du modèle d’environnement. Une thèse a démarré au LAAS sur cette problématique (Peut-on avoir une référence ?)
Commentaire : Il est nécessaire de pouvoir garantir l’intégrité des informations créées. Par exemple, la localisation d’un aéronef est critique dans un processus d’atterrissage.

Après midi



Exposé Interaction hommes-robots



si la question posée ici était plus précisément l’interaction de robots évoluant dans le monde de tous les jours, l’orateur l’a généralisé au problème plus large d’engins situés interagissant avec des humains utilisateurs ou opérateurs. Il a présenté les voies de recherche et notamment la façon de s’appuyer sur des protocoles permettant de raisonner sur les connaissances échangées ;

Exposé Apprentissage et robotique



lors de cet exposé il a été montré à quel point les processus d’apprentissage pouvait influencer la décision (des actions spécifiques peuvent être entreprises pour acquérir une information) et à quel point la décision était essentiel pour les processus d’apprentissages (des actions spécifiques doivent être entreprises pour apprendre un nouveau processus). Il a montré à quel point aussi il serait nécessaire de disposer de capacité d’apprentissage afin d’avoir une réelle flexibilité de la décision ;

Question : Comment se positionnent les technologies d’apprentissage présentées vis-à-vis du Q-Learning (on trouvera une description de cette technologie sur la page http://en.wikipedia.org/wiki/Q-learning) ?
Réponse : L’apprentissage se fait sur un MDP prédéfini.

Commentaire : Toutes les techniques d’apprentissage sont en train de converger vers des problématiques d’optimisation stochastique.

Exposé Planification de drones, Projet RESSAC


voir http://action.onera.fr et plus particulièrement les publications -

Cet exposé fait l’état des lieux du développement RESSAC en cours à l’ONERA DCSD en se focalisant sur l’implémentation des fonctions décisionnelles. Beaucoup des points introduits dans les exposés précédents se trouvent donc instanciés sur ce drone volant à voilure tournante.

Commentaire : Il n’y a pas d’apprentissage dans le projet RESSAC au sens défini au dessus.

On trouvera pour chacun des exposés un ensemble de références pertinentes afin d’approfondir chacun de ces points.

Discussion



La journée a rassemblé une quarantaine de personnes d’horizons assez différents mais qui ont montré l’intérêt vis-à-vis de telles actions et tous ont souhaité des suites à cette journée (voir en dessous). On liste ici les éléments évoqués et les actions à suivre :

Beaucoup de questions et de discussions ont porté sur la maturité de telles technologies pour un usage dans l’industrie. La méthode d’accès aux résultats notamment avec la question de la méthode de transfert. PSA regrette l’absence de corps intermédiaire. Il est rappelé que des IRT (Instituts de Recherche Technologique) existent pour cette raison. Étant récent ils ne sont pas encore très connus. Dans tout les cas il serait nécessaire de pousser au plus vite à la maturation des technologies les plus matures montrées ici.

Le besoin d’une journée de présentation des besoins des industriels vers les académiques se fait sentir. D’une part, les industriels souhaitent faire avancer le problème précédent et voient dans une présentation de ce type un moyen de le faire, d’autre part, les académiques sont demandeurs afin de pouvoir mieux orienter leurs recherches ou avoir une meilleure idée des contraintes spécifiques posées par les différents métiers.

Il est décidé de mettre en place un « comité éditorial » afin de mettre en place une telle réunion. Il sera nécessaire de lier ce comité au GDR (on remarque d’ailleurs qu’il n’y a actuellement pas de groupes traitant de cette problématique de décision dans son entier). Rachid Alami pour les académiques et Bruno Patin pour les industriels vont initier ce comité et la journée à suivre.


Les organisateurs remercient Mme Evelyne Lefèvre pour son aide précieuse lors de la préparation de ce séminaire.