Credit Assignment in Deep Reinforcement Learning

Thomas Mesnard

Thèse Année : 2023

Credit Assignment in Deep Reinforcement Learning

Attribution de crédit pour l'apprentissage par renforcement dans des réseaux profonds

(1)

Thomas Mesnard

Fonction : Auteur
PersonId : 1373025
IdRef : 276937368

Centre de Mathématiques Appliquées de l'Ecole polytechnique

Résumé

Deep reinforcement learning has been at the heart of many revolutionary results in artificial intelligence in the last few years. These agents are based on credit assignment techniques that try to establish correlations between past actions and future events and use these correlations to become effective in a given task. This problem is at the heart of the current limitations of deep reinforcement learning and credit assignment techniques used today remain relatively rudimentary and incapable of inductive reasoning. This thesis therefore focuses on the study and formulation of new credit assignment methods for deep reinforcement learning. Such techniques could speed up learning, make better generalization when agents are trained on multiple tasks, and perhaps even allow the emergence of abstraction and reasoning.

L'apprentissage profond par renforcement a été au cœur de nombreux résultats révolutionnaires en intelligence artificielle ces dernières années. Ces agents reposent sur des techniques d'attribution de crédit qui cherchent à établir des corrélations entre actions passées et événements futurs et utilisent ces corrélations pour devenir performants à une tâche. Ce problème est au cœur des limites actuelles de l'apprentissage par renforcement et les techniques d'attribution de crédit utilisées sont encore relativement rudimentaires et incapables de raisonnement inductif. Cette thèse se concentre donc sur l'étude et la formulation de nouvelles méthodes d'attributions de crédit dans le cadre de l'apprentissage par renforcement. De telles techniques pourraient permettre d'accélérer l'apprentissage, de mieux généraliser lorsqu'un agent est entraîné sur de multiples tâches, et peut-être même permettre l'émergence d'abstraction et de raisonnement.

Mots clés

Deep Reinforcement Learning Credit Assignment Reasoning

Apprentissage par renforcement Attribution de crédit Raisonnement

Domaines

Intelligence artificielle [cs.AI] Machine Learning [stat.ML] Apprentissage [cs.LG]

Fichier principal

117786_MESNARD_2023_archivage.pdf (20.96 Mo)

Origine	Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-04538540

Soumis le : mardi 9 avril 2024-11:54:09

Dernière modification le : vendredi 24 janvier 2025-14:17:30

Archivage à long terme le : mercredi 10 juillet 2024-18:52:07

Dates et versions

tel-04538540 , version 1 (09-04-2024)

Identifiants

HAL Id : tel-04538540 , version 1

Citer

Thomas Mesnard. Credit Assignment in Deep Reinforcement Learning. Artificial Intelligence [cs.AI]. Institut Polytechnique de Paris, 2023. English. ⟨NNT : 2023IPPAX155⟩. ⟨tel-04538540⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

X CNRS INRIA INSMI STAR X-CMAP X-DEP-MATHA CMAP IP_PARIS CMAP_THESES

174 Consultations

119 Téléchargements

Credit Assignment in Deep Reinforcement Learning

Attribution de crédit pour l'apprentissage par renforcement dans des réseaux profonds

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager