Conformal prediction methods for complex data : application to real estate management - Connaissances, Incertitudes et Données
Thèse Année : 2022

Conformal prediction methods for complex data : application to real estate management

Méthodes de prédiction conforme pour des données complexes : application à la gestion du patrimoine immobilier

Résumé

Uncertainty quantification is not an easy task. Its difficulty depends on various factors related to the available data, the application domain, and also the learned task. Having multiple outputs to predict simultaneously can be even more demanding, principally when these outputs are correlated. This research work focuses on producing confidence regions for such complex problems, by using conformal prediction: a theoretically proven method that can beadded to any Machine Learning model to generate set predictions whose size and statistical guarantee depend on a user-defined error rate. Our first and main problem of interest consists of multi-target regression, where the objective is to predict many real-valued outputs at once. First, a simple extension of single-target regression conformal methods is proposed by following a naive approach that treats these targets as independent. Second, copulas are exploited to take into account the existing correlations between outputs when giving conformal regions. Third, ellipsoids are considered in order to produce more flexible conformal regions according to the possible relationships between targets while maintaining the desired error rate. Our second problem of interest is an applied research work that deals with debt prediction for tenants of rented social housing to control the errors of a particular class in a imbalanced binary classification context. In this case, Mondrian conformal prediction, which is a variant of conformal inference, is used to treat this problem with the guidance of real estate experts.
La quantification de l'incertitude n'est pas une tâche facile. Sa difficulté dépend de divers facteurs liés aux données disponibles, au domaine d'application et aussi à la tâche apprise. Avoir plusieurs sorties à prédire simultanément peut être encore plus exigeant, principalement lorsque ces sorties sont corrélées. Ce travail de recherche se concentre sur la production de régions de confiance pour de tels problèmes complexes, en utilisant la prédiction conforme : une méthode théoriquement prouvée qui peut être ajoutée à n'importe quel modèle d'apprentissage automatique pour générer des prédictions d'ensemble dont la taille et la garantie statistique dépendent d'un taux d'erreur défini par l'utilisateur. Notre premier et principal problème d'intérêt consiste en une régression multi-cibles, où l'objectif est de prédire plusieurs sorties à valeur réelle en même temps. Premièrement, une extension simple des méthodes conformes à la régression à cible unique est proposée en suivant une approche naïve qui traite ces cibles comme indépendantes. Deuxièmement, les copules sont exploitées pour prendre en compte les corrélations existantes entre les sorties lors de l'attribution de régions conformes. Troisièmement, les ellipsoïdes sont considérés afin de produire des régions conformes plus flexibles en fonction des relations possibles entre les cibles tout en maintenant le taux d'erreur désiré. Notre deuxième problème d'intérêt est un travail de recherche appliquée qui traite de la prédiction de la dette des locataires de logements sociaux loués afin de contrôler les erreurs d'une classe particulière dans un contexte de classification binaire déséquilibrée. Dans ce cas, la prédiction conforme Mondrian, qui est une variante de l'inférence conforme est utilisée pour traiter ce problème avec les conseils d’experts immobiliers.
Fichier principal
Vignette du fichier
These_UTC_Soundouss_Messoudi.pdf (10.4 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04684018 , version 1 (02-09-2024)

Identifiants

  • HAL Id : tel-04684018 , version 1

Citer

Soundouss Messoudi. Conformal prediction methods for complex data : application to real estate management. Machine Learning [stat.ML]. Université de Technologie de Compiègne, 2022. English. ⟨NNT : 2022COMP2716⟩. ⟨tel-04684018⟩
70 Consultations
48 Téléchargements

Partager

More