Processus de décision markoviens et préférences non classiques

نویسنده

  • Paul Weng
چکیده

RÉSUMÉ. Le modèle classique des processus de décision markoviens repose implicitement sur une structure de préférence induite par l’existence de coûts scalaires additifs et l’utilisation d’un certain critère d’évaluation des politiques (total, total pondéré, moyenne, ...). Cette structure de préférence s’appuie sur des hypothèses fortes permettant de vérifier les principes de la programmation dynamique. Nous nous intéressons ici à des processus de décision markoviens dont la structure de préférence est non classique et énonçons des propriétés simples et suffisantes sur ces préférences pour l’application de méthodes fondées sur la programmation dynamique. Ainsi ces propriétés délimitent une classe plus large de processus de décision markoviens résolubles par la programmation dynamique.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Conditions générales pour l'admissibilité de la programmation dynamique dans la décision séquentielle possibiliste

RÉSUMÉ. Nous nous intéressons à la contrepartie possibiliste des processus de décision markoviens. À l’instar du modèle classique, trois relations de préférence peuvent être distinguées (préférences sur les chemins, sur les loteries et sur les politiques). Nous énonçons des propriétés simples et suffisantes (transitivité, invariance par translation, indépendance) sur la relation de préférence s...

متن کامل

Apprentissage de la structure des processus de décision markoviens factorisés pour l’apprentissage par renforcement

Des algorithmes de planification récents issus de la théorie de la décision sont capables de trouver des politiques optimales ou quasi-optimales sur des problèmes de grande taille en utilisant le formalisme des processus de décision markoviens factorisés (FMDPs). Cependant, ces algorithmes ont besoin d’une connaissance a priori de la structure des problèmes qu’ils résolvent. Dans cette contribu...

متن کامل

Un cadre graphique et algébrique pour les problèmes de décision incluant incertitudes, faisabilités et utilités

RÉSUMÉ.Dans cet article, nous présentons un cadre générique, graphique et algébrique, permettant de représenter et de manipuler des problèmes de décision séquentielle incluant incertitudes, faisabilités et utilités. Ce cadre, dénommé PFU pour Plausibilités, Faisabilités et Utilités, généralise de nombreux cadres proposés dans le domaine de l’Intelligence Artificielle : problèmes de satisfiabili...

متن کامل

Résolution exacte et approchée de problèmes de décision markoviens formulés en logique propositionnelle

RÉSUMÉ. Nous présentons une méthode factorisée de résolution de Processus de Décision Markoviens formulés en logique propositionnelle. Nous montrons que la complexité de la résolution de tels problèmes dépend directement de celles des opérations logiques mises en œuvre telles que le test de satisfaisabilité. Afin de réduire cette complexité, nous proposons une méthode d’approximation des problè...

متن کامل

Compositional Reasoning on (Probabilistic) Contracts

In this paper, we focus on Assume/Guarantee contracts consisting in (i) a non deterministic model of components behaviour, and (ii) a stochastic and non deterministic model of systems faults. Two types of contracts capable of capturing reliability and availability properties are considered. We show that Satisfaction and Refinement can be checked by effective methods thanks to a reduction to cla...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Revue d'Intelligence Artificielle

دوره 20  شماره 

صفحات  -

تاریخ انتشار 2006