Améliorer les performances d'un modèle prédictif: perspectives et réalité
نویسنده
چکیده
Résumé. Dans cet article, nous montrons que les performances d’un modèle prédictif dépendent généralement plus de la qualité des données et du soin apporté à leur préparation et à leur sélection, que de la technique de modélisation elle-même. Entre deux techniques, l’écart de performance est souvent négligeable en regard des incertitudes résultant de la définition de la variable à expliquer et de la représentativité de l’échantillon d’étude. Toutefois, le rééchantillonnage et l’agrégation de modèles peuvent permettre de réduire drastiquement la variance et parfois même le biais de certains modèles. De bons résultats peuvent aussi être obtenus simplement par la partition de modèles, c’est-à-dire en partitionnant en classes l’échantillon initial et en construisant un modèle sur chaque classe.
منابع مشابه
Conception d'un Simulateur de Grilles Orienté Gestion d'équilibrage
Résumé. Les dernières évolutions dans le calcul distribué ont conduit à l’apparition de nouvelles infrastructures appelées grilles de calcul. La gestion d'équilibrage de charge dans ce type d'infrastructure est complexe et exige donc des outils sophistiqués pour analyser les algorithmes avant de les appliquer aux vrais systèmes. Cependant une recherche étendue a été conduite dans le domaine de ...
متن کاملRéalité mixte et travail collaboratif : IRVO, un modèle de l'interaction homme-machine. (Mixed reality and collaborative work: IRVO, a human-computer interaction model)
ion de l’application Présentation de l’application Figure 42 : Les couches de l’implémentation de AMF Ce rapprochement d’AMF avec Arch permet d’aller au-delà d’un simple modèle d’architecture. En effet, le modèle AMF est directement instancié en contrôleur de dialogue et le « moteur AMF » pilote donc le dialogue de l’application [Vaisman 2002]. Le formalisme graphique utilisé pour modéliser la ...
متن کاملAméliorer les performances de l'industrie logicielle par une meilleure compréhension des besoins
progrès considérables réalisés par la technologie informatique, on constate que les acteurs restent très souvent critiques par rapport à leur systèmes d'information. Une des causes de cet écart entre les espoirs et la réalité trouve sa source dans la difficulté à produire un cahier des charges suffisamment détaillé pour les opérationnels et interprétable par les spécialistes des systèmes d'info...
متن کاملÉtude Comparative d'un Détecteur CFAR Neuronal de Plusieurs Cibles Radar dans un Fouillis de type K-Distribution
This paper presents the development and performance evaluation of a particular Multi-Layer Perceptron neural network (MLP) classifier for radar target detection in a noisy, non-Gaussian environment using CFAR (Constant False Alarm Rate). The Technique, architecture details and principle of working of the MLP-CFAR detector training algorithm are presented. A comparison of the MLP-CFAR performanc...
متن کاملLe forage distribué des données: une méthode simple, rapide et efficace
Résumé. Dans cet article nous nous attaquons au problème du forage de très grandes bases de données distribuées. Le résultat visé est un modèle qui soit et prédictif et descriptif, appelé méta-classificateur. Pour ce faire, nous proposons de miner à distance chaque base de données indépendamment. Puis, il s’agit de regrouper les modèles produits (appelés classificateurs de base), sachant que ch...
متن کامل