On-line Learning for Very Large Datasets Apprentissage Stochastique pour Très Grands Echantillons
نویسنده
چکیده
La conception de très grand systèmes d’apprentissage pose un grand nombre de problèmes non résolus. Savons nous, par exemple, construire un algorithme qui “regarde” la télévision pendant quelques semaines et apprend à énumérer les objets présents dans ces images. Les lois d’échelles de nos algorithmes ne nous permettent pas de traiter les quantités massives de données que cela implique. L’expérience suggère que les algorithmes les mieux adaptés sont les algorithmes stochastiques. Leur convergence est pourtant réputée beaucoup plus lente que celle des meilleurs algorithmes d’optimisation. Mais il s’agit de la convergence vers l’optimum empirique. Notre papier reformule la question en termes de convergence vers le point de meilleure généralisation et montre la superiorité d’un algorithme stochastique bien conçu.
منابع مشابه
Learning a hierarchy of specialized pairwise models for coreference resolution (Apprentissage d'une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence) [in French]
Learning a hierarchy of specialized pairwise models for coreference resolution This paper proposes a new method for significantly improving the performance of pairwise coreference models. Given a set of indicators, our method learns how to best separate types of mention pairs into equivalence classes for which we construct distinct classification models. In effect, our approach finds the best f...
متن کاملSimulations of large telecommunication networks based on probabilistic modeling
We describe a new technique for simulations of large communication networks. This technique is based on a new approach for communication networks modeling by means of point processes and stochastic geometry tools. Simulator ARC developed by the authors and described in the paper uses recent eeective geometrical algorithms for computing the topology of the system model. New algorithms based on s...
متن کاملApprentissage Par Renforcement : Analyse Des Crit Eres Moyens Et Pond Er Es En Hori- Zon Fini
E : Les probl emes de d ecision pos es par l'optimisation stochastique en horizon ni en l'absence de mod ele peuvent ^ etre trait es par des m ethodes adaptatives. Dii erents algorithmes d'apprentissage par renforcement ont et e propos es, tels le Q-Learning ou le R-Learning, mais ils sont d eenis pour des probl emes a horizon innni. On propose ici une mod elisation en horizon ni avec une compa...
متن کاملRankMerging: Apprentissage supervisé de classements pour la prédiction de liens dans les grands réseaux sociaux
Résumé. Trouver les liens manquants dans un grand réseau social est une tâche difficile, car ces réseaux sont peu denses, et les liens peuvent correspondre à des environnements structurels variés. Dans cet article, nous décrivons RankMerging, une méthode d’apprentissage supervisé simple pour combiner l’information obtenue par différentes méthodes de classement. Afin d’illustrer son intérêt, nou...
متن کاملGestion d'erreurs pour la fiabilisation des retours automatiques en apprentissage de la prosodie d'une langue seconde
The success of future syste ms for computer assisted foreign language learning relies on providing the learner personalized diagnosis and relevant corrections of its pronunciations. After a presentation of the problem of reliable automatic prosodic feedbacks in language learning, we present our work related to the processing of some errors stemming from the learner and from the system itself. T...
متن کامل