Chrome Extension
WeChat Mini Program
Use on ChatGLM

Amélioration Continue D'une Chaîne De Traitement De Documents Avec L'apprentissage Par Renforcement

Revue d'intelligence artificielle(2017)

Cited 0|Views1
No score
Abstract
Nous modelisons une chaine de traitement de documents comme un processus de deci-sion markovien, et nous utilisons l'apprentissage par renforcement afin de permettre a l'agent d'apprendre a construire des chaines adaptees a la volee, et de les ameliorer en continu. Nous construisons une plateforme qui nous permet de mesurer l'impact sur l'apprentissage de divers modeles, services web, algorithmes, parametres, etc. Nous l'appliquons dans un contexte indus-triel, specifiquement a une chaine visant a extraire des evenements dans des volumes massifs de documents provenant de pages web et d'autres sources ouvertes. Nous visons a reduire la charge des analystes humains, l'agent apprenant a ameliorer la chaine, guide par leurs retours (feedback) sur les evenements extraits. Pour ceci, nous explorons des types de retours differents, d'un feedback numerique requerant un important calibrage, a un feedback qualitatif, beaucoup plus intuitif et demandant peu, voire pas du tout, de calibrage. Nous menons des experiences, d'abord avec un feedback numerique, puis nous montrons qu'un feedback qualitatif permet tou-jours a l'agent d'apprendre efficacement. ABSTRACT. We model a document treatment chain as a Markov Decision Process, and use reinforcement learning to allow the agent to learn to construct and continuously improve custom-made chains on the fly . We build a platform which enables us to measure the impact on the. Cet article est une version etendue d'un article presente aux 26es Journees francophones d'Ingenierie des Connaissances Nicart et al. (2015).
More
Translated text
Key words
Document Image Analysis,Handwriting Recognition,Scene Text Recognition
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined