Vencendo a escassez de recursos computacionais. Carvalho: Tradutor Automático Estatístico Inglês-Galego a partir do corpus paralelo Europarl Inglês-Português

نویسندگان

  • Paulo Malvar Fernández
  • José Ramom Pichel Campos
  • Óscar Senra Gómez
  • Pablo Gamallo
  • Alberto García
چکیده

À hora de desenvolver muitas ferramentas estat́ısticas de Processamento da Linguagem Natural tornase essencial a utilização de grandes quantidades de dados. Para salvar a limitação da escassez de recursos computacionais para ĺınguas minorizadas como o galego é necessário desenhar novas estratégias. No caso do galego, importantes romanistas têm teorizado que galego e português são variantes do português europeu. De um ponto de vista pragmático, esta hipótese poderia abrir uma nova linha de investigação para fornecer ao galego ricos recursos computacionais. Partindo do corpus paralelo inglês–português Europarl, imaxin|software compilou um corpus paralelo inglês–galego que utilizamos para criar um protótipo de tradutor automático estat́ıstico inglês–galego, cuja performance é comparável a Google Translate. Mantemos que é posśıvel implementar esta estratégia para desenvolver uma grande variedade de ferramentas computacionais para ĺınguas, como o galego, intimamente relacionadas com ĺınguas que já contam com um grande repertório de recursos computacionais.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apresentação do projecto Per-Fide: Paralelizando o Português com seis outras línguas

Neste documento apresentamos o projecto Per-Fide que tem como principal objectivo a criação de recursos bilingues entre a ĺıngua portuguesa e seis outras ĺınguas: espanhol, russo, francês, italiano, alemão e inglês. Este processo iniciar-se-á com a compilação de corpora paralelos em diferentes áreas, nomeadamente a literatura, religião e poĺıtica (legislativa e juŕıdica) e técnico-cient́ıfica. O...

متن کامل

PorTAl: Recursos e Ferramentas de Tradução Automática para o Português do Brasil (PorTAl: Resources and Tools for Machine Translation of Brazilian Portuguese) [in Portuguese]

This paper describes the machine translation (MT) site PorTAl developed aiming at integrating useful tools and resources for MT and the multilingual processing. Currently under development, the PorTAl will provide tools and resources for Brazilian Portuguese, English and Spanish (initially). In a near future we believe that the PorTAl will stimulate a progress in multilingual applications, part...

متن کامل

Extração de Vocabulário Multilíngue para Tradução em Domínios Especializados (Multilingual Vocabulary Extraction for Machine Translation in Specialized Domains) [in Portuguese]

This paper presents a process for multilingual vocabulary extraction which aims to auxiliate machine translation tools during the intermediation of the communication between multilingual teams. Resumo. Este trabalho apresenta um processo para a extração de vocabulário multilı́ngue proposto com o objetivo de auxiliar ferramentas de tradução de máquina durante a intermediação da comunicação entre ...

متن کامل

The language issue in Brazilian ophthalmological journals.

Nesta edição do Arquivos Brasileiros de Oftalmologia (ABO), Lira et al., estudaram a qualidade dos periódicos oftalmológicos brasileiros por meio do número de citações em fontes indexadas no Science Citation Index Expanded (SCIE) após dois anos da publicação (Fator de Impacto®) e da qualidade dos artigos de acordo com o Consolidated Standards for Reporting Trials (CONSORT). As publicações são e...

متن کامل

Análise Morfossintáctica para Português Europeu e Galego: Problemas, Soluções e Avaliação

As diferentes tarefas de análise morfossintáctica têm muita importância para posteriores níveis do processamento da linguagem natural. Por isso, estes processos devem ser realizados com ferramentas que garantam bons desempenhos em relação à cobertura, precisão e robustez na análise. FreeLing é uma suite com licença GPL desenvolvida pelo Grupo TALP da Universitat Politècnica de Catalunya. Este s...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Linguamática

دوره 2  شماره 

صفحات  -

تاریخ انتشار 2010