• A factory of comparable corpora from Wikipedia 

    Barrón-Cedeño, Alberto; España Bonet, Cristina; Boldoba Trapote, Josu; Márquez Villodre, Luís (Association for Computational Linguistics, 2015)
    Texto en actas de congreso
    Acceso abierto
    Multiple approaches to grab comparable data from the Web have been developed up to date. Nevertheless, coming out with a high-quality comparable corpus of a specific topic is not straightforward. We present a model ...
  • Explotación de wikipedia para el enriquecimiento de un traductor automático 

    Boldoba Trapote, Josu (Universitat Politècnica de Catalunya, 2014-06-22)
    Proyecto/Trabajo final de carrera
    Acceso abierto
    Este trabajo aprovecha la naturaleza multilingüe de Wikipedia para construir sistemas de traducción especializados en diferentes áreas de conocimiento. En él se describen los procedimientos seguidos para extraer corpus ...
  • Wikicardi : hacia la extracción de oraciones paralelas de Wikipedia 

    Boldoba Trapote, Josu; Barrón-Cedeño, Alberto; España Bonet, Cristina (2014-03-01)
    Report de recerca
    Acceso abierto
    Uno de los objetivos del proyecto Tacardi (TIN2012-38523-C02-00) consiste en extraer oraciones paralelas de corpus comparables para enriquecer y adaptar traductores automáticos. En esta investigación usamos un subconjunto ...