• A factory of comparable corpora from Wikipedia 

      Barrón-Cedeño, Alberto; España Bonet, Cristina; Boldoba Trapote, Josu; Márquez Villodre, Luís (Association for Computational Linguistics, 2015)
      Text en actes de congrés
      Accés obert
      Multiple approaches to grab comparable data from the Web have been developed up to date. Nevertheless, coming out with a high-quality comparable corpus of a specific topic is not straightforward. We present a model ...
    • Explotación de wikipedia para el enriquecimiento de un traductor automático 

      Boldoba Trapote, Josu (Universitat Politècnica de Catalunya, 2014-06-22)
      Projecte/Treball Final de Carrera
      Accés obert
      Este trabajo aprovecha la naturaleza multilingüe de Wikipedia para construir sistemas de traducción especializados en diferentes áreas de conocimiento. En él se describen los procedimientos seguidos para extraer corpus ...
    • Wikicardi : hacia la extracción de oraciones paralelas de Wikipedia 

      Boldoba Trapote, Josu; Barrón-Cedeño, Alberto; España Bonet, Cristina (2014-03-01)
      Report de recerca
      Accés obert
      Uno de los objetivos del proyecto Tacardi (TIN2012-38523-C02-00) consiste en extraer oraciones paralelas de corpus comparables para enriquecer y adaptar traductores automáticos. En esta investigación usamos un subconjunto ...