Now showing items 1-3 of 3

    • A factory of comparable corpora from Wikipedia 

      Barrón-Cedeño, Alberto; España Bonet, Cristina; Boldoba Trapote, Josu; Márquez Villodre, Luís (Association for Computational Linguistics, 2015)
      Conference report
      Open Access
      Multiple approaches to grab comparable data from the Web have been developed up to date. Nevertheless, coming out with a high-quality comparable corpus of a specific topic is not straightforward. We present a model ...
    • Explotación de wikipedia para el enriquecimiento de un traductor automático 

      Boldoba Trapote, Josu (Universitat Politècnica de Catalunya, 2014-06-22)
      Master thesis (pre-Bologna period)
      Open Access
      Este trabajo aprovecha la naturaleza multilingüe de Wikipedia para construir sistemas de traducción especializados en diferentes áreas de conocimiento. En él se describen los procedimientos seguidos para extraer corpus ...
    • Wikicardi : hacia la extracción de oraciones paralelas de Wikipedia 

      Boldoba Trapote, Josu; Barrón-Cedeño, Alberto; España Bonet, Cristina (2014-03-01)
      Research report
      Open Access
      Uno de los objetivos del proyecto Tacardi (TIN2012-38523-C02-00) consiste en extraer oraciones paralelas de corpus comparables para enriquecer y adaptar traductores automáticos. En esta investigación usamos un subconjunto ...