Ir al contenido (pulsa Retorno)

Universitat Politècnica de Catalunya

    • Català
    • Castellano
    • English
    • LoginRegisterLog in (no UPC users)
  • mailContact Us
  • world English 
    • Català
    • Castellano
    • English
  • userLogin   
      LoginRegisterLog in (no UPC users)

UPCommons. Global access to UPC knowledge

Banner header
5.910 Open-access theses in TDX
You are here:
View Item 
  •   DSpace Home
  • Tesis
  • Totes les tesis
  • View Item
  •   DSpace Home
  • Tesis
  • Totes les tesis
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

A Flexible Multitask Summarizer for Documents from Different Media, Domain and Language

Thumbnail
View/Open
01MFF_Portada_Resum_Sumari.pdf (223,3Kb)
02MFF_Capitol1_Introduccio.pdf (230,6Kb)
03MFF_Capitol2.pdf (461,6Kb)
04MFF_Capitol3.pdf (611,9Kb)
05MFF_Capitol4.pdf (361,0Kb)
06MFF_Capitol5.pdf (1,435Mb)
07MFF_Capitol6.pdf (335,2Kb)
08MFF_Capitol7.pdf (235,7Kb)
09_MFF_Conclusions.pdf (118,3Kb)
10MFF_Bibliografia.pdf (143,5Kb)
11MFF_Index.pdf (234,0Kb)
 
10.5821/dissertation-2117-93966
 
  View UPCommons Usage Statistics
  LA Referencia / Recolecta stats
Includes usage data since 2022
Cita com:
hdl:2117/93966

Show full item record
Fuentes Fort, Maria
Tutor / directorRodríguez Hontoria, HoracioMés informacióMés informacióMés informació
Chair / Department / Institute
Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
Document typeDoctoral thesis
Data de defensa2008-03-31
PublisherUniversitat Politècnica de Catalunya
Rights accessOpen Access
All rights reserved. This work is protected by the corresponding intellectual and industrial property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public communication or transformation of this work are prohibited without permission of the copyright holder
Abstract
Automatic Summarization is probably crucial with the increase of document generation. Particularly when retrieving, managing and processing information have become decisive tasks. However, one should not expect perfect systems able to substitute human sumaries. The automatic sumarization process strongly depends not only on the characteristics of the documents, but also on user different needs.Thus, several aspects have to be taken into account when designing an information system for summarizing, because, depending on the characteristics of the input documents and the desired results, several techniques can be aplied. In order to suport this process, the final goal of the thesis is to provide a flexible multitask summarizer architecture. This goal is decomposed in three main research purposes. First, to study the process of porting systems to different summarization tasks, processing documents in different lenguages, domains or media with the aim of designing a generic architecture to permit the easy addition of new tasks by reusing existents tools. Second, the developes prototypes for some tasks involving aspects related with the lenguage, the media and the domain of the document or documents to be summarized as well as aspects related with the summary content: generic, novelly summaries, or summaries that give answer to a specific user need. Third, to create an evaluation framework to analyze the performance of several approaches in written news and scientific oral presentation domains, focusing mainly in its intrinsic evaluation.
 
El resumen automático probablemente sea crucial en un momento en que la gran cantidad de documentos generados diariamente hace que recuperar, tratar y asimilar la información que contienen se haya convertido en una ardua y a su vez decisiva tarea. A pesar de ello, no podemos esperar que los resúmenes producidos de forma automática vayan a ser capaces de sustituir a los humanos. El proceso de resumen automático no sólo depende de las características propias de los documentos a ser resumidos, sino que es fuertemente dependiente de las necesidades específicas de los usuarios. Por ello, el diseño de un sistema de información para resumen conlleva tener en cuenta varios aspectos. En función de las características de los documentos de entrada y de los resultados deseados es posible aplicar distintas técnicas. Por esta razón surge la necesidad de diseñar una arquitectura flexible que permita la implementación de múltiples tareas de resumen. Este es el objetivo final de la tesis que presento dividido en tres subtemas de investigación. En primer lugar, estudiar el proceso de adaptabilidad de sistemas a diferentes tareas de resumen, como son procesar documentos producidos en diferentes lenguas, dominios y medios (sonido y texto), con la voluntad de diseñar una arquitectura genérica que permita la fácil incorporación de nuevas tareas a través de reutilizar herramientas existentes. En segundo lugar, desarrollar prototipos para distintas tareas, teniendo en cuenta aspectos relacionados con la lengua, el dominio y el medio del documento o conjunto de documentos que requieren ser resumidos, así como aspectos relacionados con el contenido final del resumen: genérico, novedad o resumen que de respuesta a una necesidad especifica. En tercer lugar, crear un marco de evaluación que permita analizar la competencia intrínseca de distintos prototipos al resumir noticias escritas y presentaciones científicas orales.
Doctoral programmeDOCTORAT EN INTEL·LIGÈNCIA ARTIFICIAL (Pla 1998)
CitationFuentes Fort, M. A Flexible Multitask Summarizer for Documents from Different Media, Domain and Language. Tesi doctoral, UPC, Departament de Llenguatges i Sistemes Informàtics, 2008. ISBN 9788469188828. DOI 10.5821/dissertation-2117-93966 . Available at: <http://hdl.handle.net/2117/93966>
URIhttp://hdl.handle.net/2117/93966
DOI10.5821/dissertation-2117-93966
DLB.6326-2009
ISBN9788469188828
Other identifiershttp://www.tdx.cat/TDX-1119108-172657
Collections
  • Tesis - Programa de Doctorat en Intel·ligència Artificial [72]
  • Tesis - Totes les tesis [5.910]
  View UPCommons Usage Statistics

Show full item record

FilesDescriptionSizeFormatView
01MFF_Portada_Resum_Sumari.pdf223,3KbPDFView/Open
02MFF_Capitol1_Introduccio.pdf230,6KbPDFView/Open
03MFF_Capitol2.pdf461,6KbPDFView/Open
04MFF_Capitol3.pdf611,9KbPDFView/Open
05MFF_Capitol4.pdf361,0KbPDFView/Open
06MFF_Capitol5.pdf1,435MbPDFView/Open
07MFF_Capitol6.pdf335,2KbPDFView/Open
08MFF_Capitol7.pdf235,7KbPDFView/Open
09_MFF_Conclusions.pdf118,3KbPDFView/Open
10MFF_Bibliografia.pdf143,5KbPDFView/Open
11MFF_Index.pdf234,0KbPDFView/Open

Browse

This CollectionBy Issue DateAuthorsOther contributionsTitlesSubjectsThis repositoryCommunities & CollectionsBy Issue DateAuthorsOther contributionsTitlesSubjects

© UPC Obrir en finestra nova . Servei de Biblioteques, Publicacions i Arxius

info.biblioteques@upc.edu

  • About This Repository
  • Metadata under:Metadata under CC0
  • Contact Us
  • Send Feedback
  • Privacy Settings
  • Inici de la pàgina