Mostra el registre d'ítem simple

dc.contributorRodríguez Hontoria, Horacio
dc.contributor.authorCollado Fructuoso, José Miguel
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
dc.date.accessioned2009-05-13T07:16:04Z
dc.date.available2009-05-13T07:16:04Z
dc.date.issued2009-01-26
dc.identifier.urihttp://hdl.handle.net/2099.1/6893
dc.description.abstractFreeling és un software open source que conté un conjunt d’eines lingüístiques com ara anàlisi morfològic, anàlisi sintàctic, classificació d’entitats, nombrades,etc,etc. La idea és que s’integri plenament en els tipus de dades ja definits al Freeling, afegint els tipus de dades necessaris. En aquest cas la estratègia escollida és fer aprenentatge automàtic a partir d’un corpus etiquetat manualment i crear un conjunt d’arbres de decisió que després el Freeling farà servir per respondre si dos elements sintàctics són coreferents o no. Per aquesta solució, utilitzarem la informació d’anàlisi morfològic que ens dóna Freeling,un anàlisi sintàctic superficial i informació semàntica procedent de Wordnet també integrat al Freeling. A partir d’aquesta informació es generaran uns conjunts d’exemples amb els que es construirà un model d’aprenentatge que s’integrarà al Freeling. Després es programarà al Freeling el mòdul corresponent per fer les consultes al model i respondre si dos sintagmes són coreferents o no. Partim d’una proposta per la llengua anglesa anomenada A Machine Learning Approach to Coreference Resolution of Noun Phrases, creada per Wee Meng Soon, Hwee Tou Ng i Daniel Chung Young Lim. Es tracta d’una aproximació senzilla però que dóna resultats excel·lents i ha estat sovint utilitzada com a baseline per molts sistemes més sofisticats de resolució de la coreferència. L’objectiu d’aquest treball és adaptar aquesta proposta al castellà aconseguint uns resultats similars i integrat al Freeling com un mòdul més. Val a dir, que la mateix desenvolupament es podrà utilitzar en català i d’altres idiomes que estiguin suportats al Freeling. També s’ha tingut en compta la tesis de la Marta Recasens Towards Coreference Resolution for Catalan and Spanish. En aquesta tesis hi ha una `amplia bibliografia sobre coreferència.
dc.language.isocat
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Informàtica::Enginyeria del software
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic
dc.subject.lcshLinguistics -- Computer programs
dc.subject.lcshOpen source software
dc.titleMòdul de correferència per al software Freeling
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacLingüística -- Programes d'ordinador
dc.subject.lemacProgramari lliure
dc.rights.accessOpen Access
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.provenanceAquest document conté originàriament altre material i/o programari no inclòs en aquest lloc web
dc.audience.degreeENGINYERIA INFORMÀTICA (Pla 2003)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple