Mòdul de correferència per al software Freeling
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2099.1/6893
Tipus de documentProjecte/Treball Final de Carrera
Data2009-01-26
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Freeling és un software open source que conté un conjunt d’eines lingüístiques
com ara anàlisi morfològic, anàlisi sintàctic, classificació d’entitats, nombrades,etc,etc.
La idea és que s’integri plenament en els tipus de dades ja definits al Freeling,
afegint els tipus de dades necessaris. En aquest cas la estratègia escollida
és fer aprenentatge automàtic a partir d’un corpus etiquetat manualment
i crear un conjunt d’arbres de decisió que després el Freeling farà servir
per respondre si dos elements sintàctics són coreferents o no. Per aquesta
solució, utilitzarem la informació d’anàlisi morfològic que ens dóna Freeling,un anàlisi sintàctic superficial i informació semàntica procedent de Wordnet
també integrat al Freeling. A partir d’aquesta informació es generaran uns
conjunts d’exemples amb els que es construirà un model d’aprenentatge
que s’integrarà al Freeling. Després es programarà al Freeling el mòdul
corresponent per fer les consultes al model i respondre si dos sintagmes són
coreferents o no.
Partim d’una proposta per la llengua anglesa anomenada A Machine Learning Approach to Coreference Resolution of Noun Phrases, creada per Wee Meng Soon, Hwee Tou Ng i Daniel Chung Young Lim. Es tracta d’una aproximació senzilla però que dóna resultats excel·lents i ha estat sovint utilitzada com a baseline per molts sistemes més sofisticats de resolució de la
coreferència. L’objectiu d’aquest treball és adaptar aquesta proposta al castellà aconseguint uns resultats similars i integrat al Freeling com un mòdul
més. Val a dir, que la mateix desenvolupament es podrà utilitzar en català i d’altres idiomes que estiguin suportats al Freeling. També s’ha tingut en
compta la tesis de la Marta Recasens Towards Coreference Resolution for
Catalan and Spanish. En aquesta tesis hi ha una `amplia bibliografia
sobre coreferència.
MatèriesLinguistics -- Computer programs, Open source software, Lingüística -- Programes d'ordinador, Programari lliure
ProvinençaAquest document conté originàriament altre material i/o programari no inclòs en aquest lloc web
TitulacióENGINYERIA INFORMÀTICA (Pla 2003)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Collado_Fructuoso,José Miguel.pdf | 1,084Mb | Visualitza/Obre |