Mostra el registre d'ítem simple

dc.contributorCatala Roig, Neus
dc.contributorPou, Marc
dc.contributor.authorCàlvez Castro, Mireia
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
dc.date.accessioned2013-11-05T09:38:29Z
dc.date.available2013-11-05T09:38:29Z
dc.date.issued2013
dc.identifier.urihttp://hdl.handle.net/2099.1/19556
dc.description.abstractAquest projecte és per ajudar a qualsevol persona a orientar la seva carrera professional mitjançant els currículums registrats a Infojobs. D’aquests currículums ens interessa dos apartats principals: les experiències desenvolupades i els estudis realitzats durant la trajectòria professional. La ordenació cronològica d'aquestes dues relacions ens descriuen quins passos s’han dut a terme una persona al llarg de la vida fins arribar al punt present. Actualment, a Espanya no existeixen serveis d'informació i coneixement com els que es descriuen en aquest projecte, però hi ha agregadors de feina internacionals que tenen algunes semblances però no ens serveixen pel mercat Espanyol perquè la informació que mostren és d’altres països i tenen les seves pròpies dinàmiques, característiques i nomenclatures dels llocs de treball. Per tant, podem concloure que aquest projecte és pioner al nostre país. La nostra web és un portal on es mostraran gràfiques que descriuen els patrons de comportament dels llocs de treball, dels centres de formació, les empreses i els estudis a nivell estadístic. Ja que el projecte que es desenvolupa és per InfoJobs hi ha cert condicionament en algunes de les eines i tecnologies a utilitzar, algunes d’aquestes són: - “Highcharts”: llibreria que permet la representació i la càrrega de gràfics de forma dinàmica mitjançant “jQuery”. - Aplicació web: s’ha utilitzat Java i el template Spring. - Base de dades de grafs: s’ha utilitzat neo4j (base de dades no relacional). Un dels factors clau del projecte és la capacitat d'agregar informació per poder extreure'n el coneixement que gira al voltant d'aquests quatre camps d'informació que trobem en la secció d’experiències del currículum d'InfoJobs: professió (lloc de treball), nom d'empresa, centre de formació i estudis. En aquests camps es dóna l’opció de introduir valors lliures, fet que fa que la informació no pugui ser tractada de forma directa ja que hi trobem: - Gran disparitat d'informació. - Valors semànticament equivalents. - Valors similars escrits. Això ha provocat que s’hagi d'incloure un apartat inicial de neteja d'informació. A efectes de determinar la viabilitat del projecte s’ha considerat que hi hagi: - Volum de dades suficient per extreure patrons de comportament. - Qualitat i consistència de la informació. - Normalització dels camps, és a dir, conversió a majúscules, eliminació de signes de puntuació (accents, dièresis, punts, comes, …), substitució de caràcters especials (ñ, º, ª,), eliminació d'espais inicials i finals, eliminació de números, eliminació de “stopwords” (articles, preposicions, …), substitució de sinònims i aplicació d'expressions regulars. - Modelització del domini en un graf amb la ordenació cronològica de les experiències i estudis per tal de poder determinar de forma correcta la carrera professional. - Procés de càrrega del graf utilitzant el fitxers de dades que han estat prèviament tractats pel procés de normalització que consta de: a.- Explotació del graf utilitzant el conjunt d’Apis que ofereix la BBDD neo4j. b.- Presentació de resultats. Pel que fa al projecte, es durà a terme un desenvolupament iteratiu i incremental de manera que ens anem acostant a la solució global de projecte a partir de cicles de desenvolupament.
dc.language.isocat
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Informàtica::Sistemes d'informació
dc.subject.lcshData mining
dc.subject.otherNeo4j
dc.subject.otherAgregadors
dc.subject.otherWeb
dc.subject.otherExperiències
dc.subject.otherCurrículum
dc.subject.otherInfojobs
dc.subject.otherHighcharts
dc.subject.otherjQuery
dc.subject.otherNormalització
dc.subject.otherApi
dc.titlePla de carrera
dc.typeMaster thesis (pre-Bologna period)
dc.subject.lemacMineria de dades
dc.rights.accessOpen Access
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Politècnica Superior d'Enginyeria de Vilanova i la Geltrú
dc.audience.degreeENGINYERIA TÈCNICA D'INFORMÀTICA DE GESTIÓ (Pla 1992)
dc.contributor.covenanteeSchibsted Classified Media Spain


Fitxers d'aquest items

Thumbnail
Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple