Aplicació de mineria de dades per modelar el comportament dels estudiants en un entorn d'aprenentatge virtual
Cita com:
hdl:2117/337055
Document typeMaster thesis
Date2021-11-01
Rights accessOpen Access
Except where otherwise noted, content on this work
is licensed under a Creative Commons license
:
Attribution-NonCommercial-NoDerivs 3.0 Spain
Abstract
A mitjans de març de l’any 2020, a causa de la pandèmia de la COVID-19, es va suspendre la docència presencial per donar a lloc a l’entorn d'aprenentatge virtual.
L'objectiu d'aquest treball és aplicar tècniques de mineria de dades per analitzar la interacció dels estudiants amb la plataforma Atenea en l’assignatura Fonaments d’Informàtica, que pertany al Grau en Enginyeria en Tecnologies Industrials. Es vol estudiar el seu comportament per a predir l’efecte en el seu rendiment i determinar si existeixen correlacions amb el seu rendiment acadèmic. També es vol crear models per a predir la nota i classificar els estudiants segons si han aprovat o suspès, per a una posterior anàlisi dels resultats.
Per dur a terme aquesta tasca s'aplicarà de forma rigorosa la metodologia CRISP-DM, que és la més utilitzada en el desenvolupament de projectes de Data Mining. Com a llenguatge de programació es farà servir Python i s'utilitzaran llibreries tals com Pandas per a la preparació de les dades i scikit-learn per a la creació del model.
Les dades de partida s’han preparat mitjançant una neteja i transformació per tal d’adequar-les al format necessari per a alimentar els models. Aquestes dades consten de 127 mostres d’alumnes repetidors del segon quadrimestre del curs 2019-2020. Per a la fase de modelatge s’ha construït diferents models tant de predicció com de classificació.
El model de predicció de nota mitjançant Random Forest no és fiable, ja que té un error gran. És necessari investigant quins són els requisits per a fer-lo viable. Els models de classificació han tingut bons resultats, el model de Random Forest ha obtingut lleugerament millors resultats que el de Regressió Logística. S’ha determinat com un major nombre de sessions, nombre major de fitxers entregats i visualització dels debats tenen està relacionat amb el fet d’aprovar. La participació en els fòrums ha estat molt baixa, pel que no s’ha pogut extreure cal relació. Quant als models de clustering han portat poques conclusions, confirmant correlacions de manera lleu.
Els objectius marcats s’han assolit, tot i partir d’un conjunt de dades limitat, i amb alumnes amb comportaments fora de l’estàndard (tots són repetidors). Com que els resultats no han sigut tan bons com s’esperava, aquest projecte pot servir de partida per a un altre treball on es vulgui aplicar millores i es vulgui seguir investigant sobre aquesta línia de treball.
DegreeMÀSTER UNIVERSITARI EN ENGINYERIA INDUSTRIAL (Pla 2014)
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
tfm-miquelribas.pdf | 2,855Mb | View/Open | ||
annex-miquelribas.pdf | 1,560Mb | View/Open |