! Predecir!la!deserción!usando!machine(learning!

!
Predecir!la!deserción!usando!machine(learning!
En! este! estudio! se! analizan! tres! métodos! de! machine! learning,! para!
predecir!la!deserción!en!estudiantes!de!una!amplia!muestra!de!alumnos!
inscritos! en! programas! de! educación! a! distancia! (ED)! en! China.! La!
deserción! impacta! negativamente! tanto! a! las! instituciones! como! a! los!
estudiantes.! A! las! primeras! les! representa! un! mayor! costo! por! alumno,!
mientras!que!a!los!estudiantes!les!significa!un!desperdicio!de!su!inversión!
y!esfuerzo!iniciales,!además!de!que!el!fenómeno!obstaculiza!la!aceptación!
de!la!ED.!En!China,!la!deserción!en!educación!a!distancia!es!entre!10!y!35%!
más! elevada! que! en! escenarios! presenciales,! por! lo! que! es! relevante!
predecirla!e!implementar!intervenciones!que!la!reduzcan.!!
Tradicionalmente,! el! problema! se! ha! abordado! a! través! del! análisis! de!
datos! demográficos,! semestres! perdidos,! tasa! de! aprobación! y! área! de!
formación.!El!investigador!por!lo!general!sigue!una!de!las!siguientes!líneas:!
adquiere! datos! a! través! de! cuestionarios! y! corre! correlaciones! entre!
variables;!identifica!tendencias!de!variables!demográficas;!ubica!razones!
para! desertar! a! partir! de! transcripciones! de! entrevistas! con! análisis! de!
textos;!o!bien,!combina!uno!de!estos!procedimientos.!Sin!embargo,!debido!
a! las! amplias! diferencias! entre! estudiantes,! estas! estrategias! de! nivel!
macro!resultan!poco!efectivas.!!
El!primer!modelo!importante!para!representar!y!estudiar!la!deserción!fue!
propuesto! por! Tinto.! Señala! que! los! antecedentes! familiares,! factores!
individuales! y! educación! previa! son! relevantes.! Más! tarde,! Kember!
concluyó!que!se!trata!de!un!proceso!en!el!que!diversas!variables!cambian!
de!forma!dinámica!y!llevan!al!estudiante!a!tomar!la!decisión!de!desertar.!
Bean!y!Metzner!crearon!un!modelo!que!incluye!calificaciones,!variables!
académicas!como!hábitos!de!estudio,!resultados!psicológicos!y!variables!
de!contexto,!como!estatus!económico.!!
Con!base!en!estas!propuestas!previas,!Rovai!propuso!un!modelo!aplicable!
a!la!ED.!Incluye!características!personales!como!edad!y!raza,!habilidades!
para! aprender,! factores! internos! como! la! integración! social,! así! como!
factores! externos,! como! el! nivel! económico.! Partiendo! de! este! modelo,!
Park!estableció!una!serie!de!relaciones!entre!estos!factores!y!propuso!un!
marco!teórico!aplicable!a!educación!en!línea.!!
En!el!estudio,!se!trabajó!con!datos!de!la!Universidad!Abierta!de!China,!con!
una!matrícula!de!3.59!millones!en!el!momento!de!la!investigación.!A!partir!
de! información! disponible! en! registro! escolar! y! en! la! plataforma,! se!
evaluaron! tres! métodos:! redes! neuronales,! árboles! de! decisión! y! redes!
Bayesianas.!Una!vez!que!se!utilizaron!con!una!muestra!de!más!de!62!mil!
estudiantes,! se! analizó! el! poder! predictivo! de! cada! uno! con! base! en! la!
deserción!real.!Si!bien!los!tres!fueron!efectivos!para!predecir!la!deserción,!
el!árbol!de!decisión!resultó!el!más!exacto.!
!
Tan, M.; Shao, P. (2015). Prediction of student dropout in E-learning program through the
use of machine learning method, International Journal of Technologies in
Education, 10 (1), recuperado de: http://online-journals.org/index.php/ijet/article/view/4189
!