Research article
Primeros Pasos en el Análisis del Bajo Rendimiento Estudiantil en el Ámbito Universitario
First Steps in the Analysis of Student Performance at the University
Dr. en Ciencias Económicas, Universidad de Buenos Aires.
Profesor Titular de Administración en la Universidad Nacional de Lomas de Zamora.
Universidad Nacional de Lomas de Zamora
Universidad Nacional de Lomas de Zamora
Universidad Nacional de Lomas de Zamora
Universidad Nacional de Lomas de Zamora
Universidad Nacional de Lomas de Zamora
Resumen
El presente artículo se refiere al análisis de los bajos rendimientos de algunos estudiantes, en el tramo medio de sus carreras (Contador Público y Licenciado en Administración), en una universidad del conurbano bonaerense de la República Argentina. Un grupo de docentes, preocupados por una problemática que entendemos vale la pena intentar atenuar, se han dedicado a investigar el fenómeno y a intentar proponer cursos de acción efectivos en tal sentido.
Abstract
This article concerns the analysis of the low yields of some students in the middle stretch of their careers (Public Accountant and Bachelor in Business Administration), at a university in the area of Buenos Aires, Argentina. A group of teachers, concerned about an issue that is worth trying to mitigate, have been devoted to investigate the phenomenon and try to propose effective courses of action in this regard.
Palabras Clave:
Eduacación superior, Aprendizaje, Ambiente educacional ⓘ
Keyword:
Higher education, Learning, Educational environment ⓘ
Introducción y objetivos
Los objetivos básicos que persigue el presente proyecto son:
- Determinar las diversas caras del bajo rendimiento estudiantil en el tramo medio de las carreras que se cursan en la Facultad de Ciencias Económicas de la Universidad Nacional de Lomas de Zamora.
- Realizar un profundo y exhaustivo análisis sobre las causas que provocan tal merma en el rendimiento.
- Definir un modelo de pronóstico útil para la evaluación del bajo rendimiento y el fracaso estudiantil universitario, utilizando tanto técnicas tradicionales de análisis de datos como avanzados modelos predictivos; se espera que tal modelo, una vez halladas las causas, permita identificar los grupos de riesgo.
- Proponer cursos de acción, a aplicar sobre los grupos de riesgo, conducentes a la prevención de la deserción y al incremento del rendimiento estudiantil.
Adicionalmente se considera que el proyecto contribuirá a enfrentar más eficazmente algunos condicionantes que obstaculizan la labor universitaria, al permitir 1) recolectar información más certera sobre el rendimiento de los alumnos que cursen las asignaturas Sistemas de Información y Procedimientos Administrativos, tomadas como muestra del trabajo; 2) comparar los guarismos citados con los de otras materias de la Facultad, de otras facultades de la Universidad y otras universidades, en la medida en que se tenga acceso a los mismos; c) establecer un modelo de predicción válido para la identificación de los patrones que conducirán a la baja del rendimiento estudiantil universitario; 3) llevar a cabo una indagación profunda sobre sus distintas causas y proponer potenciales políticas o planes de acción que puedan revertir la situación; 4) capacitar a todos los integrantes del equipo de trabajo en el uso de abordajes metodológicos específicos y distintas herramientas informáticas aplicables a problemáticas similares a las descriptas, logrando así un enriquecimiento profesional que repercutirá tanto en la calidad de la tarea docente, como en la extensión de esos avances a toda la comunidad universitaria; 5) Permitir que la capacitación mencionada en el punto anterior pueda también ser aplicada, a través de acciones de transferencia, a las pequeñas y medianas empresas de la zona de influencia de la Universidad de Nacional de Lomas de Zamora, en áreas propias de las carreras de Contador Público y Licenciado en Administración que allí se dictan.
El Problema
El proyecto encuentra la siguiente fundamentación: en las últimas décadas presenciamos un hecho que es motivo primordial de preocupación de los docentes y autoridades universitarias y educativas: la disminución de la tasa de egresados sobre la cantidad de inscriptos en las diferentes carreras de grado universitarias. Consideramos que esta situación se puede caracterizar con el término “disminución de la tasa de rendimiento estudiantil universitario”.
La naturaleza de la problemática señalada impone la necesidad de un abordaje integral y amplio, cuya existencia -con diversos matices- es advertida en la cotidianeidad del quehacer universitario.
Siendo imposible permanecer ajenos a este panorama, ha surgido la necesidad de estudiar este aspecto de la realidad educativa, indagando sobre sus causas por medio de la utilización de las técnicas más actuales de análisis de datos. Nos impulsa la convicción de que, al identificar las razones de la baja en el rendimiento estudiantil universitario, será posible reconocer a los grupos de riesgo (los probables futuros desertores) con el objeto de llevar a cabo medidas concretas de retención y reinserción estudiantil.
Es sabido que desde mediados del siglo XX, el extraordinario desarrollo científico y tecnológico operado y aplicado en todas las disciplinas, hace posible la formación de recursos humanos de alta calificación, que puedan tanto contribuir al desarrollo de organizaciones en las que se desempeñen como posibilitar su acceso a una mejor calidad de vida, que los aleje de potenciales riesgos de marginalidad y exclusión sociales. Sin embargo, el proceso de globalización ha afectado profundamente a los países en vías de desarrollo, operando una nueva y compleja suerte de división internacional del trabajo, con consecuencias asociadas, como el aislamiento y la segregación de vastos sectores de la población. Dado que cada comunidad elige la forma en que se ha de insertar en el mencionado proceso, entendemos que el aumento del nivel educativo es la herramienta más adecuada para hacer frente de manera menos traumática a un fenómeno de por sí altamente problemático.
En nuestro país se advierte un crecimiento de la matrícula en la educación superior (tanto a nivel terciario como universitario), y también la extensión de la escolarización secundaria, habiéndose logrado la incorporación de grupos socioeconómicos de menores ingresos; aunque es necesario señalar que, a pesar de estos hechos auspiciosos, el bajo rendimiento y la deserción a nivel educativo universitario es preocupante.
Hipótesis preliminares de partida
Las siguientes hipótesis son el punto de partida del cual arrancamos nuestro estudio; ello no obsta de que los hallazgos realizados durante el curso de la investigación hagan variarlas, modificarlas o substituirlas, según el caso.
- No existe causa única del fracaso estudiantil en la universidad, sino que éste obedece a una combinación de varias causas.
- En los diferentes aglomerados de alumnos, si bien las causas de fracaso son múltiples, son esencialmente distintas.
- Es posible encontrar un modelo que sea capaz de predecir -con un grado de probabilidad asociado- el fracaso estudiantil universitario en el tramo medio de la carrera, y origine, con anticipación, medidas correctivas a aplicar.
- Identificados los grupos o individuos en zonas de riesgo de fracaso universitario, es factible la aplicación de medidas preventivas de intervención docente, académica e institucional sobre dicha población estudiantil, a fin de modificar positivamente los resultados que hubieran de acontecer en caso de no intervención.
Estrategia Metodológica
Nos proponemos utilizar una metodología de carácter sistémico, integrando tareas de diversa naturaleza a esta estrategia, tales como: la captura de datos, su limpieza y transformación (Procesos ETL), y la aplicación de modelos estadísticos de análisis de datos o de minería de datos.
Es de destacar que es imposible arribar a conclusiones valederas si los datos de entrada al proceso son incompletos, inconsistentes o provienen de fuentes no confiables. En este sentido se pondrá especial énfasis en el cuidado de la calidad de los datos a seleccionar como input del modelo (cabe aclarar que los datos de entrada que se mencionan en el presente documento no son taxativos, ya que durante el desarrollo de las tareas de investigación pueden surgir otras adicionales).
La base de datos a utilizar es un factor clave de la efectividad del proyecto; este importante repositorio de datos (a obtenerse en gran parte de un relevamiento y recolección propios a realizar durante uno o dos cuatrimestres en las asignaturas citadas, y en menor medida del Departamento de Alumnos de la Facultad), debe ser objeto de un cuidadoso análisis y diseño, ya que el mismo se nutrirá tanto de datos internos como externos que habrá que filtrar y ordenar con una estructura lógica y útil a los fines de la investigación en marcha.
En cuanto a las técnicas de procesamiento, se investigarán y evaluarán diferentes modelos de minería de datos con el objeto de determinar la herramienta más adecuada para este tipo de análisis.
De acuerdo a los datos de entrada (tanto internos como externos, institucionales y elaborados por el equipo, históricos y transversales, etc.) y su análisis crítico, se irá constituyendo una base de datos, a partir de la cual éstos serán minuciosamente ordenados, procesados y analizados, por medio de las técnicas modernas en este campo disciplinar. Esto implica un desafío importante en los términos del proyecto, ya que implica la utilización de novedosos procesos de evaluación y análisis de datos a nivel universitario.
Los resultados describirán una situación que deberá ser explicada y entendida como objeto de estudio, a efectos de investigar las formas de modificarla, por medio de la elaboración de una serie de estrategias y políticas a implementar sobre los grupos de riesgo (alumnos con potencialidad de fracaso futuro).
En el cuadro siguiente, puede apreciarse gráficamente una síntesis de lo mencionado precedentemente:
Metodología Aplicada (bajo un Diagrama Global de Sistemas) |
Unidad de análisis:
El universo de nuestra investigación han sido –originalmente- los alumnos que cursaron las asignaturas Sistemas de Información y Procedimientos Administrativos, de la Facultad de Ciencias Económicas de la Universidad Nacional de Lomas de Zamora, durante el 2do. Cuatrimestre de 2011 y/o el 1er. Cuatrimestre de 2012; aunque podrá extenderse a otros, en función de las necesidades debidamente fundamentadas del proyecto. Sobre esas unidades de análisis, que forman parte de las materias del tramo medio de las carreras de Contador Público y Licenciado en Administración, se pretende arribar a las conclusiones propias del presente proyecto; no obstante ello, no se descarta la posibilidad de extenderlo a otras facultades de la Universidad y a otras universidades públicas y privadas, en la medida de que existan requerimientos específicos concretos, aprobados por las autoridades correspondientes, y disponibilidad de acceso a la información.
Las conclusiones a las que se arriben serán sustentadas por información histórica disponible, datos específicos que nos sean suministrados a pedido, indicadores oficiales y privados y datos de elaboración propia que surgirán de encuestas y otros métodos de recolección de datos en el trabajo de campo.
Técnicas de obtención de datos
ENTRADAS
- Datos externos;
- Datos propios (encuestas, entrevistas con alumnos desertores, etc.);
- Calificaciones;
- Pérdida de la condición de alumno regular;
- Datos históricos;
- Análisis crítico de deserciones.
ARCHIVOS
- Armado de base de datos propia;
- Datos de la Facultad de Ciencias Económicas de la UNLZ, referentes a las calificaciones históricas de alumnos que cursen las materias aludidas en los cuatrimestres siguientes: 2do. de 2011, 1ro. de 2012.
- Otras archivos de datos a evaluar y que resulten útiles al proyecto.
PROCESOS
- Utilización de técnicas de análisis de datos (modelo churning y otros que se consideren pertinentes, utilizando software específico).
- Análisis crítico de la información recolectada, procesamiento de los datos de entrada y de las bases de datos mediante técnicas de análisis multidimensional y minería de datos, útiles para determinar cruces y relaciones insospechados entre distintas variables.
SALIDAS
- Informes y artículos técnicos en publicaciones especializadas, y también en la revista Visión Universitaria de la Facultad de Ciencias Económicas de la UNLZ.
- Informes y artículos periodísticos en publicaciones y revistas especializadas.
- Modelo de investigación probado y útil para la evaluación de la baja en el rendimiento estudiantil universitario.
- Planes de acción a proponer a efectos de minimizar la tasa de deserción estudiantil universitaria.
- Transferencia interna de conocimientos dentro del equipo de trabajo y capacitación interna del mismo.
- Transferencia de conocimientos a otros miembros de la comunidad universitaria.
- Potencial transferencia de los conocimientos elaborados, a pequeñas y medianas empresas de la zona de influencia de la UNLZ, en áreas propias de las carreras de Contador Público y Licenciado en Administración
- Potencial transferencia de conocimientos a otras facultades de la UNLZ.
- Potencial transferencia de conocimientos a otras universidades nacionales.
Síntesis de las Tareas Realizadas
En función de los objetivos planteados originalmente, los que pueden sintetizarse como:
- Determinar las diversas caras del bajo rendimiento estudiantil en el tramo medio de las carreras que se cursan en la Facultad de Ciencias Económicas de la Universidad Nacional de Lomas de Zamora;
- Realizar un profundo y exhaustivo análisis sobre las causas que provocan tal merma en el rendimiento;
- Definir un modelo de pronóstico útil para la evaluación del bajo rendimiento y el fracaso estudiantil universitario, utilizando tanto técnicas tradicionales de análisis de datos como avanzados modelos predictivos; se espera que tal modelo, una vez halladas las causas, permita identificar los grupos de riesgo;
- Proponer cursos de acción conducentes a la prevención de la deserción y al incremento del rendimiento estudiantil;
el equipo de trabajo ha logrado avanzar, durante el primer año de la investigación, realizando las siguientes tareas:
- Diseño del formulario de encuesta;
- Vuelco de la información en soporte papel a una base de datos;
- Lectura de material emitido por otros investigadores y universidades de la región;
- Análisis del programa de retención de alumnos de la Facultad de Ciencias Económicas de la Universidad Nacional de Lomas de Zamora, resolución CAE 193/02 del año 2002; a nuestro entender el programa es importante porque no sólo abarca la contención de los futuros alumnos, mediante acciones de articulación con escuelas secundarias y terciarios, con explicación de las carreras, lo que ayuda al alumno a tomar cabal conocimiento del contenido de las mismas, sino también los cursos de nivelación para no hacer tan traumática la transición secundario – Universidad, y adicionalmente hacia el interior de la facultad, mediante el seguimiento de los alumnos de bajo rendimiento.
- Estudio sobre causas de la deserción universitaria en Chile – Centro Micro Datos, Departamento de Economía Universidad de Chile: en este sentido, el porcentaje de deserción durante el primer año, que ascienden aproximadamente al 20% y resultan superiores a las distintas mediciones realizadas en Argentina, probablemente se deba a las altas barreras de entrada (costos para acarrear los estudios universitarios) en el vecino país, que en el caso de abandonar la carrera se pierden; comparativamente hablando, en Argentina prácticamente no existen barreras de entrada económicas a la enseñanza universitaria pública.
- Estudio de otros casos a nivel mundial: Syracuse, Ohio, Windsor en Canadá, con distintas estrategias, pero con resultados finales razonablemente exitosos; Universidad de California Los Ángeles, en la que no se considera de por sí un valor importante a la retención, sino que se apunta básicamente al potencial académico y a los atributos personales de los estudiantes. Esta estrategia, con la que en líneas generales disentimos por entender que pone restricciones y de alguna manera discrimina a los potenciales estudiantes, ha sido exitosa si se considera únicamente la relación egresados / ingresantes.
- Análisis del estudio realizado por la Universidad del Rosario, Colombia: En una primera visión la metodología utilizada en este trabajo destaca aportes hechos desde la psicología (factores internos del individuo), la sociología y la economía (factores externos), como enfoques científicos del análisis de la problemática de deserción universitaria, coincidiendo en buena medida con la idea propuesta por el equipo investigador, el que ha incorporado variables de este tipo a la encuesta estudiantil realizada, sin haber tomado conocimiento previo del estudio. En principio, los factores psicológicos sugieren a la deserción como consecuencia del debilitamiento de las intenciones iniciales y consecuentemente la persistencia del individuo. Posteriormente su conducta de logro se ve influenciada por las percepciones del alumno durante su vida universitaria, cambiando su modelo de aspiraciones y expectativas, de lo marcado en su casa a lo comprobado en su trayectoria académica. Por otro lado los factores sociológicos apuntan a la integración del alumno al ambiente académico y social de la institución, incidiendo fuertemente en su permanencia. Desde el punto de vista económico, se toman los modelos de productividad laboral, costo/beneficio y localización., donde se compara el costo de la educación con los beneficios de actividades alternativas, y la focalización de grupos de estudiantes con dificultades para asistir a la universidad y la influencia de políticas públicas y planes de acción institucionales para lograrlo. Se utilizan modelos de duración, que permiten explicar cómo cambia el efecto de cada uno de los factores determinantes de la deserción en el tiempo, lo que permite patrones temporales entre diferentes grupos y construir modelos estadísticos del riesgo de deserción. Es de destacar también la gran coincidencia de variables descriptivas utilizadas en el análisis con las contenidas en las encuestas realizadas por el equipo de investigación.
- Análisis del estudio de deserción universitaria realizado en la Facultad de Derecho Universidad Andina de Perú, en el que observamos una coincidencia en los factores principales considerados con los del equipo de investigación (sociales y económicos).
- Lectura y familiarización con libros sobre técnicas sobre Minería de Datos y Regresión Logística, entre los que se pueden mencionar: En tal sentido se han leído y analizado partes de las siguientes fuentes bibliográficas:
- Freund, R.; Wilson, W.; Mohr, D. (2010) – Statistical Methods, 3rd Ed. – Capítulo 13: Special types of regression – Elsevier, San Diego.
- Jai, S.; Sanjaya, S. (2009) - Statistical Methods for Practice and Research, 2nd Ed. – Sage, Los Angeles
- Giudici, P; Figini, S. (2009) - Applied Data Mining for Business and Industry, 2nd Ed – Wiley – Chichester.
- Visauta Vinacua, B. (1998) – Análisis Estadístico con SPSS para Windows – Volumen II: Estadística Multivariante – McGraw-Hill, Madrid.
- Carlberg, C. (2013) – Predictive Analytics: Microsoft Excel – Que, Indianapolis.
- Parr Rud, Olivia (2001) – Data Mining Cookbook – John Wiley & Sons – New York
- Búsqueda de software apropiado para realizar el procesamiento de la información recogida: Se han analizado al respecto las siguientes piezas de software; Microsoft Excel,SQL Server 2012, R, XLMiner, RapidMiner y Weka. Al respecto se ha podido elaborar la siguiente tabla de ventajas y desventajas relativas de cada una de ellas.
Software |
Aspectos Positivos |
Aspectos Negativos |
Microsoft Excel |
Fácil acceso, en cuanto a precio y facilidad de uso, para una gran cantidad de personas. |
Limitado número de herramientas de análisis y algoritmos disponibles. |
SQL Server 2012 |
Disponibilidad de utilización de una importante cantidad de algoritmos y modelos. |
Alto costo económico de la licencia de uso; necesidad de tomar capacitación específica. |
R |
Gratuito y potente. Existe mucho material bibliográfico disponible |
Interfaz no amigable. |
XLMiner |
Es un add-in de Microsoft Excel, con lo que se ve muy facilitado su uso, al utilizar esa interfaz que es familiar para un gran número de usuarios. |
Alto costo (aprox. U$S 1.500) de una licencia de uso. Cada nuevo usuario de los modelos que el equipo produzca, debería contar con una licencia para su utilización. |
RapidMiner |
Gratuito y potente. |
Es trabajoso encontrar literatura y tutoriales adecuados para su uso. Nos proponemos concentrarnos en este aspecto durante el próximo año. |
Descripción somera de las piezas de software mencionadas:
- Microsoft Excel: Planilla electrónica de cálculos, de uso ampliamente difundido, desarrollada por Microsoft Corporation.
- SQL Server 2012: Programa Administrador de Bases de Datos, desarrollado por Microsoft Corporation.
- R: “R es un lenguaje y entorno de programación para análisis estadístico y gráfico. Se trata de un proyecto de software libre, resultado de la implementación GNU del premiado lenguaje S. R y S-Plus -versión comercial de S- son, probablemente, los dos lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy populares en el campo de la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades específicas de cálculo o gráfico. R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.”
Fuente: Wikipedia, consulta efectuada el 08-09-2013, 13:29 hs.
http://es.wikipedia.org/wiki/R_(lenguaje_de_programaci%C3%B3n)
Aclaraciones:
GNU: Proyecto de crear un sistema operativo completamente libre. Ver Wikipedia: http://es.wikipedia.org/wiki/GNU
GPL: es la licencia más ampliamente usada en el mundo del software y garantiza a los usuarios finales (personas, organizaciones, compañías) la libertad de usar, estudiar, compartir (copiar) y modificar el software. Ver Wikipedia: http://es.wikipedia.org/wiki/Licencia_p%C3%BAblica_general_de_GNU
- XLMiner: XLMiner es un típico software add-in que se carga sobre Excel, aprovechando sus funcionalidades e interfaces tan familiares para un gran número de usuarios. XLMiner provee un amplio abanico de herramientas de análisis de datos, basadas tanto en métodos estadísticos como de aprendizaje (machine learning).
- RapidMiner: “RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Se usa en investigación educación, capacitación, creación rápida de prototipos y en aplicaciones empresariales. En una encuesta realizada por KDnuggets, un periódico de minería de datos, RapidMiner ocupó el segundo lugar en herramientas de analítica y de minería de datos utilizadas para proyectos reales en 2009 y fue el primero en 2010.” Fuente: Wikipedia, ver: http://es.wikipedia.org/wiki/RapidMiner
- WEKA: Weka (Waikato Environment for Knowledge Analysis - Entorno para Análisis del Conocimiento de la Universidad de Waikato) es una plataforma de software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es un software libre distribuido bajo licencia GNU-GPL. Fuente: Wikipedia, ver: http://es.wikipedia.org/wiki/Weka_(aprendizaje_autom%C3%A1tico)
En síntesis, y dados los amplios objetivos de este proyecto de investigación (obtención de modelos de predicción + transmisión de conocimiento a otras personas), se ha privilegiado la utilización de software gratuito o de bajo costo (Microsoft Excel, R, RapidMiner y Weka) por sobre los otros.
- Generación de Modelos Potenciales de parte de los investigadores: Cabe aclarar que el orden de las hipótesis no significan relación de relevancia o importancia relativa, y las mismas guardan la secuencia en la cual se fueron proponiendo por los distintos investigadores. Otras no mencionadas han sido desestimadas otras en el presente informe, luego de llevar a cabo un exhaustivo análisis por parte del equipo de investigación por considerarlas no totalmente consistentes. Los modelos generados como primera tentativa de aproximación a efectos de ser verificadas con las herramientas de análisis de datos mencionadas precedentemente son
Primera hipótesis: El bajo rendimiento se debe al motivo de la elección de la carrera y las expectativas puestas en ella y en la Institución elegida, por un lado; y por otro el método de estudio y la cantidad de horas dedicadas al mismo. Sintéticamente, si los motivos de la elección de la carrera fueron la tradición o la influencia familiar incrementa el riesgo que el alumno no se sienta identificado y comprometido con la carrera. Por otra parte si la carrera y la Institución elegida no cubren las expectativas iniciales tendrán una incidencia que redundará en un bajo rendimiento o deserción. Si no se ha adoptado un método de estudio y adicionalmente se dedican pocas horas a la carrera la incidencia será importante en el bajo rendimiento del alumno.
Segunda hipótesis: El bajo rendimiento se debe al perfil socioeconómico de los alumnos por un lado: y por otro a la cantidad de materias aprobadas en relación a los años transcurridos y a las reincorporaciones. Sintéticamente, aquellos alumnos que tienen trabajos atractivos, a los que tienen que dedicar mucha carga horario, y que adicionalmente son jefes de familia es más probable que tengan rendimiento inferior que aquellos que no tienen estas condiciones. El tipo de vivienda y servicios básicos influye ya que se entiende que a menor nivel, menores serán las condiciones mínimas para avanzar bien en la carrera. Por otra parte los alumnos que ya han transcurrido varios años y tienen un bajo porcentaje de materias aprobadas, o bien ya han sido reincorporados en una o más oportunidades tendrán una tendencia mayor a la deserción o a continuar con su bajo rendimiento.
Tercera hipótesis: El bajo rendimiento está relacionado con las falencias o ausencias de un método de estudio, tanto antes del ingreso a la Universidad, como durante la vida universitaria, entendemos que la falta de un método de estudio podría estar en estrecha relación con el bajo rendimiento. También podría estar relacionado con la poca lectura, ya que entendemos que a menor cantidad de libros leídos menor capacidad de comprensión de textos y en consecuencia mayores posibilidades de fracaso en los estudios universitarios. Otra variable a verificar es la cantidad de horas dedicadas al estudio, mientras menor cantidad de horas dedicadas al estudio podría verificarse un menor rendimiento académico. Si bien los estudios secundarios están fuera del alcance de la investigación, podríamos inferir que los alumnos en general sienten el impacto del paso a la Universidad, ya que es posible que vengan con falencias en el método de estudio, la comprensión lectora y la capacidad de esfuerzo, variables mencionadas precedentemente, y que mientras algunos logran revertir la falencia en la Universidad, una parte importante no lo logra, generando un bache entre sus expectativas y sus logros reales.
Cuarta hipótesis: El bajo rendimiento está en relación con el máximo nivel de estudio de los padres, la cantidad de libros leídos, horas dedicadas al estudio y expectativas, siendo que se estima que a mayor cantidad de estas variables mejor será el rendimiento del alumno; por otra parte la incidencia de las escuelas primarias pública o privada y el cursar de día o de noche son difíciles de predecir. Por último el mayor grupo de convivencia en el hogar del alumno puede atentar contra un buen rendimiento, mientras que la cantidad de horas de trabajo no solo podría jugar en contra del rendimiento, sino a favor en función de resultar un disparador para aumentar el estímulo al estudio.
Quinta hipótesis: Existen más de un grupo de riesgo, con características muy distintas, que hacen inconsistente considerarlo como uno sólo.
Estas hipótesis –entre otras- serán analizadas y sometidas a procesos de contrastación, durante el segundo y tercer año del proyecto, utilizando técnicas de análisis de datos.
- Exploración de software a utilizar, búsqueda de manuales, bibliografía, etc.:
Definidos Microsoft Excel, R, RapidMiner y WEKA como las piezas de software candidatas a utilizar para el procesamiento de la información, procederemos a adquirir la bibliografía necesaria.
Análisis Exploratorio de Datos
Si bien somos conscientes de que hemos recolectado una gran cantidad de información, ella es tanta que nos ha obligado a realizar arduas tareas de análisis a efectos de separar lo relevante de lo trivial, tarea sumamente compleja por la multiplicidad de variables consideradas.
A tal efecto hemos realizado un análisis descriptivo de algunas hipótesis vulgares que se presentan a continuación y que podrían determinar la relación entre las variables consideradas y el bajo rendimiento. En términos generales, ninguna de las relaciones entre dos variables (Y: cantidad de materias aprobados por año; X: diferentes variables consideradas) examinadas, por sí solas, presenta resultados concluyentes. De todos modos, el equipo de investigación considera que la explicación del bajo rendimiento obedece a más de una variable, sin considerar la potencial existencia de diferentes clusters, en los que juegos diferentes de variables independientes diferentes puedan explicar el fenómeno del bajo rendimiento.
A continuación se despliega, a modo exploratorio, un conjunto de gráficos que muestran las relaciones entre variables, tomadas de a dos, cuyo objetivo es realizar un primer mapa de aproximación al análisis de las variables señalado.
A) El rendimiento está relacionado con el nivel cultural de sus padres |
Comentarios: Los alumnos cuyos padres han alcanzado un mayor nivel cultural / educativo, no presentan en absoluto rendimientos superiores al resto.
B) El rendimiento está relacionado con el año de ingreso de los alumnos |
Comentarios: Los alumnos con mayor antigüedad, tal como era de esperar, son los que obtienen rendimiento más bajo.
C) El rendimiento está relacionado con la cantidad promedio de libros leídos que no se relacionan con la carrera en los últimos tres años |
Comentarios: No parece haber una fuerte relación entre las citadas variables; tanto se observan casos con muchos libros leídos y rendimiento medio, como con pocos libros leídos y alto rendimiento. Lo que sí surge nítidamente de los datos expuestos, es que los alumnos con un rendimiento superior (7 o más materias aprobadas por año) leen al menos dos libros por año no relacionados con sus estudios.
D) El rendimiento está relacionado con la cantidad de horas semanales dedicadas al estudio |
Comentarios: Los alumnos con mayor dedicación horaria semanal al estudio no son los que obtienen mejores rendimientos. De todos modos, las cifras de la variable horas semanales de estudio surge de la manifestación de los alumnos a través de la encuesta realizada. De todos modos, esta relación requerirá un mayor nivel de análisis.
E) El rendimiento está relacionado con los objetivos de bienestar económico al elegir la carrera. |
Comentarios: Parecería que la relación entre estas dos variables no es relevante a los fines de este trabajo de investigación.
F) El rendimiento está relacionado en función si el alumno hizo algún test vocacional antes de elegir la carrera |
Comentarios: Parecería que la relación entre estas dos variables no es relevante a los fines de este trabajo de investigación.
G) El rendimiento está relacionado con el hecho de haber trabajado ininterrumpidamente en los dos últimos años |
Comentarios: Parecería que la relación entre estas dos variables no es relevante a los fines de este trabajo de investigación.
H) El rendimiento está relacionado con la cantidad de horas trabajadas en la semana. |
Comentarios: Entre los alumnos con bajo rendimiento se observa que un porcentaje importante de ellos trabaja 40 o más horas semanales.
I) El rendimiento está relacionado con la cantidad de habitantes por ambiente en el domicilio en donde viven los alumnos (cociente habitantes / ambientes). |
Comentarios: Parecería que la relación entre estas dos variables no es relevante a los fines de este trabajo de investigación.
J) El rendimiento está relacionado de acuerdo al alumno viva o no en calles de asfalto. |
Comentarios: Parecería que la relación entre estas dos variables no es relevante a los fines de este trabajo de investigación.
K) El rendimiento está relacionado con la edad o año de nacimiento de los alumnos |
Comentarios: Se puede observar que los alumnos más jóvenes son los que obtienen mejores rendimientos.
Cabe aclarar que los mismos ítems de los correlogramas explicados precedentemente (puntos a hasta la h), fueron modelizados para analizar con el software RapidMiner a fin de obtener conclusiones en el formato de árboles de decisión. En términos generales, no hemos podido encontrar la existencia de relaciones determinantes entre variables.
Rangos de rendimiento: Luego de un profundo debate sobre que considera bajo rendimiento el equipo de investigación, y en base a que un buen rendimiento, que permitiría la finalización de las carreras bajo análisis (de 39 materias cada una) en 6 años, hemos decidido lo siguiente:
- Rango 1: Considerar bajo rendimiento a los alumnos que han aprobado en promedio hasta 2.5 materias por año.
- Rango 2: Considerar rendimiento medio a los alumnos que han aprobado en promedio más de 2.5 materias y hasta 4 materias por año.
- Rango 3: Considerar buen rendimiento a los alumnos que han aprobado en promedio más de 4 materias por año.
Conclusiones Parciales Preliminares
Las principales conclusiones parciales preliminares obtenidas son:
1. En primer término, consideramos que hemos definido una gran cantidad de variables potenciales que pueden incidir en el bajo rendimiento de los alumnos, las que han surgido de investigaciones anteriores, más la experiencia de un equipo de docentes con amplia trayectoria profesional y académica.
2. No obstante lo mencionado precedentemente, ninguna de las relaciones entre dos variables (Y: cantidad de materias aprobados por año; X: diferentes variables consideradas) examinadas, por sí solas, presenta resultados concluyentes.
3. Tal como fue considerado en las hipótesis del proyecto de investigación, el equipo considera que la explicación del bajo rendimiento obedece a más de una variable, hecho que fue confirmado en base a la exploración de datos realizadas.
4. En función de lo mencionado hasta el momento, creemos necesario llevar a cabo el análisis y consideración de la potencial existencia de diferentes clusters, en los que juegos diferentes de variables independientes diferentes puedan explicar el fenómeno del bajo rendimiento.
5. Como subproducto de la tarea de investigación, cabe mencionar la cohesión y enriquecimiento profesional del equipo de trabajo, así como un alto grado de capacitación en las distintas herramientas utilizadas durante el transcurso de la investigación, particularmente las referidas a las de análisis de datos, específicamente relacionadas con el software RapidMiner de minería de datos.
Dificultades Encontradas y Futuros Pasos
1. Dificultades Encontradas: El primer año de la investigación se ha caracterizado por la realización de tareas arduas, que aunque importantes, no poseen la particularidad de estar asociadas a resultados concretos. Ellas son: diseño y recolección de la muestra, su vuelco a soportes digitales, exploración de software disponible, revisión bibliográfica, prueba de modelos potenciales, etc. En otras palabras, con el objeto de no caer en la desmotivación, debido a la lógica demora existente entre las acciones realizadas y los resultados concretos a obtener, se ha tenido siempre presente, en todas las reuniones y comunicaciones, el mensaje tendiente a explicar estas particularidades.
2. Futuros Pasos: Ya han sido mencionadas detalladamente las tareas realizadas a la fecha. A continuación se comentan brevemente los futuros pasos que se piensan llevar a cabo en el plazo que resta para la finalización del proyecto:
- Generación de modelos potenciales que expliquen el bajo desempeño: en este sentido, se considerarán las hipótesis formuladas durante el primer año del trabajo, más las que vayan apareciendo durante el transcurso del trabajo.
- Identificación de potenciales causas, y los potenciales “grupos de riesgo” del bajo desempeño estudiantil, a efectos de poder diseñar acciones de prevención y retención a sugerir a las autoridades de la FCE de la UNLZ.
- Analizar la posibilidad de introducir un análisis de clusters, para el caso en que se verifique la hipótesis relativa a que no existe un grupo de riesgo homogéneo; en este sentido, se persigue intentar determinar la existencia de varios grupos de riesgo (homogéneos desde el punto de vista intra-grupo, pero heterogéneos si los consideramos como un todo).
Bibliografía - Bibliography
Carlberg, C. (2013) – Predictive Analytics: Microsoft Excel – Que, Indianapolis.
Freund, R.; Wilson, W.; Mohr, D. (2010) – Statistical Methods, 3rd Ed. – Elsevier, San Diego.
Parr Rud, Olivia (2001) – Data Mining Cookbook – John Wiley and Sons – New York.
Google Scholar Index
Article
Primeros Pasos en el Análisis del Bajo Rendimiento Estudiantil en el Ámbito Universitario
Publisher: