Sesión 1

E V A L U A C I Ó N
Sesión 2
E D U C A T I V A
Evolución histórica de la
evaluación
Objetivo
Analizar el desarrollo histórico de la evaluación educativa a través de las
propuestas de diferentes autores.
En esta sesión
Ilustración 1. Mapa de la sesión
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 1 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Introducción
La historia es quien determina el desarrollo y las características de la
evaluación. Lo anterior se observa con el surgimiento y la evolución de
conceptos, enfoques y funciones propuestas entre un momento histórico
determinado y su posterior modificación en otro. A continuación se
describen cuatro etapas históricas de la evaluación, las cuales muestran
diferencias tanto a nivel conceptual como procedimiental:
a) La etapa pretyleriana, anterior a las aportaciones de Ralph Tyler. El
programa educativo de Joseph Rice, quien entre 1887 y 1898,
estudió los conocimientos de ortografía es el primer ejercicio de
evaluación que se reconoce. (Casarini, 2009)
b) La segunda época es la tyleriana. A Ralph Tyler se le considera el
padre de la evaluación educativa, siendo el primero en utilizar el
término evaluación educacional. Su método se centra en la
elaboración objetivos y la evaluación determina si éstos se alcanzan
o no.
c) La evaluación tomó diferentes directrices gracias a las aportaciones
de autores que cambian el sentido de la evaluación, dirigiéndola
hacia la toma de decisiones con elementos pragmáticos. A esta
etapa se le conoce como la época del realismo en donde se creó el
Comité Nacional de Estudio sobre la Evaluación, quien concluyó que
la evaluación educacional era “víctima de una grave enfermedad” y
recomendó el desarrollo de nuevas teorías y métodos de evaluación.
(Casarini, 2009)
d) La evaluación siguió evolucionando en concepto, métodos, técnicas
y procedimientos, hasta crear estudios especializados para este
campo, transformándose así en un área definida de especialización
de varias ciencias. La evaluación educativa se considera una
disciplina de la pedagogía y las ciencias de la educación; con ello
asume un carácter profesional, basado en los productos de la
investigación. A esta época se le conoce como profesionalismo.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 2 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Lección 2.1 Época Pretyleriana
Introducción
Hasta antes de 1930, la evaluación sistemática no era un movimiento
reconocido. La historia de la evaluación se remonta a 3.000 años A.C.,
cuando algunos oficiales chinos dirigieron unas investigaciones de los
servicios civiles (Dubois, 1970).
En el siglo V A.C., Sócrates y otros maestros griegos utilizaron
cuestionarios evaluativos como parte de su metodología en el campo de
la enseñanza (Blanco, 1994).
En la Inglaterra del siglo XIX, se utilizaron comisiones reales para
evaluar los servicios públicos.
En 1845, en los Estados Unidos, Horace Mann dirigió una evaluación
basada en pruebas de rendimiento para saber si las escuelas de Boston
educaban “bien” a sus estudiantes.
Primera
evaluación
formal
Entre 1887 y 1898, Joseph Rice estudió los conocimientos en ortografía
de 33,000 estudiantes de un amplio sector escolar y concluyó que la
gran insistencia en la enseñanza de la ortografía no había producido
avances sustanciales en el aprendizaje. Este estudio está generalmente
reconocido como la primera evaluación formal sobre un programa
educativo realizado en América.
Pruebas
estandarizadas
Una aproximación aún mayor a la evaluación, se produjo en los primeros
años del siglo XX con la aparición de las pruebas estandarizadas, es
decir, pruebas que han sido aplicadas con base en los principios
establecidos “especificaciones de examen” y cuentan con validez y
confiabilidad.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 3 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Este acontecimiento formaba parte de un gran esfuerzo que pretendía
que la educación fuera más eficiente para que un mayor número de
estudiantes pudiera utilizar los recursos entonces disponibles en las
instituciones educativas.
En esta etapa pretyleriana surgieron algunos autores interesados en
medir de manera sistemática los conocimientos, las aptitudes y las
habilidades de los estudiantes; asimismo, se despierta un gran interés
por medir científicamente la conducta humana.
Pruebas de
inteligencia
Uno de esos autores fue Alfred Binet, a quien en 1904, las autoridades
de París le encomendaron desarrollar un procedimiento para evaluar la
capacidad de aprendizaje de los alumnos, ya que existían muchos niños
con problemas de fracaso escolar.
Para ello, Binet determinó las tareas cotidianas que un niño podía
desempeñar a diferentes edades. Lo que hizo fue aplicar pruebas de
capacidad de retención, manejo de situaciones, habilidades motoras,
razonamiento, entre otras.
A él se le considera como el creador de las pruebas de inteligencia,
pues realizó un listado de preguntas ordenado por rango de edad, de
manera que, si el 75% de los niños de una edad era capaz de responder
satisfactoriamente a una pregunta, se le atribuía una característica a esa
edad. El desarrollo mental se calculaba de acuerdo al número de
respuestas que era capaz de contestar satisfactoriamente: edad mental
(EM), referida a la dificultad de los problemas que podían resolver
correctamente.
Binet-Simon
Alfred Binet y Thephile Simon construyeron un instrumento para
reconocer a los niños que requerían una enseñanza especial y distinguir
a los niños “brillantes” de los “lentos”. En un estudio con 200 infantes,
establecieron que los niños de 3 años deberían ser capaces de
identificar ojos, nariz, boca; nombrar objetos sencillos en un dibujo;
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 4 DE 15
E V A L U A C I Ó N
E D U C A T I V A
repetir un número de dos dígitos; una oración de seis sílabas y decir su
apellido. A los de 7 años se les pidió que completaran figuras a las que
les faltaba una parte; copiar una oración escrita; reconocer figuras
geométricas sencillas e identificar nombres de diferentes monedas.
Coeficiente
intelectual
Lewis Terman, de la Stanford University, revisó a fondo la prueba de
Binet-Simon y en 1916 publicó una versión conocida como “prueba de
Stanford”. Terman describió el desempeño del alumno como su
coeficiente intelectual y lo representó como IQ, que es la razón entre la
edad mental y la edad cronológica, multiplicada por 100.
Coeficiente intelectual (CI) = EM/EC x 100
En cualquier edad, los niños normales tienen un CI de 100, porque su
edad mental es igual a su edad cronológica. La puntuación sirve para
comparar la inteligencia de niños de diversas edades.
Más pruebas y
escalas
Posterior a estas propuestas, en la década de los veinte, se diseñaron
muchas otras pruebas de inteligencia como la escala de Wechsler, la
batería de Kaufman, entre otras.
Para medir el desempeño en las distintas asignaturas, se diseñaron las
escalas de escritura de Ayres y Freeman, las pruebas de lectura de
Thorndike, las de matemáticas de Wood y las de ortografía de
Buckingan, entre otras.
Antes de que Tyler publicara su modelo evaluativo en 1942, los estudios
se centraban en la medición de la inteligencia, pruebas sobre redacción,
ortografía y matemáticas, es decir, en la valoración de los logros
alcanzados por el estudiante en su desempeño académico. En esta
época, la evaluación era por lo tanto, sinónimo de medición. Guba y
Lincoln (1989) se refieren a esta época como “la primera generación”.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 5 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Lección 2.2 La época tyleriana
En los primeros años de la década de los treinta, Ralph Tyler acuñó el
término evaluación educacional, publicó una amplia y renovadora visión
del currículum y un nuevo concepto de evaluación en el campo
educativo. A él se le considera el padre de la evaluación educativa. En
aproximadamente quince años desarrolló su método, el cual suponía
una clara alternativa a otras perspectivas.
Características
La principal característica del método de Tyler era que se centraba en el
currículum, y por lo tanto, en la evaluación de objetivos previamente
determinados. Definía a la evaluación como algo que determina en qué
nivel han sido alcanzados los objetivos. La evaluación ya no es una
simple medición, ahora suponía considerar juicios de valor.
Lo anterior implicaba que los evaluadores debían trabajar conjuntamente
con los diseñadores de currículum, para valorar el rendimiento de los
alumnos que había sido determinado en la planeación didáctica.
Los instrumentos de evaluación en esta época se centraban en la
elaboración de pruebas objetivas en sus distintas modalidades; por
ejemplo: las de opción múltiple, correspondencia, canevá, falso y
verdadero, entre otras.
Teoría del
aprendizaje
conductista
En esta época surge la tecnología educativa y la enseñanza programada
con base en los postulados de Skinner. La tecnología de las pruebas
(tests) serviría de base para la elaboración de las que estaban
relacionadas con los objetivos, las diferencias individuales y las normas
nacionales o del estado. En México, la evaluación educativa se dirigía a
juzgar en qué medida y hasta qué grado se lograban los objetivos
previamente propuestos. (Castañeda, 1987, p.177).
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 6 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Educación
progresiva
La década de los treinta se caracterizó por escuelas estancadas y
ausencia total de recursos, como consecuencia de la gran depresión.
Diferentes autores, entre ellos John Dewey, intentaron contribuir a que la
educación se convirtiera en un sistema dinámico e innovador al
renovarse por sí mismo, al cual se denominó Educación Progresiva.
Esta educación reflejaba la filosofía del pragmatismo y promovía
instrumentos de evaluación provenientes de la psicología conductista.
Ralph Tyler
Ralph Tyler se incorporó al movimiento progresista; realizó un estudio
para examinar la efectividad de un currículum renovador y estrategias
didácticas que se estaban empleando en treinta escuelas a lo largo de
toda América. El estudio resultó notable porque ayudó a Tyler a difundir,
ensayar y demostrar su concepción de la evaluación educativa.
A través de este programa, Tyler publicó lo que veía como un método
con claras ventajas sobre los demás. Desde el momento en que la
evaluación tyleriana incluía comparaciones internas entre los resultados
y los objetivos, ya no necesitaba recurrir a costosas y problemáticas
comparaciones entre grupos de control y grupos experimentales.
El método de Tyler se centraba en determinar el grado de éxito del
desempeño de docentes y alumnos; opuesto a los métodos indirectos
que determinan factores como la calidad de la enseñanza, el número de
libros que hay en la biblioteca, los materiales y la participación de la
comunidad, entre otros.
Las evaluaciones tylerianas no se vieron afectadas por la fiabilidad de
las diferencias entre las puntuaciones individuales de los alumnos, ya
que generalmente cubren una franja más amplia de variables exógenas
que las cubiertas por las pruebas estandarizadas. Todos estos
argumentos fueron bien recibidos por el sector de la educación
americana y a mediados de los años cuarenta, Tyler ya había
conseguido la categoría suficiente como para ejercer una gran influencia
sobre el panorama educativo en los próximos veinticinco años.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 7 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Evaluación por
objetivos
Se puede decir que Ralph Tyler es el primer investigador de la
evaluación educativa al proponer la tesis conocida como “evaluación
por objetivos” que impactó en los modelos educativos que adoptaron
varios países,entre ellos, México.
La época tyleriana conceptualiza a la evaluación educativa como “un
proceso que consiste en la comparación constante de los resultados del
aprendizaje de los alumnos con los objetivos previamente determinados
en la programación de la enseñanza” (Tyler, 1989, p.5).
Tyler contemplaba que la evaluación se extendiera al proceso de
aprendizaje y al currículum, no sólo a los resultados. Sin embargo, en la
práctica sólo se utilizó para comparar los objetivos con aquellos
aprendizajes que se podían constatar en los estudiantes.
La evaluación por objetivos se mantuvo vigente en Estados Unidos
durante 15 años. En México, el modelo educativo de programación por
objetivos se implementó en la educación básica en el año 1975 y
permaneció vigente hasta 1993.
Para Tyler, la referencia central en la evaluación son los objetivos
preestablecidos, los cuales deben ser cuidadosamente definidos en
términos de conducta (Mager, 1962). Dichos objetivos necesitan marcar
el desarrollo individual del alumno en un proceso socializador, de ahí
que se afirme que esta época se caracteriza en la teoría del aprendizaje
conductista.
La programación por objetivos como modelo educativo y fundamentado
en las propuestas de Tyler, fue criticada por varios autores; entre ellos
Lee J. Cronbach, quien es considerado uno de los primeros
especialistas en evaluación educativa. Esta postura generó un cambio
paradigmático en el concepto de evaluación, que evolutivamente dio
paso a la época del realismo. Guba y Lincoln (1989), consideran esta
época como “la segunda generación” de la evaluación.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 8 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Lección 2.3 Época del realismo
La necesidad de modificar los sistemas formales de educación en los
Estados Unidos, se vio estimulada por el adelanto mostrado por los
rusos en 1957 con el lanzamiento del Sputnik. En esta época se crea el
Comité Nacional de Estudios en Evaluación (National Study Comitte
on Evaluation) y se invierten millones de dólares para apoyar a la
educación. Se modifican leyes y se descentraliza el sistema educativo
en este país norteamericano.
También en esta época se genera un nuevo concepto de evaluación, ya
no sólo de los alumnos, sino que se expande y se advierte un gran
interés por la evaluación de programas y en la práctica educativa en
general (Mateo, 1993).
Nuevos
conceptos
En varios países de Latinoamérica, se desata el fenómeno de la
evaluación educativa para incluir además al alumno en todos los
factores que confluyen en el proceso educativo y surge la evaluación
con carácter de investigación. Dos autores sobresalen con sus
propuestas basadas en este enfoque: Lee. J. Cronbach y Michael
Scriven, quienes contribuyen con nuevos conceptos de evaluación
educativa. Entre sus aportaciones se define la evaluación formativa,
quedando diferenciada de la evaluación sumativa.
Cronbach propone el uso de una metodología plural que equilibre los
procedimientos experimentales y naturales en función de cada situación
y hace énfasis en la calidad de la información, afirmando que ésta debe
ser: clara, oportuna, exacta, válida y amplia, con el fin de que quien tome
decisiones tenga un conocimiento muy completo de la realidad. Este
enfoque proporciona elementos importantes para caracterizar a esta
etapa del desarrollo de la evaluación como época del realismo.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 9 DE 15
E V A L U A C I Ó N
E D U C A T I V A
En 1977, Michael Scriven reacciona contra Ralph Tyler, pero también
critica el modelo de Cronbach porque se orienta sólo a la búsqueda de
información. Scriven propone que la evaluación tenga como objetivo la
estimación del valor de la enseñanza. Al igual que Cronbach, desvía la
atención de la evaluación de los resultados a otras funciones,
diferenciando entre evaluación formativa y sumativa y dándole mayor
peso a la primera.
Evaluación
formativa
La evaluación formativa desde la perspectiva de Scriven, constituye una
estimación del proceso de enseñanza y permite intervenir para
perfeccionarlo antes de que concluya su desarrollo.
Evaluación
sumativa
La evaluación sumativa se centra en el estudio de los resultados, pero
no sólo los resultados previstos en los objetivos, sino también aquellos
no previstos. Para llevar a cabo este último proceso y con el fin de evitar
que el evaluador oriente a los resultados previstos, propone también una
evaluación sin referencia a los objetivos.
Para Scriven, los criterios para realizar los juicios de valor deben
desviarse de los objetivos a las necesidades de quienes están
implicados en la enseñanza; y concluye que los resultados de un
programa serán positivos en la medida que den respuesta a dichas
necesidades. Sin embargo, algunos de los más importantes evaluadores
educativos, no estuvieron de acuerdo con Scriven, al darse cuenta que
su trabajo y conclusiones no ayudaban a los diseñadores de currículum,
ya que no respondían a las preguntas sobre cómo comprobar el grado
de efectividad de los programas educativos.
Lee. J. Cronbach, recomendó a los evaluadores que reconceptualizaran
la evaluación, no como si se tratara de una carrera de caballos entre
programas competidores, sino como un proceso consistente en recoger
y formalizar información que facilitara el trabajo de los diseñadores de
currículum.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 10 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Cronbach propugnó por el análisis y la relación de los resultados de las
pruebas, por ser de mayor utilidad para los profesores al informar no
sólo el promedio total de las calificaciones.
La época del realismo se caracteriza por la proliferación de modelos
evaluativos basados en la metodología de la investigación y se
establece una división entre los modelos cuantitativos y cualitativos,
aunque se les considera complementarios. En esta época se llega a una
apertura y pluralidad conceptual que genera los siguientes puntos:
Diferentes conceptos de evaluación.
Diferentes criterios en relación a metas, toma de decisiones,
valores, etc.
Pluralidad de los procesos evaluativos.
Pluralidad de los objetos de evaluación.
Apertura en los procedimientos de evaluación.
Pluralidad de las funciones de la evaluación.
Varios de estos principios fueron aportados por Lee. J. Cronbach en su
libro Hacia una reforma de la evaluación de programas (Toward reform
of program evaluation) que publicó en 1980.
Según Guba y Lincoln (1989), la época del realismo corresponde a “la
tercera generación” de la evaluación, caracterizada por introducir la
valoración y el juicio como un contenido intrínseco de la misma. La
función del evaluador no sólo es la de analizar y describir la realidad,
sino también valorar y juzgar con base en distintos criterios.
En el Joint Comittee on Standards for Educational Evaluation, entre 1981
y 1988, Daniel L. Stufflebeam propone 4 principios que debe cumplir
toda investigación evaluativa: ser útil, factible, apropiada, segura y
precisa.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 11 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Lección 2.4 Época del profesionalismo
Durante la década de los 70s, el campo de la evaluación empezó a
consolidarse como una profesión diferente de las demás, ya que los
evaluadores se enfrentaban a una crisis de identidad profesional.
El perfil del evaluador no era preciso, no se sabía a ciencia cierta si eran
investigadores; administradores de pruebas y encuestas; profesores o
pedagogos especializados en evaluación; organizadores o hasta
filósofos.
En los inicios de esta etapa, no existían organizaciones profesionales
dedicadas a la evaluación, ni publicaciones especializadas para
intercambiar información sobre un determinado trabajo. No existía
literatura suficiente sobre evaluación educativa, excepto trabajos inéditos
que circulaban entre los especialistas del tema y había escasas
oportunidades para prepararse como evaluadores certificados.
El campo de la evaluación era fragmentando, parcial y amorfo. Muchas
de las evaluaciones estaban dirigidas por personal sin preparación, otras
por investigadores metodológicos que intentaban sin éxito adaptar sus
métodos a las evaluaciones educativas (Guba, 1966).
Guba y Lincoln caracterizan a la evaluación con los siguientes rasgos:
La evaluación como un proceso:
Sociopolítico.
Conjunto de colaboración.
De enseñanza y aprendizaje.
Continuo, recursivo y altamente divergente.
Emergente.
Con resultados impredecibles.
Que crea realidad.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 12 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Su propuesta responde a las deficiencias de las etapas anteriores y al
excesivo apego al paradigma positivista, basándose en la epistemología
postmoderna.
El
cambio
paradigmático
es
justificado
porque
la
metodología
convencional no contemplaba la necesidad de identificar las demandas,
las preocupaciones y los asuntos de los implicados. Se necesitaba una
postura de descubrimiento más que de verificación que considerara los
factores contextuales. Es en este momento que se fijaron funciones y
responsabilidades básicas para el evaluador.
En esta época, al evaluador se le considera un mediador de juicios,
técnico, analista, historiador y juez con destrezas para recoger e
interpretar datos cualitativos; es un evaluador en un contexto sociopolítico concreto.
Evaluación de la
evaluación
Hasta 1983, la oficina de Educación de Estados Unidos patrocinó un
programa nacional de preparación para el servicio evaluativo destinado
a educadores interesados en la evaluación. Otras organizaciones
profesionales iniciaron la apertura de talleres e institutos que trataban
distintos temas relacionados con la evaluación. La especialidad se fue
considerando como una meta evaluación, es decir, evaluación de la
evaluación como un medio para asegurar y comprobar la calidad.
Durante la década de los setentas, surgen las propuestas de una gran
cantidad de modelos evaluativos que especifican qué es y cómo debe
llevarse a cabo el proceso educativo.
Guba y Lincoln registran en sus libros más de 40 modelos, a lo que
Mateo (1986) llama la eclosión de modelos.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 13 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Joint
Committee
En 1981 se constituye el Comité Conjunto (Joint Committee), formado
por 12 organizaciones profesionales que clarificaron una serie de
normas para juzgar las evaluaciones de los programas educativos,
proyectos y materiales. Se publicaron importantes normas para la
evaluación en el ámbito educativo (Evaluation News, mayo de 1981).
A finales de la década de los 80s (1989), Guba y Lincoln ofrecen una
alternativa a los modelos de evaluación a la que denominan de “cuarta
generación”. A su propuesta se le llama respondente y constructivista.
En México
Actualmente vivimos la época del profesionalismo. La evaluación en
México se concibe como una profesión dinámica pero en desarrollo, que
poco a poco se ha ido convirtiendo en un apartado identificable del
amplio aparato profesional y gubernamental de la educación.
En las siguientes lecturas se revisarán las propuestas de los autores
mencionados con mayor amplitud.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 14 DE 15
E V A L U A C I Ó N
E D U C A T I V A
Referencias consultadas
Blanco, F (1994). La evaluación en la educación secundaria. Salamanca: Amasú
Ediciones.
Castañeda, M. (1987). Los medios de la comunicación y la tecnología educativa.
México: Trillas.
Casarini, M. (2009). Teoría y diseño curricular. México: Trillas.
Cronbach, L.J. (1980). Toward reform of program evaluation. San Francisco: JosseyBass Publishers.
Guba, E.G. & Lincoln, Y.S. (1996). Fourth Generation Evaluation (9ª. ed.). California:
Newburg Park.
Dubois, P.H. (1970). A History of Psychological Testing. Boston: Allyn Bacon.
Kail, R.; Cavanaugh, J.C & Pecina, J. (2006). Desarrollo humano: una perspectiva del
ciclo vital. (3ª. ed.). México: International Thomson.
Mager, R.F. (1982). Formulación operativa de objetivos didácticos. Madrid: Marova.
Mateo, J. (1993). La evaluación en el aula universitaria. Zaragoza: ICE-Universidad de
Zaragoza.
Stufflebeam, D.L. & Shinkfield, A.J. (1987). Evaluación Sistemática. España: Paidós.
Tyler, R. (1986). Principios básicos del currículo. (5ª. ed.) Argentina: Troquel.
------------ (1989). Educational evaluation: classic Works of Ralph Tyler. Boston: Kluwer
Academic.
Verdugo, M.Á. (1994). Evaluación curricular. Una guía para la intervención
psicopedagógica. México: Siglo XXI.
M A E S T R Í A
E N
E D U C A C I Ó N
– PÁGINA 15 DE 15