Antonia Candela
Departamento de Investigaciones Educativas
1. Introducción
Una de las principales políticas impulsada por la actual administración educativa federal (la Secretaría de Educación Pública) consiste en promover una cultura de la evaluación como uno de los mecanismos para mejorar la calidad de la educación en México, como una de las formas de garantizar la calidad de la educación, como un requisito para tener la información que permita tomar las decisiones que permitan mejorar la educación en todos sus niveles (INEE, 2003). Para ello se ha creado el Instituto Nacional de Evaluación Educativa (INEE) que tiene la tarea de diseñar esta política nacional, realizar pruebas nacionales sobre todo en educación media y básica, y coordinar los esfuerzos de todas las instituciones que realicen evaluaciones. Aunque siempre se han hecho evaluaciones en el sistema educativo, la novedad ahora, siguiendo ciertas políticas globalizadoras, es hacer evaluaciones llamadas estandarizadas diseñadas desde fuera del sistema educativo para tener resultados nacionales e incluso internacionales (PISA) que permitan hacer comparaciones sobre la calidad de la educación entre diferentes contextos regionales y socioeconómicos de un país y entre varios países y darles una amplia difusión.
Varias son entonces las razones por las que éste se convierte en un tema relevante y de gran importancia en la actualidad. En primer lugar porque se pretende que esta cultura se convierta en una práctica permanente en todos los niveles del sistema educativo desde preescolar hasta posgrado, evaluando a los alumnos, maestros, escuelas, currículos, etc. En segundo lugar porque se pretende que la evaluación sea el insumo fundamental para mejorar la calidad de la educación y en tercer lugar porque la aplicación continua de pruebas y la importancia que se le está dando a la divulgación de los resultados en los medios masivos de comunicación y a la comparación entre escuelas, alumnos, sistemas educativos y países, la anuncian como un factor que muy probablemente va a tener un fuerte y permanente impacto en las prácticas cotidianas de nuestro sistema educativo.
Aquí me propongo plantear algunas reflexiones acerca de las evaluaciones estandarizadas analizando algunos efectos que han tenido sobre el sistema educativo en países en los que éstas se han aplicado ya por varios años, sobre todo aquellos efectos que pueden afectar el buen desenvolvimiento del sistema. El propósito de estas reflexiones es el de aportar elementos a los actores del sistema educativo para interpretar los resultados de estas evaluaciones, ubicando en contexto lo que ellos indican. También me interesa analizar cuáles podrían ser algunas de las medidas que permitirían complementar la información sobre los procesos educativos y así contrarrestar algunos de los efectos negativos que estas evaluaciones pudieran tener en el sistema educativo de nuestro país, en donde esta política está empezando a implementarse. También se analizará el tipo de información que aportan estos modelos de evaluación comparándola con la información educativa que es necesaria para tomar medidas que mejoren la calidad de la educación. Por lo tanto, se plantean algunas de las características que tendrían que tener las evaluaciones para ser un instrumento útil para la toma de decisiones en manos de los propios actores educativos.
2. Algunos posibles efectos de las evaluaciones estandarizadas a largo plazo
na de las formas de prever los posibles efectos de una política a largo plazo es analizar el impacto que ha tenido su aplicación en otros países en los que dicha política se ha sostenido por varios años, haciendo las correcciones pertinentes según las diferencias de contexto y de circunstancias. Por esta razón describiremos algunos de los efectos de las políticas de evaluación aplicadas nacionalmente por más de 10 años en Chile, Brasil y EU. Los primeros dos países de condiciones similares a las de México (México 34avo lugar, Chile 36avo lugar, Brasil 35avo lugar en las pruebas internacionales de PISA, aplicadas por la OCDE) y EU con condiciones mejores al tener el 16avo lugar en los resultados de las mismas. Asumimos y aclaramos que cuando se quiere evaluar un sistema nacional, las evaluaciones estandarizadas son necesarias pero, como más adelante analizaremos es imprescindible combinar éstas con otro tipo de evaluaciones para tratar de evitar sus efectos deformantes.
a) Efecto de aumento de la marginación
En esta sección el análisis se va a centrar en lo que podríamos llamar los efectos sociales de las pruebas estandarizadas sobre la educación, poniendo atención en algunos riesgos que es conveniente tratar de evitar.
En Chile, después de 15 años de aplicación de pruebas nacionales estandarizadas a través del Sistema de Medición de la Calidad de la Educación (SIMCE) que incluye pruebas de castellano y matemáticas a los cuartos y octavos básicos en los años pares e impares respectivamente, muestran que hay un mejoramiento de los conocimientos que adquieren los alumnos de entre un 10 y un 20 % pero aumenta la distancia de los resultados entre las escuelas privadas de los sectores de más altos ingresos y las escuelas públicas a las que asisten las capas bajas de la sociedad (Mella, 1999). Este mejoramiento de la calidad sin embargo no ocurre siempre: En Brasil los resultados nacionales han descendido, después de 10 años de aplicación de pruebas de matemáticas a nivel nacional en educación básica (De Freitas, 2004). Por otro lado, aún cuando los resultados mejoren, como ocurre en Chile, el incremento en la distancia entre los resultados de las escuelas privadas y las públicas para sectores pobres, cuestiona la relación que se ha pretendido establecer entre equidad y educación.
Uno de los mecanismos que produce este efecto de aumento de la desigualdad es el que se ha llamado el Efecto Mateo. Este efecto actúa de la siguiente manera: a nivel institucional, una escuela que sale mejor evaluada adquiere prestigio y, por tanto, posiblemente obtenga mayores recursos para su desempeño, pero aunque esto no ocurra, el prestigio social hace que más alumnos acudan a ella. Esta escuela tiene posibilidad de hacer una mejor selección tanto de a los mejores alumnos como de los mejores maestros y por tanto aumentarán sus posibilidades objetivas de obtener mejores resultados en evaluaciones posteriores. En educación es bien conocido el efecto de la autoestima y de la valoración social como uno de los mecanismos más efectivos para mejorar el desempeño educativo, tanto de alumnos como de maestros. No es casual que en Finlandia, que tiene el primer lugar en las pruebas de PISA, los docentes de educación básica sean reconocidos al mismo nivel que los profesionistas del más alto prestigio social. Por lo tanto, el mejoramiento del prestigio social actúa también como un factor subjetivo que contribuye a mejorar el desempeño educativo en las escuelas, alumnos y maestros que salen bien evaluados. Por el otro lado, el prestigio de las escuelas que obtiene peores resultados disminuye y con ello posiblemente disminuya la autovaloración de sus actores y el estímulo por el trabajo, pero además el efecto continuo de las pruebas contribuye a una selección en la que ahí van quedando los peores alumnos o al menos los alumnos que están en peores condiciones para sacar buenos resultados en el tipo de pruebas estandarizadas (Pérez Mora, 2004).
A nivel individual el mecanismo de marginación, como ha ocurrido no sólo en Chile sino también en Brasil y sobre todo en EU, actúa de la siguiente manera. Un alumno que sale mal evaluado es etiquetado como un mal alumno lo que también actúa en su autoestima y en lo que espera de él el maestro (Efecto Pigmalion) y por tanto es muy probable que disminuya su desempeño educativo. Pero también hay un efecto objetivo que contribuye a irlo marginando. Para que la escuela obtenga mejores resultados, un mecanismo habitual que ha aparecido es el de pedirles a los alumnos que salieron mal evaluados que no presenten el examen o el de hacerlos que repitan el año para que así obtengan mejores resultados (Valenzuela 2002). Investigaciones realizadas en EU muestran que la reprobación aumenta hasta en un 50% la posibilidad de que un alumno sea expulsado de la escuela (Intercultural Development Research Association, 2001). Así las evaluaciones externas representan el riesgo de contribuir primero a aumentar la reprobación y después a aumentar la expulsión de los alumnos que obtienen peores resultados en las pruebas estandarizadas.
Si bien las evaluaciones estandarizadas son una necesidad cuando se quiere analizar todo un sistema educativo porque diseñan parámetros (items) que buscan comparar el desempeño educativo en diferentes medios, es conveniente considerar las limitaciones que esta comparación tiene y los efectos secundarios que puede tener.
Al construir items estandarizados para las pruebas que se aplican a los actores educativos, necesariamente se homologan las demandas desde unas características lingüísticas y desde unas prácticas sociales y culturales determinadas que ponen en desventaja a los sectores que no pertenecen culturalmente a ellas. La mayor parte de estos items son diseñados desde parámetros de la cultura occidental de los países a los que pertenece la OCDE. En un país multicultural como es el nuestro, los grupos indígenas y muchos de los sectores bajos de la sociedad como son los campesinos pobres, están muy distantes lingüística y culturalmente de estos referentes y por tanto hay que asumir que muy probablemente parten de una posición de desventaja para enfrentarse a las características de unas pruebas como son éstas.
Los resultados de las primeras pruebas nacionales de lectura y matemáticas aplicadas por el INEE en 2003 a una muestra amplia de alumnos de 6º grado de primaria de escuelas urbanas públicas y privadas, rurales, comunitarias e indígenas muestran esta tendencia.
Por tanto, son los sectores indígenas y de comunidades rurales pobres, que ya de entrada son los más marginados educativamente en nuestro país y cuyo contexto social y familiar no desarrolla las competencias que la escuela valora como es la lectura, o que tienen más dificultades para entender el contenido de las preguntas en español y para responder a exámenes largos por escrito, los que tienen más probabilidades de salir mal evaluados en las pruebas estandarizadas, generalmente no por incompetencia sino por tener una lengua y una cultura que no es tomada en cuenta como referente para las pruebas. En países como EU los grupos étnicos distintos de los dominantes, como los latinos y los sectores más pobres de la sociedad son también los que obtienen los peores resultados en estas pruebas (Valenzuela, 2003). Esto nos indica las limitaciones de la pretendida objetividad de las pruebas y la importancia de hacer un esfuerzo por construir parámetros contextualizados a las condiciones sociales y culturales, al menos del país y por relativizar los resultados de las pruebas estandarizadas a través de incluir, al menos, el factor socioeconómico en las comparaciones (Zorrilla, 2004; Himel, 2004).
Aparte de los factores ya analizados de desventaja por el origen lingüístico y cultural de los alumnos, existen otros elementos que necesitan ser tomados en cuenta para interpretar los resultados de las evaluaciones estandarizadas, sobre todo cuando éstas ponen el acento en la evaluación de los aprendizajes de los alumnos. La investigación educativa ha puesto en evidencia desde hace mucho tiempo que el aprendizaje depende del contexto social en el que ocurre (Cicourel, 1974; Bruner, 1984; Coll, 1986), sin embargo las pruebas estandarizadas tienden a descontextualizar el aprendizaje y evalúan con los mismos parámetros a un alumno cuya escuela tiene las mejores condiciones de enseñanza (buenos maestros, instalaciones apropiadas, etc.) y a un alumno que estudia en una escuela que no tiene ni los medios materiales ni tal vez los recursos de enseñanza adecuados.
Si la evaluación estandarizada se centra en los aprendizajes logrados por los alumnos sin tomar en cuenta lo que se les ha enseñado y las condiciones en las que se imparte esta enseñanza, se pone en desventaja a los sectores que, por diversos factores, trabajan en peores condiciones de enseñanza. De esta manera, se corre el riesgo de culpar a los individuos de los resultados de las pruebas, sin tomar en cuenta la calidad de la enseñanza y los contextos de desigualdad de la oferta educativa que son responsabilidad no de los individuos sino del sistema educativo en su conjunto. Esto es, se culpa a los individuos de que el sistema les proporcione una escuela con menos recursos y condiciones que a otros. Esta situación nuevamente pone en desventaja a los sectores de la sociedad más desfavorecidos económica y socialmente que son los que frecuentemente tienen apoyos educativos más deficientes.
De esta manera, la aplicación de pruebas estandarizadas o iguales a los desiguales y la comparación entre ellos en base a estas pruebas (a través de lo que se denomina Rankeo) es un mecanismo que ha conducido, en países tanto del primer mundo como EU, como en países con condiciones muy semejantes a las nuestras como es Chile y Brasil, al aumento de la desigualdad, tanto por escuela como por alumno. Estos sistemas permanentes de evaluaciones estandarizadas tienen, por tanto, el gran riesgo de actuar en dirección contraria a la equidad educativa al aumentar la distancia entre los sectores que tienen mejores resultados y los que tiene peores resultados en las pruebas aplicadas (Martinic, 2003; Valenzuela, 2002).
b) Efectos sobre el currículo y sobre los enfoques de enseñanza
Esta sección se va a centrar en lo que podríamos llamar los posibles efectos de las pruebas aludidas sobre el contenido educativo. Uno de los efectos ampliamente reconocidos de la aplicación de cualquier sistema de evaluación, sobre todo cuando éste es diseñado desde fuera de la práctica misma, es el del impacto sobre la práctica, que en este caso es sobre lo que se enseña y la manera como se enseña. Por ejemplo en educación superior y en investigación científica es claro el impacto que han tenido los sistemas de evaluación como el SNI al orientar el quehacer investigativo hacia lo que otorga mejores calificaciones. Cuando estos resultados tienen un impacto sobre los recursos que recibe el docente o investigador y cuando sus resultados tienen una difusión social amplia que conduce al fenómeno de etiquetar a los evaluados e influir en el prestigio social, estos sistemas tienen el efecto de ir modificando las prácticas eliminando aquello que no se evalúa positivamente.
En el caso de la educación, la presión a los docentes para que sus alumnos y ellos mismos salgan bien evaluados tiene el efecto de que ellos tiendan a "enseñar para el examen". Por tanto los contenidos que no son planteados en las pruebas, muchos de los cuales tienen que ver con el contexto local de los alumnos, o con prácticas no son tomadas en cuenta en las pruebas, van siendo dejados de lado. Así mismo, las practicas que, aunque sean necesarias para la comprensión, no son tomados en cuenta en las pruebas pueden tender a no ser considerados por los maestros si ellos priorizan el obtener mejores resultados en las pruebas a la importancia de que sus alumnos comprendan bien el contenido. El riesgo es que los criterios sobre cómo enseñar y qué enseñar ya no se basen, en la necesidad de una mejor formación ni en las necesidades locales de cada sector educativo sino en la transmisión de los recursos que se requieren para pasar bien las pruebas. Por tanto, un riesgo importante es que el currículo real en la práctica vaya siendo el contenido y los enfoques que tienen implícitos las pruebas estandarizadas. Cuando las pruebas están diseñadas desde fuera del sistema educativo y no están vinculadas al currículo real y a las condiciones de enseñanza, o sea, al contexto local y a lo que se enseña y cómo se enseña a los alumnos, la aplicación continua de estas pruebas va desplazando al currículo y sustituyéndolo por los contenidos de las evaluaciones.
La construcción de los ítems y de las pruebas se realiza necesariamente desde una cierta concepción educativa, desde enfoques sociales y culturales de lo que es deseable que la educación promueva y favorezca, pero estas concepciones generalmente no se plantean explícitamente y quedan ocultas en los criterios de evaluación. Es fundamental conocer los criterios que determinan la construcción de los parámetros de evaluación para poder identificar los modelos educativos que estas pruebas promueven y por tanto permitir la reflexión sobre lo que implica tener éxito o fracaso en las pruebas. La información sobre los criterios técnicos, los modelos y enfoques educativos implícitos en las pruebas es indispensable para permitir el debate académica y de política educativa necesaria en nuestro país y para evitar que se vayan imponiendo los modelos educativos que están ocultos en las pruebas estandarizadas (Manzi, 2004) y que se marginen los currículos nacionales o locales y las políticas compensatorias para apoyar a los más atrasados.
Si el sistema nacional de evaluación se basara sólo en este tipo de pruebas su efecto a largo plazo corre el riesgo de ir marginado el currículo nacional por parámetros internacionales que pueden no ser necesariamente son los más convenientes para nuestro país y ponen en riesgo políticas educativas como la equidad de la educación, las políticas compensatorias, las políticas interculturales que están tratando de que las escuelas y nuestro sistema educativo tome en cuenta la cultura de origen de los alumnos y la reconozcan y valoren como un medio para educar en el reconocimiento a la diversidad y fortalecer la identidad de los distintos grupos culturales en México.
3. Alternativas y evaluaciones complementarias
Las pruebas estandarizadas que hasta ahora hemos analizado se basan en cortes diacrónicos del sistema que son como una fotografía que nos aporta cifras agregadas que permiten conocer el estado del sistema educativo comparando los resultados de sus diferentes estratos y niveles. Sin embargo, estos datos no nos dan información sobre las causas por las que se obtienen ciertos resultados ni nos permite analizar las características de los procesos educativos que ocurren en las aulas sin los cuales es difícil entender cuáles son los problemas educativos que llevan a ciertos resultados y saber qué decisiones y medidas tomar para contribuir a resolver estos problemas y, en consecuencia, a mejorar la calidad educativa.
Existen otros tipos de pruebas que son complementarias a las antes descritas y que aportan información relevante para la toma de decisiones tendientes a mejorar la calidad educativa como son los procesos asociados al aprendizaje vinculados a la cultura escolar y a las prácticas educativas.
a) Evaluaciones de valor agregado
Estudios numerosos de perspectiva etnográfica así como análisis de seguimiento de cohortes de alumnos buscan analizar el efecto de la escuela sobre los alumnos. Se ha encontrado que tanto en EU (Arancibia, 1992) como en América Latina (Schieffelbein & Farrel, 1982;) y en estudios comparativos entre países ricos y países pobres (Heyneman & Loxley, 1982) la diferencia entre cómo entran a la escuela y cómo salen es mucho mayor en alumnos que provienen de sectores pobres. Es decir, estos estudios denominados de "valor agregado" permiten analizar los conocimientos que les aporta la escuela a los niños, cuánto aprendieron en relación a lo que sabían y no en relación a otros niños que tan vez entraron a la escuela en otras condiciones. De esta manera se compara lo comparable pues se compara a los alumnos consigo mismos y con otros alumnos y escuelas de las mismas condiciones socioculturales y económicas que las de ellos.
Estas son, por tanto, evaluaciones contextualizadas que controlan los factores socioeconómicos de entrada que tan fuerte impacto tienen sobre los resultados comparativos a nivel nacional. En este tipo de evaluaciones se encuentra que las escuelas de los sectores pobres son mucho más efectivas que las de clase media y clase media alta pues el cambio en conocimientos y competencias de los alumnos de estas escuelas es mucho mayor que en los otros casos (Mizala & Romaguera, 1998; Bellei, 2001). En este tipo de evaluaciones se refleja el esfuerzo de los docentes y de los alumnos por superar sus condiciones de marginación y así mismo se puede notar el reconocimiento y el importante valor social que tiene la escuela para sectores y países pobres como los nuestros (Pérez Mora, 2004).
b) Evaluaciones cualitativas
A diferencia de las evaluaciones que tienden a dar números y por tanto a medir los resultados de la educación, las evaluaciones cualitativas recuperan el sentido profundo de evaluar como el proceso que nos permite emitir un juicio de valor sobre un asunto determinado y no necesariamente un número. Así es importante reconocer que evaluar no implica necesariamente medir y que las mediciones son sólo un tipo de evaluación pero no la única ni necesariamente la más importante para darnos información sobre los procesos educativos. A la evaluación cualitativa pertenecen las que realizan de manera continua los docentes acerca de sus alumnos. Como muestra la investigación educativa los maestros no sólo hacen pruebas para comprobar a veces midiendo y otras considerando con criterios cualitativos el avance en el manejo de los contenidos que tienen sus alumnos, sino que en el trabajo cotidiano van formando un expediente de cada uno de ellos con el conocimiento que van teniendo de sus potencialidades cognitivas, intelectuales y afectivas así como de las posibilidades o limitaciones que les aporta su contexto familiar y sociocultural (Luna, 2000). Es importante recuperar y tomar en cuenta estas evaluaciones en los análisis nacionales ya que son las que mejores posibilidades tienen de considerar todos los factores que intervienen en el desempeño de los alumnos.
También hay evaluaciones cualitativas de tipo etnográfico que pueden ser realizadas por investigadores externos pero que requieren de estancias en el contexto a evaluar, observaciones y registros detallados sobre todo lo que ocurre en el aula o en la escuela y que requieren de análisis cualitativos para tratar de comprender cuáles son los procesos que ocurren en esta situación, para describir las condiciones en las que se realiza la educación y los factores que influyen en los posibles resultados educativos. Estas evaluaciones son costosas en tiempo y en recursos económicos y humanos ya que la descripción de los procesos requiere comprender la lógica de los actores educativos que frecuentemente es diferente de la perspectiva del investigador. Por esta razón no se pueden hacer evaluaciones cualitativas de todo el sistema sino que hay que hacer estudios de casos representativos. Para esto es interesante tomar en cuenta las evaluaciones estandarizadas o cuantitativas como un punto de partida para decidir qué es lo que conviene analizar más detalladamente. Por ejemplo el informe del INEE sobre las pruebas estandarizadas aplicadas nacionalmente aporta una gráfica de la diferencia de promedios en lectura entre las escuelas urbanas y rurales en todos los estados de la República. En esta gráfica, que se muestra a continuación las escuelas urbanas tienen mejores resultados que las rurales en todos los estados excepto en Guerrero y Campeche. Este es un dato que no puede ser explicado más que si se realiza algún tipo de estudio cualitativo para analizar qué es lo que pasa en esos estados a diferencia de los demás que aporta un resultado así.
c) Evaluaciones en base a un proyecto educativo de cambio y por zona escolar
En algunos lugares, como es en el estado de Campiñas en Brasil (De Freitas, 2004) se está probando un tipo de evaluación en la que de manera voluntaria los docentes y las escuelas de una cierta región con condiciones semejantes a nivel cultural y socioeconómico deciden plantearse un proyecto educativo de cambio para mejorar la calidad de su enseñanza. En este caso los propios docentes son los que deciden cuáles son los items que les interesa que sean evaluados de acuerdo al enfoque que tienen y a los propósitos del proyecto educativo con el que pretenden mejorar su trabajo. Los estándares máximos se establecen respecto a la mejor escuela de la zona. Los investigadores aportan su conocimiento para diseñar las pruebas y los sistemas de evaluación con las mejores técnicas de acuerdo a los propósitos del proyecto. De esta manera los resultados vienen a ser significativos para los propios actores educativos ya que responden a las necesidades concretas de información que ellos tienen y son base para reflexión colectiva y para la toma de decisiones sobre las medidas a tomar para mejorar la calidad de sus procesos educativos. Así, la evaluación continua tiene un sentido más dinámico pues está vinculada a los cambios permanentes que se van implementando en base a los resultados de las evaluaciones. Por otro lado, este tipo de proyectos compara a las escuelas comparables en cuanto a contexto sociocultural y permite socializar la experiencia de las escuelas que, teniendo las mismas condiciones socioeconómicas y de trabajo educativo, obtienen mejores resultados.
4. Legitimación necesaria para el proceso de evaluación
Uno de los requisitos fundamentales para que una evaluación tenga un efecto sobre la práctica educativa de modo que contribuya a mejorar la calidad de la educación es que la evaluación tenga credibilidad, esto es, que los actores educativos le otorguen un sentido positivo como contribución para mejorar su tarea educativa. Para esto, es necesario que la evaluación tenga legitimidad en varios sentidos. Tiene que tener legitimidad técnica y académica ya que debe ser realizadas con el conocimiento más avanzado de los recursos de medición, de análisis estadísticos sofisticados y de evaluaciones de diferente tipo que tienen gran complejidad técnica. Pero para que la evaluación se vincule al trabajo cotidiano, para que pueda aplicarse y para que sus resultados sean retomados en la práctica es necesario que tenga legitimidad social y política. Una evaluación sin legitimidad política corre el riesgo de sólo servir para aportar datos que no tienen, en el mejor de los casos ninguna repercusión en las prácticas educativas, y en el peor que tienen efectos secundarios que pueden dañar al sistema empeorando la educación a través de mecanismos de marginación y estrechamiento del currículo real que ya antes analizamos.
Si la necesidad de legitimación política y social es necesaria para la aplicación de cualquier sistema de evaluación que pretenda retroalimentar y tener un efecto en el mejoramiento de las prácticas educativas, esto es indispensable en las evaluaciones que buscan analizar los procesos que ocurren en la escuela. No se pueden evaluar procesos sin contar con la participación de los maestros, alumnos, padres y las autoridades escolares. Esto es, los actores educativos tienen que tener un compromiso de cambio pero para que la evaluación contribuya a mejorar la calidad educativa es imprescindible también que las autoridades relacionen la evaluación con una política de mejoramiento y de financiamiento a los sectores que obtienen los peores resultados.
5. Algunas conclusiones
Cuando se pretende conocer el estado del sistema educativo en su conjunto son necesarias las pruebas estandarizadas que proporcionan datos cuantitativos que permiten hacer comparaciones entre diferentes sectores del sistema. Sin embargo, estas pruebas son muy costosas y como hemos visto tienen riesgos de producir efectos secundarios no deseados sobre el sistema que pueden causar más problemas a la educación que los que pueden resolver. Para tratar de evitar efectos como el aumento de la marginación y las modificaciones curriculares para terminar enseñando sólo para el examen, es necesario que los actores educativos comprendan los alcances y las limitaciones de esta información, esto es, que la puedan interpretar. Para eso es necesario, desde mi punto de vista, por un lado, que al mismo tiempo que se da la información sobre los resultados de las pruebas, se informe sobre cómo se hicieron los items o indicadores y sobre cómo se aplicó la prueba. No se pueden interpretar linealmente los resultados de las pruebas estandarizadas ya que como hemos visto un mal resultado no necesariamente refleja una mala educación. Es importante informar de estos resultados con las precauciones adecuadas para evitar descalificaciones, desprestigio social y los efectos de desmoralización y disminución de la autoestima.
Por otro lado es de gran importancia que, más que evaluaciones continuas del mismo tipo a todo el sistema sin que se hayan realizado cambios en él, se implementen formas alternativas de evaluación con enfoques diversos, como las descritas u otras, que aporten información complementaria que permita comprender las causas de los resultados de las pruebas estandarizadas y que den elementos para conocer las características de los procesos que ocurren en las aulas y las escuelas. Sólo con información sobre los procesos educativos en las aulas y sobre las condiciones de enseñanza se pueden tener los elementos informativos que permitan reconocer dónde están los problemas y así buscar los recursos que permitan superarlos y mejorar la calidad de la educación. También tiene gran relevancia que las pruebas estandarizadas se adecuen lo más posible al currículo nacional, como ya está intentando hacerlo el INEE. Al mismo tiempo que se realizan evaluaciones del sistema es necesario descentralizar otras evaluaciones para que éstas se adecuen a las condiciones locales de cada región, para que tomen en cuenta los factores socioeconómicos y culturales tan diversos que hay en nuestra República. De esta manera se permite que las evaluaciones se relacionen con políticas locales de cambio en las que se comprometan los actores educativos mientras que las autoridades aporten los apoyos necesarios.
Las evaluaciones por sí mismas no mejoran la calidad por lo cual es importante tomar las medidas para que se comprenda que la cultura de la evaluación sólo es un medio que tiene riesgos como los de aumentar la inequidad y estrechar el contenido de la educación si no se vincula con una cultura de la calidad. Para esto es necesario, desde mi punto de vista, articular los resultados de distintos tipos de evaluación con el compromiso, la participación y los recursos de todos los actores educativos y con los apoyos materiales y sociales necesarios por parte de las autoridades, en torno a proyectos locales de cambio.
Bibliografía
Arancibia, V., 1992, Efectividad escolar. Un análisis comparado, Santiago, CEP, Documentos de Trabajo No. 174
Bellei, C., 2001, ¿Ha tenido impacto la reforma educativa Chilena?, Santiago, Ministerio de Educación (m.s.)
Bruner, J.,1984, Acción, Pensamiento y Lenguaje. Comp. J.L. Linaza. Madrid: Alianza Psicología.
Cicourel, A., 1974, Some basic theoretical issues in the assessment of the child's performance in testing and classroom settings. En: Lenguage Use and School Performance. USA: Academic Press, 300-351.
Coll, C., 1984, Estructura grupal, interacción entre alumnos y aprendizaje escolar. En: Infancia y Aprendizaje, 27/28, pags. 119-138.
De Freitas, L. C. 2004, "Evaluación institucional y evaluación de sistemas: hacia un abordaje integrado" en: XIV Congreso Mundial de Ciencias de la Educación, Educadores para una Nueva Cultura, Santiago, p. 434
Heyneman, S.P. & W. A. Loxey, 1982, "Influences on academic achievement across high and low income countries: a re-analysis of Iea Date" in: Sociology of Education, Vol. 55, pp. 1-32
Himmel, E., 2004, "Modalidades de informes de resultados de mediciones nacionales y su impacto en el uso" en: XIV Congreso Mundial de Ciencias de la Educación, Educadores para una Nueva Cultura, Santiago, p. 435
Instituto Nacional para la Evaluación de la Educación, 2003, Política Nacional de Evaluación, México, INEE, 92 pags.
Instituto Nacional para la Evaluación de la Educación, 2003, La calidad de la educación básica en México, México, INEE, 182 pags.
Instituto Nacional para la Evaluación de la Educación, 2003, ¿Qué hace a una escuela una buena escuela?, México, Fundación Este País, 8 pags.
Intercultural Development Research Association, 2001, Retention in grade: policy brief update, San Antonio, Texas
Luna, M.E.
Manzi, J. 2004, "El rol de las evaluaciones estandarizadas en la elevación de los resultados educacionales en Chile" " en: XIV Congreso Mundial de Ciencias de la Educación, Educadores para una Nueva Cultura, Santiago, p. 436
Martinic, S., s/f, "Las Representaciones de la Desigualdad en la Cultura Escolar" mimeo, 14 pags.
Mella, O., 1999, Equidad y reforma educacional en Chile, Santiago, Documento Interno
Mizala, A. y P. Romaguera, 1998, Desempeño escolar y elección de colegios: la experiencia chilena, Santiago, U. De Chile-CEA, Documento de Trabajo No. 36
Pérez Mora, R., 2004, "Estandarización vs. equidad en la evaluación del desempeño de los profesores. Un ejercicio en torno a los cuestionarios para evaluación de la docencia" en: XIV Congreso Mundial de Ciencias de la Educación, Educadores para una Nueva Cultura, Santiago, p. 437
Schielfelbein, E. y J. Farrel, 1982, Eight years of their lives: through schooling to the labor market in Chile, Ottawa, IDRC.
Valenzuela, A., 2002, "High-Stakes Testing and U.S.- Mexican Youth in Texas: The Case for Multiple Compensatory Criteria in Assessment" in: Harvard Journal of Hispanic Policiy, Vol. 14, Pp. 97-116
Valenzuela, A., 2003, "Accountability and the Privatization Agenda" in: Valenzuela, A. Leaving Children Behind: Why Texas-Style Accountability Fails Latino Youth, Albany: N.Y.: State University of New York Press.
Zorrilla, M. "La evaluación del aprendizaje a gran escala en México. Una mirada a contraluz" en: XIV Congreso Mundial de Ciencias de la Educación, Educadores para una Nueva Cultura, Santiago, p. 440
University of New York Press, 35 pgs.