Estadísticas del reporte de Exámen

En este apartado podremos visualizar estadísticas e información dependiente del cuestionario. Se evaluarán algunos términos con los que no estamos familiarizados y que se definen justo abajo.

Para acceder a estos informes que se obtienen una vez que se ha realizado el cuestionario por parte de varios estudiantes, se debe seleccionar un cuestionario de los que tengamos creados en el curso.

Una vez dentro del cuestionario, localizaremos en la barra lateral derecha una pestaña con resultados que desplegaremos verticalmente. Seguidamente hacemos clic en "Estadísticas"

Una vez dentro de estadísticas, podremos revisar y descargar toda la información que nos da la LMS sobre el cuestionario, sus preguntas, etc.

Estadísticas de Exámen

Calificación promedio: Los exámenes deben obtener una calificación promedio de 50% a 75%. Los valores fuera de estos límites indica una configuración incorrecta. Los exámenes con múltiples intentos subirán irremediablemente esta cifra.

Media de la calificación: Es la nota media, la mitad de los alumnos suspensos estará por debajo y la otra mitad por encima.

Desviación estándar : Una medida de la dispersión de las calificaciones alrededor de la nota media. Intente obtener valores entre 12% y 18%. Valores inferiores a 12% sugieren que las calificaciones están demasiado amontonadas.

Sesgo: Una medida de la asimetría de la distribución de calificaciones. Cero implica una distribución perfectamente simétrica, los valores positivos indican una 'cola' a la derecha y los valores negativos una 'cola' a la izquierda.

Intente obtener un valor de sesgo de -1.0. Si se obtiene una cantidad negativa elevada (menores a -1) puede indicar falta de discriminación entre los estudiantes con buena nota. Y valores positivos muy grandes (mayores a 1) pueden indicar falta de discriminación cerca de la calificación para aprobar.

Kurtosis es una medida de que tan plana está la distribución. Trate de obtener un valor en el rango entre 0 y 1. Un valor mayor que 1 puede indicar que el exámen no está discriminando muy bien entre los estudiantes muy buenos (o los muy malos) y aquellos que son promedio.

Coeficiente de consistencia interna : Es imposible obtener consistencia interna mayor al 90%. Cualquier valor arriba de 75% es satisfactorio. Un valor menor al 64% indica que se debe volver a revisar las preguntas, ya que algunas de las preguntas no son muy buenas para discriminar entre estudiantes de diferente habilidad.

Tasa de error : Esto está relacionado con el coeficiente de consistencia interna de acuerdo con la tabla siguiente: Valores de tasa de error superiores al 50% no pueden considerarse satisfactorios; implican que menos de la mitad de la desviación estandar se debe a diferencias en habilidad y que el resto son efectos aleatorios.

Coeficiente de Consistencia Interna	100	99	96	91	84	75	64	51
Tasa de Error	0	10	20	30	40	50	60	70

Error estándar: Estima cuál es la desviación estándar se debe a efectos aleatorios, y es una medida de la incertidumbre en la calificación de cualquier estudiante dado. Esto es la desviación estándar multiplicada por la tasa de error y dividida entre 100.

Cuanto menor sea el valor del error estándar, mejor es el examen, pero es difícil lograr que el error estándar sea inferior al 5% o 6%.
Un valor de 8% corresponde a la mitad de una diferencia de calificación (por ejemplo, entre un seis y un siete).
Si el error estandar excediera de 8%, es probable que una proporción sustancial de los estudiantes estén erroneamente calificados.

Estadísticas de las preguntas

Índice de Facilidad : La puntuación promedio de los estudiantes en el cuestionario.

Índice de Facilidad	Interpretación
5% o menos	Extremadamente dificil, o algo está mal con la pregunta.
6% - 10%	Muy dificil.
11% - 20%	Dificil.
21% - 34%	Moderadamente dificil.
35% - 65%	Correcta para el estudiante promedio.
66% - 80%	Bastante fácil.
81% - 89%	Fácil.
90% - 94%	Muy fácil.
95% - 100%	Extremadamente fácil.

El nivel de dificultad (p) es igual al porcentaje de aprobación', que es igual al índice de facilidad.

Como regla general, los índices de facilidad entre 30% y 70% suelen proporcionar diferencias importantes entre el nivel de conocimiento, habilidad y preparación entre los individuos.

Desviación estandar: Una medida de la dispersión de calificaciones respecto a la media y por tanto, la magnitud de cuanto puede discriminar la pregunta. Si el índice de facilidad fuera muy alto, o fuera muy bajo, es imposible que la dispersión sea grande. Sin embargo, tome nota de que una buena desviación estandar no asegura automaticamente una buena discriminación. Un valor de la desviación estandar inferior de 1/3 del máximo de la pregunta (33%) en la tabla de arriba generalmente es insatisfactorio.

Calificación aleatoria estimada: Este es el promedio de calificación que se esperaría que los estudiantes obtuvieran por una adivinanza aleatoria de la pregunta. Los puntajes por adivinanza aleatoria solamente están disponibles para las preguntas que usan algun tipo de opción múltiple. Todos los puntajes de adivinanza aleatoria son solamente para retroalimentación diferida y asumen la más simple de las situaciones; por ejemplo, que para las preguntas de opción múltiple se le dirá al estudiante cuantas respuestas están correctas.

Valores arriba del 40% son insatisfactorios, y demuestran que las preguntas de Falso/Verdadero deben emplearse muy mesuradamente (poco o nada) en examenes sumativos.

Ponderación deseada y ponderación efectiva

Ponderación efectiva: Es el peso que realmente tiene la pregunta para contribuir a la dispersión total de las calificaciones. Las ponderaciones efectivas deberian sumar un total de 100%, pero lea más adelante:

La ponderación deseada y la ponderación efectiva se deben comparar:
- Si la ponderación efectiva fuera mayor que la deseada, demuestra que la pregunta tiene una mayor participación en la dispersión de las calificaciones de lo que usted habria deseado.
- Si la ponderación efectiva fuera menor que la ponderación deseada, demuestra que la pregunta no está teniendo tanto efecto en la dispersión de las calificaciones como Usted deseaba.
El calculo de la ponderación efectiva se basa en tomar la raíz cuadrada de la covarianza de los puntajes de la pregunta. Si los puntajes de una pregunta varían de forma opuesta a la calificación general, esto indicaría que esta pregunta es muy extraña, y que está evaluando algo completamente diferente de las demás preguntas. Llegado el caso, esto se muestra en cajas con mensajes de advertencia.

Indice de discriminación y Eficiencia discriminativa

Indice de discriminación: Esta es la correlación entre las calificaciones ponderadas en la pregunta y las del resto del examen. Indica que tan efectiva es la pregunta para clasificar/separar/discernir a los estudiantes más capaces de los menos capaces.

Index	Interpretación
50% y superior	Muy buena discriminación.
30% – 50%	Adecuada discriminación.
20% - 29%	Débil discriminación.
0 - 19%	Muy débil discriminación.
valores negativos	La pregunta probablemente sea inválida.

Eficiencia discriminativa: Esta estadística intenta estimar que tan bueno es el índice de discriminación en relación con la dificultad de la pregunta.

Un Ítem que sea muy fácil o muy difícil no puede discriminar entre los estudiantes de habilidades diferentes, debido a que la mayoría de ellos obtendrán el mismo puntaje para esta pregunta.
La discriminación máxima requiere un indice de facilidad que esté en el rango del 30% al 70% (a pesar de que este valor no es garantía de obtener un alto indice de discriminación).
La eficiencia de discriminación muy rara vez se acercará al 100%, pero deberían de poder obtenerse valores superiores al 50%.
Valores inferiores al 50% de eficiencia de discriminación indican que la pregunta no es tan efectiva para discriminar entre estudiantes de habilidades diferentes como lo debería de ser, y por esto, no es una pregunta particularmente buena.

Nota: El índice de discriminación se usa en Moodle >= 4.0 para una nueva columna que indicará si una pregunta 'Probablemente necesita revisión' cuando el índice de discriminación es en promedio muy bajo.