Errores y dificultades en la comprension de los conceptos



Descargar 135.92 Kb.
Página2/3
Fecha de conversión13.08.2018
Tamaño135.92 Kb.
Vistas71
Descargas0
1   2   3

Schuyten (1991) ha señalado también la diferencia entre el conocimiento conceptual de la mediana y el método de cálculo que se emplea para obtener su valor. Desde la definición de la mediana como “valor de la variable estadística que divide en dos efectivos iguales a los individuos de la población supuestos ordenados por el valor creciente del carácter”, hasta su cálculo basado en la gráfica de frecuencias acumuladas intervienen una serie de pasos no siempre suficientemente comprendidos.

Barr (1980) llama, la atención sobre la falta de comprensión de los estudiantes sobre la mediana en un estudio llevado a cabo con estudiantes de edades entre 17 y 21 años. El 49% dio una respuesta incorrecta a la cuestión siguiente:


La mediana del siguiente conjunto de números.

1, 5, 1, 6. 1, 6, 8 es

a) 1; b) 4; c) 5; d) 6: e) (otro valor); f) no sé:

La mayoría de los alumnos entiende la idea de mediana como valor central, pero no tienen claro a que secuencia numérica se refiere ese valor central. Los estudiante pueden interpretar la mediana como el valor central de los valores de la variable, de las frecuencias o incluso de la serie de datos antes de ser ordenada.


5. ASOCIACION EN TABLAS DE CONTINGENCIA

La idea de asociación estadística extiende la de dependencia funcional, y es fundamental en muchos métodos estadísticos que permiten modelizar numerosos fenómenos en las diversas ciencias. El término asociación se emplea para expresar la existencia de una dependencia estadística entre dos variables arbitrarias, tanto cualitativas como cuantitativas. La palabra correlación suele restringirse a las variables cuantitativas. Ambos términos, asociación y correlación, no implican necesariamente relación de causalidad sino meramente la existencia de covariación entre variables.

Una tabla de contingencia o clasificación cruzada de dos variables sirve para presentar en forma resumida la distribución de frecuencias de una población o muestra, clasificada respecto a dos variables estadísticas. En su forma más simple, cuando las variables poseen sólo dos categorías, toma la forma de la Tabla 1.





A

no A

Total

B

a

b

a+b

no B

c

d

c+d

Total

a+c

b+d

a+b+c+d


Tabla 1: Formato típico de la tabla de contingencia 2x2
Podríamos proponer a los estudiantes diferentes problemas respecto a este tipo de tabla. Incluso la interpretación de las frecuencias reviste dificultad, ya que, a partir de la frecuencia absoluta de una celda, por ejemplo, la celda a, podemos obtener tres frecuencias relativas diferentes: la frecuencia relativa doble [a/(a+b+c+d)], la frecuencia relativa condicional respecto a su fila [a/(a+b)] y la frecuencia relativa condicional respecto a su columna [a/(a+c)].

La investigación sobre los juicios de asociación ha sido objeto de gran interés en psicología y ha estado ligada a los estudios sobre toma de decisiones en ambiente de incertidumbre (Scholz, 1987), ya que la toma de decisiones precisa, generalmente, un juicio previo sobre la asociación entre variables. La mayor parte de estas investigaciones han empleado tablas 2x2, como la mostrada en el ejemplo siguiente:


Se quiere estudiar si un cierto medicamento produce trastornos digestivos en los ancianos. Para ello se han observado durante un periodo suficiente de tiempo a 25 ancianos obteniendo los siguientes resultados:





Molestias

digestivas



No tiene

molestias


Total


Toma la medicina

9

3

17

No la toma

7

1

3




16

9

25

Utilizando los datos de la tabla, razona si en estos ancianos, el padecer trastornos digestivos depende o no del medicamento.


Si analizamos con detalle la tarea presentada podemos observar que, a pesar de su aparente simplicidad, es para el alumno un problema complejo y su dificultad depende de ciertos datos del enunciado. En el ejemplo dado, aparece una asociación de tipo inverso, puesto que el consumo del medicamento ha disminuido la frecuencia de los trastornos digestivos. No obstante, según los valores dados a las cuatro casillas de la tabla, puede aparecer asociación directa, inversa o independencia.

Otro hecho que complica esta tarea es que el número de ancianos en ambos grupos no es el mismo, esto es, que la distribución marginal de la variable (tomar o no tomar el medicamento) no tiene la misma frecuencia para sus diferentes valores. Otras posibles variables que influyen en la dificultad este problema son la intensidad de la asociación y la concordancia o no concordancia entre la asociación empírica en la tabla y las creencias previas del estudiante sobre la asociación que debe esperarse en el contexto dado.

El estudio del razonamiento sobre la asociación estadística fue iniciado por Piaget e Inhelder (1951), quienes consideraron que la comprensión de la idea de asociación implica las de proporción y probabilidad. Por esta razón, Inhelder y Piaget (1955) sólo estudiaron este tipo de problemas con sujetos que se encuentran en la etapa de operaciones formales IIIa y IIIb. El contexto empleado por estos autores es el problema de la asociación entre el color de los ojos y el de los cabellos.

Para ello emplean cartas con dibujos de rostros en los que los ojos y el cabello están coloreados, preguntando al sujeto si existe o no una relación entre el color de los ojos y el del cabello, no en forma general, sino cuando se consideran los únicos datos presentados. El material se presenta al adolescente en dos formas: sin clasificar, dejando que el sujeto establezca la clasificación (que construya las cuatro casillas de la tabla de doble entrada), bien presentándole las cartas ya clasificadas. Aunque la tarea no es exactamente igual a la presentada en nuestro ejemplo es equivalente para un análisis formal de las estrategias de resolución empleadas por los sujetos, que pasamos a describir. En la etapa IIIa, Inhelder y Piaget encuentran que los sujetos analizan solamente la relación entre los casos favorables positivos (casilla a en la tabla 1) en relación a los casos totales (valor n en la tabla 1). En nuestro ejemplo, estos sujetos deducirían incorrectamente la existencia de una asociación directa entre las variables ya que el número de ancianos con trastornos digestivos que toman el medicamento es superior a cualquiera de las otras tres categorías.

Los adolescentes de nivel IIIa sólo comparan las casillas dos a dos. En la tabla 1, una vez admitido que también los casos (d) (ausencia-ausencia) son favorables a la existencia de asociación, no calculan la relación entre los casos que confirman la asociación (a+d) y el resto de los casos (b+c), lo que se produce sólo a partir de los 15 años (etapa IIIb) según Piaget e Inhelder.

Estas mismas conclusiones son obtenidas por Smendlund (1963) en trabajos con estudiantes adultos. La mayor parte de los estudiantes adultos basan su juicio, bien en la casilla (a) o comparando (a) con (b), esto es, empleando sólo la distribución condicional de tener o no trastornos digestivos, en los que toman medicamento. Con los datos del ejemplo, esta estrategia llevaría a concluir incorrectamente la existencia de una relación directa entre las variables, puesto que si nos restringimos a las personas que toman el medicamento, hay más con trastornos que sin ellos.

La dificultad de estos problemas se pone de manifiesto al tener en cuenta que, como señalan Jenkins y Ward (1965), incluso la estrategia de comparación de diagonales, considerada como correcta por Piaget e Inhelder para resolver estos problemas sólo es válida para tablas con iguales frecuencias marginales, como puede apreciarse con los datos de nuestro ejemplo. Para el caso general, Jenkins y Ward han propuesto como estrategia correcta examinar la diferencia entre las dos probabilidades condicionales de que ocurra A cuando B es cierta y de que ocurra A cuando B es falsa:

 = a/(a+b)- c/(c+d)

es decir, en nuestro caso, sería necesario comparar las razones 9/17 con 7/8 (frecuencias condicionales).

Como dificultad añadida al tema, Chapman y Chapman (1967) mostraron que hay expectativas y creencias sobre las relaciones entre variables que producen la impresión de contingencias empíricas. Este fenómeno ha sido llamado “correlación ilusoria”, porque los sujetos mantienen sus creencias y sobreestiman la asociación cuando piensan que existe causación entre dos variables (Jennings y cols., 1982). Finalmente, como señala Scholz (1987), los estudios posteriores han mostrado que para la misma estructura del problema de asociación los sujetos adoptan diversas estrategias e incluso una misma persona puede emplear diferente estrategia, dependiendo del contexto.


6. DISEÑO EXPERIMENTAL

Otro tema relacionado con la idea de asociación es el diseño de experimentos, que estudia los criterios estadísticos de planificación de los mismos que permitan alcanzar conclusiones acerca de un problema en el que un cierto número de variables pueden influir sobre otra.

Rubin y Rosebery (1990) planificaron y observaron un experimento de enseñanza dirigido a estudiar las dificultades de los profesores con las ideas estocásticas. Informaron que tanto los alumnos como su profesor interpretaron incorrectamente algunas de las ideas básicas del diseño experimental.

Una de las lecciones del mencionado experimento usó una actividad de lanzamiento a una canasta de baloncesto, en la que se varió la distancia de lanzamiento (de 1 a nueve metros) y el ángulo posicional del lanzador (para ángulos de 0,45 y 90 grados). El objetivo de la lección era explorar los efectos separados de la distancia y el ángulo y la interacción entre las variables.

La observación de la discusión entre el profesor y los alumnos sobre la idea de variables independientes, dependientes y extrañas en el experimento de lanzamiento mostró la confusión entre estos conceptos. Algunos estudiantes sugirieron como posibles variables independientes características individuales del lanzador, como su altura o su habilidad para encestar. Incluso la altura de la canasta, que se conservó inalterable durante el experimento fue considerada como variable independiente por algunos estudiantes.

Otros estudiantes sugirieron que la iluminación del gimnasio podría ser diferente para las distintas combinaciones de ángulo y distancia, de modo que tanto el profesor como los alumnos quedaron con la creencia de que la presencia de tales influencias podría hacer imposible la obtención de conclusiones sobre el efecto de las variables ángulo y distancia. Finalmente, Rubin y Rosebery resaltaron la dificultad en distinguir entre las características de los sujetos que no tenían influencia sobre el resultado del experimento de otras variables que si podrían tenerla. El papel de la asignación aleatoria como medio de compensar estas diferencias individuales tampoco fue comprendido.


7. INFERENCIA

7.1. MUESTREO

La idea central de la inferencia es que una muestra proporciona “alguna” información sobre la población y de este modo aumenta nuestro conocimiento sobre la misma. Como Moses (1992) indica “se puede pensar en la inferencia estadística como una colección de métodos para aprender de la experiencia”. Rubin y cols. (1991) indican que, en la práctica, esto implica la posibilidad de acotar los valores de los parámetros de interés en las poblaciones, esto es, la obtención de intervalos de confianza para estos parámetros.

La comprensión de esta idea básica implica el equilibrio adecuado entre dos ideas aparentemente antagónicas: la representatividad muestral y la variabilidad muestral. La primera de estas ideas nos sugiere que la muestra tendrá a menudo características similares a las de la población, si ha sido elegida con las precauciones adecuadas. La segunda, el hecho de que no todas las muestras son iguales entre si. El punto adecuado de equilibrio entre los extremos de información total e información nula respecto a la población es complejo, puesto que depende de tres factores: variabilidad de la población, tamaño de la muestra y coeficiente de confianza.

Los estudios sobre errores referidos al muestreo han tomado una gran importancia en el campo de la psicología, en el contexto de toma de decisiones. Un resumen de estos trabajos se presenta en Kahneman, Slovic y Tversky (1982), quienes atribuyen estos errores al empleo de heurísticas en la resolución de problemas de decisión. El término heurística es empleado en psicología, inteligencia artificial, y en resolución de problemas (Groner y cols., 1983). Aunque no hay un consenso general para el significado del término heurística, normalmente se emplea para referirse a procesos cognitivos que se utilizan para reducir la complejidad de un problema durante el proceso de su resolución.

En el libro citado, Kahneman y cols describen tres heurísticas fundamentales en los juicios probabilísticos: representatividad, disponibilidad y “ajuste y anclaje”. También se estudian los sesgos asociados y sus implicaciones teóricas y prácticas.

En la heurística de la representatividad se estima la probabilidad de obtención de una muestra por el parecido de ésta con la población de la que proviene. En consecuencia, aparece cierta insensibilidad al tamaño de la muestra y una confianza exagerada en las pequeñas muestras, fenómeno que se conoce con el nombre de “creencia en la ley de los pequeños números”. Por ejemplo, consideremos la siguiente pregunta:

Una cierta ciudad está atendida por dos hospitales. En el hospital más grande nacen aproximadamente 45 bebés cada día y en el hospital más pequeño nacen aproximadamente 15 bebés cada día. Como sabes, aproximadamente el 50 por ciento de todos los recién nacidos son varones, pero el porcentaje exacto varía de un ida a otro. A veces puede ser mayor que el 50 por ciento, a veces más bajo. Durante un periodo de un año, cada hospital registró los idas en que más del 60 por ciento de los recién nacidos fueron varones. ¿Cuál hospital crees que registró más de estos días:

El hospital grande.

El hospital pequeño.

Aproximadamente igual (esto es, si la diferencia entre ambos es menor del 5 por ciento).
Muchas personas creen que la respuesta correcta debe ser la tercera, puesto que en ambos hospitales la proporción de varones es la misma (60 por ciento) y piensan que este es el único hecho de importancia para determinar la probabilidad de los sucesos requeridos. No conceden atención al tamaño de la muestra, aunque la teoría de la probabilidad nos enseña que hay mayores fluctuaciones del valor de la proporción en las muestras pequeñas que en las muestras grandes.

Según Kahneman y cols. (1982) esta confianza excesiva en las pequeñas muestras tiene graves consecuencias en las aplicaciones de la estadística, especialmente en la investigación. El “creyente en la ley de los pequeños números” tiende a estimar a la baja la amplitud de los intervalos de confianza obtenidos, a sobrestiman la significación de sus resultados estadísticos y a esperar que los resultados obtenidos en los primeros ensayos se le confirmen en el futuro.

Otra consecuencia de la aplicación de la heurística de la representatividad sería el error denominado “falacia del jugador”. Por ejemplo, muchas personas creen que después de una racha larga de caras, es más probable obtener una cruz.

Al comparar los errores cometidos en los juicios sobre el muestreo con las concepciones sobre el mismo que tienen los estadísticos expertos, Pollasek y cols. (1991) observan que éstos emplean “la extracción de bolas de una urna” para modelizar el proceso de muestreo. En este modelo, el muestreo aleatorio se ve como isomorfo al proceso de extracción con reemplazamiento de bolas de una urna. Los sujetos inexpertos podrían no tener un modelo para este proceso de muestreo o podrían tener un modelo inadecuado, lo que provocaría el empleo de la heurística de la representatividad incluso con muestras muy pequeñas. Puesto que estas personas pueden no haber tenido nunca la experiencia de extraer bolas de una urna, este modelo es de carácter teórico y no práctico. Como indica Steinbring (1986), la idea de independencia tiene también carácter teórico y es difícil estar seguro de su aplicabilidad en un contexto práctico. Por esta razón, la independencia es un buen ejemplo de la diferencia entre la comprensión conceptual de un concepto y la capacidad de aplicar este concepto en la resolución de problemas (Heitele, 1975).

Otro problema relacionado con el muestreo son los diferentes niveles de concreción de un mismo concepto en estadística descriptiva e inferencia (Schuyten, 1991). En la estadística descriptiva la unidad de análisis es una observación (una persona, un objeto) y calculamos la media x de una muestra de tales objetos. En inferencia, estamos interesados por obtener información de la media teórica o esperanza matemática E(X) de la población de la que ha sido tomada la muestra dada. Consideramos tal muestra como una observación de otra población diferente, la población de todas las posibles muestras de tamaño similar al dado, que podían extraerse de la población de referencia. Hemos cambiado, en consecuencia, la unidad de análisis, que es ahora la muestra, y hablamos de que la media de la muestra es una variable aleatoria. Estudiamos la distribución de la media X en el muestreo y la media E(X) de esta variable aleatoria. Es preciso distinguir, por tanto, entre la media teórica en la población (que es una constante desconocida), la media particular obtenida en nuestra muestra; los posibles valores de las diferentes medias que se obtendrían en las diferentes muestras aleatorias de tamaño n (que es una variable aleatoria) y la media teórica de esta variable a1eatoria, que coincide con la media de la población en el muestreo aleatorio. Esto supone una gran dificultad conceptual.
7.2. CONTRASTE DE HIPOTESIS

En algunos países, uno de los temas introducidos en los últimos años de la enseñanza secundaria es el contraste de hipótesis. El campo de aplicación del contraste de hipótesis es muy amplio, pero, como comenta Brewer (1986), esta parte de la inferencia es probablemente la peor comprendida, más confundida y de la que más se ha abusado en toda la estadística.

El término “contraste de hipótesis” abarca un gran número de procedimientos estadísticos: contrastes de diferencias de medias, análisis de la varianza, pruebas no paramétricas, contrastes multivariantes. Todos estos procedimientos tienen un núcleo común constituido por una serie de conceptos básicos (hipótesis nula y alternativa, estadístico de contraste, nivel de significación, etc.) y unos esquemas-procedimientos generales que se aplican a los casos particulares. La aplicación correcta de estos procedimientos precisa muchos tipos de elecciones, incluyendo: el tamaño de la muestra, el nivel de significación  y el estadístico apropiado. En particular Peskun (1987) ha señalado las dificultades de los estudiantes en los aspectos siguientes:

a) la determinación de la hipótesis nula H0 y la hipótesis alternativa H1

b) la distinción entre los errores Tipo I y Tipo II;

c) la comprensión del propósito y uso de las curvas características operativas o curvas de potencia; y

d) la comprensión de la terminología empleada al establecer la decisión.

Uno de los aspectos claves en la correcta aplicación de un contraste de hipótesis es la comprensión del concepto de nivel de significación, que se define como “la probabilidad de rechazar una hipótesis nula, en el caso de ser cierta”, definición que se expresa en la igualdad siguiente:

(1)  = P(Rechazar H0 H0 cierta)

Falk (1986) señala la confusión corrientemente encontrada entre los investigadores que consiste en intercambiar los sucesos condición y condicionado en la definición anterior, esto es,interpretar el nivel de significación en la forma siguiente:

(2)  = P(H0 cierta  se ha rechazado H0)

Sugiere como posible causa de este error el lenguaje empleado en la definición del nivel de significación, esto es la “probabilidad de error Tipo I”. En esta expresión no se indica explícitamente que estamos tratando con una probabilidad condicional, lo que lleva al estudiante a suponer que es posible definir un “suceso condicional”. En consecuencia, no se diferencia entre las dos probabilidades condicionales (1) y (2).

La definición correcta vendría dada por el siguiente enunciado:

i) Un nivel de significación del 5% supone que, en promedio, 5 de cada 100 veces que la hipótesis nula es cierta, la rechazaremos.

La investigación de Birnbaum (1982) y otros autores muestra que algunos estudiantes consideran correcta la siguiente definición (incorrecta) de :

ii) Un nivel de significación del 5% implica que, en promedio, 5 de cada 100 veces que rechacemos la hipótesis nula, estaremos equivocados.

Las definiciones i) y ii) fueron propuestas por Vallecillos (1991) a estudiantes de universidad, a los que se preguntó para cada una de ellas si era cierta o falsa, analizando el razonamiento de los estudiantes. Vallecillos analizó también el concepto de nivel de significación y su relación con el resto de conceptos que intervienen en un contraste de hipótesis. Distinguió cuatro aspectos diferenciados para la comprensión de este concepto e identifica errores relacionados con cada uno de estos aspectos:

a) El contraste de hipótesis como problema de decisión: El contraste de hipótesis es un problema de decisión entre dos hipótesis complementarias y excluyentes, con la posible consecuencia de cometer dos tipos de error, incompatibles pero no complementarios. Respecto a este apartado, algunos alumnos interpretan los errores tipo I y II como sucesos complementarios, por lo que la probabilidad de cometer alguno de los errores sería 1.



b)Las probabilidades de error y relación entre las mismas: Los dos tipos de error tienen probabilidades  (Tipo I) y  (Tipo II). Es necesario la comprensión de las probabilidades condicionales que intervienen en la definición de  y , de la dependencia de  como función del parámetro desconocido y de las relaciones entre  y . Aparte del error señalado por Falk (1986) del cambio en los condicionales se han encontrado otras interpretaciones erróneas de la probabilidad condicional que define el nivel de significación: suprimir la condición en la probabilidad condicionada que se emplea para definir ; interpretar a como probabilidad de error (tanto tipo I como tipo II) en la decisión tomada.


Compartir con tus amigos:
1   2   3


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

enter | registro
    Página principal


subir archivos