Análisis de datos en psicologíA 1



Descargar 138 Kb.
Página4/4
Fecha de conversión10.12.2017
Tamaño138 Kb.
1   2   3   4

MEDIDAS DE VARIACIÓN





    1. Medidas de variación




      1. Varianza y desviación típica

Una idea que se ha demostrado útil a la hora de cuantificar la variabilidad es la de trabajar con las distancias desde los valores hasta algún poste centra, que podría ser la media aritmética y basar la medición de la dispersión en algún tipo de “separación promedio” hasta ese poste


Una solución al problema de que las distancias con respecto a la media sumen cero consiste en elevar al cuadrado esas distancias antes de hallar su promedio, dado que los cuadrados son siempre positivos. El índice basado en esta idea se llama varianza y se representa por la expresión S2x, donde el subíndice recoge la letra con la que se representa la variable. Al cálculo del promedio de las desviaciones cuadráticas con respecto a la media:
S2x =  ( X - X )2

n
S2x =  x2

n
La cuestión que puede surgir es la de cómo valorar el grado de dispersión cuantificado mediante este índice. En realidad no tiene mucho sentido hablar de niveles altos o bajos de dispersión en términos absolutos, sino, en todo caso, en términos comparativos.
La varianza sirve sobre todo para comparar el grado de dispersión de dos o más conjuntos de valores en una misma variable, llegando a conclusiones como la siguiente: “La población de hombres presenta una mayor variabilidad en su estatura que la población de mujeres, que son más homogéneas en esa característica”
El valor 27,2 no parece un número claramente relacionado con lo que se pretendía medir. Las mayores distancias que presentan esos valores con respecto a la media son de 8 puntos y parece que una representación numérica de la magnitud general de esas distancias estaría bastante alejada de 27,2. La razón de esta discrepancia es que las distancias no se han tratado como tales, sino que para evitar el problema de que las diferenciales sumen cero se han elevado éstas al cuadrado. Por ello es frecuente que, con objeto de retornar las unidades originales de esas distancias, se calcule la raíz cuadrada de la cantidad obtenida. Al índice así hallado se le llama desviación típica, se representa por Sx y se define sencillamente como la raíz cuadrada de la varianza:

Sx =   ( Xi - X)2

n
La desviación típica es un mejor descriptor de la variabilidad, aunque la varianza tenga algunas notables propiedades que la hacen idónea para basar en ella los análisis estadísticos complejos.
La variabilidad de los datos está reflejando el hecho incuestionable de las diferencias individuales y éstas son uno de los objetos de estudio primordiales de la psicología.
Cuasivarianza: dividiendo por n – 1, representamos por S’2x

n · S2x = (n – 1) · S’2x





      1. Cálculo y propiedades de la varianza




  • La varianza y la desviación típica como medidas de dispersión, son valores esencialmente positivos.







  • Si multiplicamos por una constante a un conjunto de puntuaciones, la varianza quedará multiplicada por el cuadrado de la constante, y la desviación típica por el valor absoluto de esa constante.




  • La varianza total de un grupo de puntuaciones, cuando se conocen los tamaños (ni), las medidas (Xi) y las varianzas (S2i) de varios subgrupos hechos a partir del grupo total, mutuamente exclusivos y exhaustivos, puede obtenerse sumando la media (ponderada) de las varianzas y la varianza (ponderada) de las medias:

S2T =  ni · S2i +  ni (Xi - XT)2

 ni  ni



  • La desigualdad de Tchebychev recoge el hecho de que las distancias menores hasta la media son más frecuentes que las distancias mayores. Así, entre las puntuaciones correspondientes a la media +- una desviación típica se encontrarán menos observaciones que entre las puntuaciones correspondientes a la media +- una dos desviaciones típicas. Según la desigualdad de Tchebychev, el porcentaje de puntuaciones que quedan entre las correspondientes a la media +- k desviaciones típicas es, como mínimo, el:

( 1 – 1 por 100 de las observaciones

k2


      1. Otras medidas de variación

Una forma muy sencilla de indicar el grado de dispersión consiste en calcular la distancia entre el mayor y el menor de los valores observados. Este índice se llama amplitud total, rango o recorrido, y se obtiene sencillamente hallando la diferencia entre los valores extremos:


AT = Xmáx – Xmin
La principal desventaja de este índice es que es muy sensible a los valores extremos, y nada sensible a los intermedios, pudiendo carecer de toda representatividad.
Otro inconveniente de este índice es que está ligado al tamaño de la muestra utilizada, Si se quiere comparar la variabilidad de la dispersión de dos conjuntos de datos de tamaño marcadamente distinto, es probable que la muestra de mayor tamaño presente una mayor amplitud aunque las poblaciones de referencia tengan la misma variabilidad.

Desviación media: tomar las desviaciones con respecto a la media, o puntuaciones diferenciales, en valor absoluto. Se representa por sus iniciales (DM):

DM o ST =  Xi - X

n
La desviación media representa un promedio de distancias tomadas en valor absoluto y representa bien el concepto de dispersión y su cuantificación, aunque no es muy utilizado en psicología debido a la dificultad que supone el trabajo con valores absolutos, y que hace que no haya muchas técnicas de análisis estadístico basadas en ella.


Cuando en las puntuaciones hay algún valor extremo que pudiera distorsionar la representatividad de la varianza se puede utilizar otro índice, basado sólo en las puntuaciones correspondientes a los cuartiles primero y tercero. Se denomina amplitud semi – intercuartil, se representa por la letra Q
Q = Q3 – Q1

2
Esta medida de variabilidad elimina del cómputo las puntuaciones extremas que no le afectan.


Coeficiente de variación: Comparar la variabilidad de grupos cuya media es claramente distinta, relativizar la desviación típica con respecto a la media, expresado como un porcentaje, se representa por CV
CV = Sx · 100

X
Cuanto mayor es el coeficiente de variación, menos representativa es la media.




    1. Representación gráfica de la variabilidad

Box and whiuskers, que significa literalmente caja y bigotes. Para su construcción se marcan señales de tal forma que las distancias entre ellas sean proporcionales a las distancias entre la puntuación máxima y mínima y los 3 cuartiles. Con los 3 cuartiles se forma una especie de ficha de dominó, mientras que las puntuaciones máxima y mínima se unen mediante líneas rectas a los bordes de esta forma geométrica. Se puede comparar la variabilidad de dos distribuciones haciendo representaciones paralelas de caja y bigotes.


En otros casos se quiere representar la evolución de los valores medios, se pueden unir mediante un trazo los puntos correspondientes y añadir unos bigotes verticales que indiquen los valores correspondientes a una desviación típica.

  1. PUNTUACIONES TÍPICAS Y ESCALAS DERIVADAS



6.1 Puntuaciones típicas
Puntuación diferencial  la distancia o diferencia, entre esa puntuación y la media del grupo de puntuaciones.
Las puntuaciones diferenciales son más informativas e interesantes que las directas, pues al menos nos indican si la puntuación es superior o inferior a la media o si coincide con ella. Esta información es insuficiente para comparar puntuaciones de sujetos pertenecientes a distintos grupos o a distintas variables.
Variabilidad del grupo de referencia: se trataría de indicar cómo de grande es una distancia en términos de las distancias observadas en general en esas puntuaciones. Esa distancia general es la desviación típica. Las puntuaciones así conseguidas se denominan, puntuaciones típicas, se representan por letras z minúsculas y su fórmula es:
zi = Xi - X

Sx


Es idéntica al cociente entre la puntuación diferencial y la desviación típica:
zi = xi

Sx


Al proceso de obtención de las puntuaciones típicas se le llama tipificación. La definición de las puntuaciones típicas puede basarse en esta idea y expresarse como sigue:


  • La puntuación típica de una observación indica el número de desviaciones típicas que esa observación se separa de la media del grupo de observaciones.

Las puntuaciones típicas permiten hacer comparaciones entre unidades de distintos grupos, entre variables medidas de distintas formas o incluso entre variables diferentes. Siempre nos indican el número de desviaciones típicas que se separan de la media y si esa desviación es por encima o por debajo de la media.


Las típicas no son más que una transformación lineal que consiste en multiplicar las directas por una constante (el inverso de la desviación típica) y luego sumar a esos productos otra constante (el cociente entre la media y la desviación típica, con signo negativo)

Zi = Xi - X = 1 . Xi + - X

Sx Sx Sx

Estas características de las puntuaciones típicas son universales, no dependen del tipo de puntuaciones, ni de su dispersión, ni de su número.




  • La media de las puntuaciones típicas es cero, mientras que su varianza y desviación típica son iguales a uno.

Las puntuaciones típicas reflejan las relaciones esenciales entre las puntuaciones con independencia de la unidad de medida que se haya utilizado en la medición.


6.2 Escalas derivadas
Inconveniente  La medida de las típicas es cero y su desviación típica uno, buena parte de las puntuaciones suelen ser negativas y casi todas decimales.
Un procedimiento consiste en transformar las puntuaciones típicas en otras que retengan todas las relaciones que manifiestan las puntuaciones originales, que sean puntuaciones equivalentes pero evitando la dificultad operativa y que constituyen lo que se denomina una escala derivada.
Las puntuaciones transformadas tienen como media y desviación típica las constantes utilizadas para la transformación, podemos conseguir que las puntuaciones en una escala derivada tengan las características que nos resulten más cómodas, sencillamente haciendo la transformación con las constantes que deseamos como media y desviación típica.


  • Si transformamos linealmente las puntuaciones típicas, multiplicándolas por una constante a, y sumando una constante b, entonces las puntuaciones transformadas tendrán como media la constante sumada, b, como desviación típica el valor absoluto de la constante multiplicada (a) y como varianza el cuadrado de esta constante, a2

La construcción de una escala derivada parte de unas puntuaciones directas, éstas se tipifican y después se transforman linealmente en otras puntuaciones.


Esquema de la transformación en una escala derivada:


Puntuaciones directas (Xi)


Media: X

Varianza: S2x



Puntuaciones típicas (zi)
Media: 0

Varianza: 1



Puntuaciones transformadas (Ti)
Media: b

Varianza: a2


Tipificación

Transformación en escala derivada:

Ti = a . zi + b


La cuestión fundamental de las escalas derivadas consiste en transformar las puntuaciones originales, Xi, en otras puntuaciones transformadas, Ti, tales que sean más cómodas de tratar e interpretar, pero que a la vez retengan las relaciones esenciales entre los valores, que sean puntuaciones equivalentes.


Cualquier transformación lineal en la que la constante multiplicadora sea positiva da lugar a unas puntuaciones equivalentes.

  1. MEDIDAS DE ASIMETRÍA Y CURTOSI





    1. Índices de asimetría

El grado de asimetría de una distribución hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central. Hay diferentes índices con los que cuantificar esta propiedad:


El primero de ellos se basa en la relación entre la media y la moda, y se define como la distancia entre la media y la moda, medida en desviaciones típicas.


La media es inferior a la moda, y por tanto este índice dará un valor negativo, mientras que en la figura c la media es superior y el índice dará positivo. En la distribución de la figura b coinciden los dos índices de tendencia central, y por tanto el índice de asimetría dará cero.


Las distribuciones del tipo de la figura a se dice que tienen asimetría negativa y el índice da valores menores que cero. Las del tipo de la figura c se dice que tienen asimetría positiva y este índice da valores mayores que cero. Las del tipo de la figura b se dice que son distribuciones simétricas, puesto que no están inclinadas hacia ningún lado; este índice da en ellas valores en torno a cero y si la simetría es perfecta entonces da exactamente cero. Este índice tiene la dificultad de que sólo se puede calcular en distribuciones unimodales.
Índice de asimetría de Pearson, es igual al promedio de las puntuaciones típicas elevadas al cubo:
As = (z3) =  ( Xi - X)3/ Sx3 = 1 .  (Xi - X)3

n n. S3x


Los valores menores que cero indican asimetría negativa, los mayores de cero asimetría positiva y los valores en torno a cero indican distribuciones aproximadamente simétricas. Es el índice de asimetría más utilizado.
El índice de asimetría intercuartílico se basa, en los cuartiles. Su fórmula es:
As = (Q3 – Q2) – (Q2 – Q1)

Q3 – Q1


Los valores mayores de cero indican asimetría positiva, los menores indican asimetría negativa y los valores en torno a cero reflejan distribuciones aproximadamente simétricas. Tiene una ventaja sobre los índices anteriores y es que tiene un valor máximo y mínimo con lo que se facilita su interpretación en términos relativos.


    1. Índice de curtosis

Sólo vamos a estudiar el que se basa en el promedio de las típicas elevadas a la cuarta potencia. Su fórmula es:


Cr = (z4) =  (Xi - X)4 / S4x - 3 = 1 . .  (Xi - X)4 - 3



n n. S4x
Al restar un tres al índice lo que se consigue es utilizar ese modelo como patrón de comparación. Una distribución en la que el índice sea igual a cero tiene un grado de curtosis similar al de la distribución normal y, siguiendo la terminología propuesta por Pearson, se dice que es mesocúrtica, mientras que si es positivo su grado de apuntamiento es mayor que el de la distribución normal y se dice que es una distribución leptocúrtica y si es negativo su apuntamiento es menor que el de la distribución normal y se dice que es platicúrtica.






Compartir con tus amigos:
1   2   3   4


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

    Página principal
Universidad nacional
Curriculum vitae
derechos humanos
ciencias sociales
salud mental
buenos aires
datos personales
Datos personales
psicoan lisis
distrito federal
Psicoan lisis
plata facultad
Proyecto educativo
psicol gicos
Corte interamericana
violencia familiar
psicol gicas
letras departamento
caracter sticas
consejo directivo
vitae datos
recursos humanos
general universitario
Programa nacional
diagn stico
educativo institucional
Datos generales
Escuela superior
trabajo social
Diagn stico
poblaciones vulnerables
datos generales
Pontificia universidad
nacional contra
Corte suprema
Universidad autonoma
salvador facultad
culum vitae
Caracter sticas
Amparo directo
Instituto superior
curriculum vitae
Reglamento interno
polit cnica
ciencias humanas
guayaquil facultad
desarrollo humano
desarrollo integral
redes sociales
personales nombre
aires facultad