Análisis de datos en psicologíA 1


Las variables: clasificación y notación



Descargar 138 Kb.
Página2/4
Fecha de conversión10.12.2017
Tamaño138 Kb.
1   2   3   4



1.3.1 Las variables: clasificación y notación


  • Una variable es una representación numérica de una característica.




Ejemplo

Tipo de estudio

Variables

Tipo de escala

1

Descriptivo

Grado de patrón A

Intervalo

2

Inferencial

Grupo, Nivel cultural, Inteligencia, estrés.

Nominal, Ordinal, Intervalo, Intervalo

3

Inferencial

Tiempo de reacción

Razón

4

Inferencial

Intención de voto

Nominal


Estadística descriptiva con una variable





  1. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS




    1. Distribución de frecuencias

La distribución de frecuencias es un instrumento diseñado para cumplir tres funciones:




  • Proporcionar una reorganización y ordenación racional de los datos recogidos.

  • Ofrecer la información necesaria para hacer representaciones gráficas

  • Facilitar los cálculos necesarios para obtener los estadísticos muestrales


  • Se llama frecuencia absoluta de un valor Xi, y se simboliza por ni, al número de veces que se repite el valor Xi, en la muestra.




  • Se llama frecuencia relativa de un valor Xi, y se simboliza por pi, al cociente entre la frecuencia absoluta de ese valor y el tamaño de la muestra. Es decir: pi = ni / n




  • Se llama frecuencia absoluta acumulada de un valor Xi, y se simboliza por na, al número de veces que se repite en la muestra ese valor Xi, o cualquier otro valor inferior.




  • Se llama frecuencia relativa acumulada de un valor Xi, y se simboliza por pa, al cociente entre su frecuencia absoluta acumulada y el tamaño de la muestra. Es decir: pa = na / n.

Las frecuencias relativas, se expresan en términos porcentuales. Suelen representarse con mayúsculas, para obtenerlas basta con multiplicar por 100 las frecuencias relativas. Para cualquier valor de la variable, Xi tenemos que:


Pi = pi · 100 y Pa = pa · 100
Una distribución de frecuencias se organiza en forma de tabla. En una distribución de frecuencias completa aparece, una columna con los valores que adopta la variable, creciendo de abajo hacia arriba.
Construimos la distribución de frecuencias siguiendo los pasos descritos:


  1. Ponemos en la primera columna esos valores, creciendo de abajo hacia arriba

  2. Para la columna de frecuencias absolutas contamos el número de veces que se repite cada valor, si el número de valores es muy grande conviene ir haciendo marcas por cada valor, para contarlas al final

  3. Para la columna de frecuencias relativas dividimos cada frecuencia absoluta por n

  4. Para obtener las frecuencias absolutas acumuladas sumamos para cada valor su frecuencia absoluta más la absoluta acumulada del valor anterior.

  5. Para las frecuencias relativas acumuladas dividimos cada frecuencia absoluta acumulada por n. La frecuencia relativa acumulada del valor mayor debe ser igual a 1.

Distribución de frecuencias construida sobre el ejemplo del número de hijos (texto)




Xi

ni

pi

na

pa

4

1

0.05

20

1.00

3

3

0.15

19

0.95

2

7

0.35

16

0.80

1

6

0.30

9

0.45

0

3

0.15

3

0.15




20

1.00







Agrupación en intervalos: consisten en formar grupos de valores consecutivos, llamados intervalos, y poner uno de estos grupos en cada fila, en lugar de poner cada valor individual por separado. Cada uno de estos grupos suele indicarse en la distribución de frecuencias poniendo los valores mayor y menos incluidos en él.


A continuación se calculan las frecuencias absolutas conjuntas de los valores incluidos en el intervalo, haciendo lo mismo después con las frecuencias relativas, las absolutas acumuladas y las relativas acumuladas.


  • Se llama intervalo a cada uno de los grupos de valores que ocupan una fila en una distribución de frecuencias. En algunos textos se llaman clases.




  • Se llaman límites aparentes o informados de un intervalo a los valores mayor y menor que puede adoptar la variable dentro de ese intervalo, según el instrumento de medida utilizado.




  • Se llaman límites exactos de un intervalo a los valores máximo y mínimo incluidos en el intervalo y que podrían medirse si se contara con un instrumento de precisión perfecta.




  • Se llama punto medio de un intervalo a la suma de sus límites exactos partido por dos. En algunos libros se llama marca de clase.




  • Se llama amplitud de un intervalo a la diferencia entre su límite exacto superior y su límite exacto inferior. Suele representarse por la letra I.

Para hacer una distribución de frecuencias:




  1. El intervalo superior debe incluir al mayor valor observado.

  2. el intervalo inferior debe incluir al menor valor observado.

  3. Cada intervalo debe incluir el mismo número de valores.

Dado que el objetivo de una distribución de frecuencias es conseguir una ordenación manejable que ayude a comprender el significado de los datos, no es conveniente que el número de intervalos sea demasiado grande.


Como consecuencia de lo anterior, podemos sentirnos inclinados a reducir al máximo el número de intervalos, pero lo cierto es que esto traería consigo una consecuencia negativa, los intervalos tendrían una excesiva amplitud y acabaríamos teniendo a sujetos con puntuaciones muy distintas en el mismo intervalo.
El número apropiado de intervalos debe ser tal que, con ella se consiga una agrupación operativa y que cumpla los objetivos para los que ha sido diseñada la distribución de frecuencias, pero sin distorsionar excesivamente los valores con el error de agrupamiento.
A veces hay casos en los que hacer un número de intervalos siguiendo las directrices que acabamos de plantear distorsionarían demasiado los datos.
Para evitar eso se utilizan lo que se denomina intervalos abiertos, en los cuales no se pone el límite inferior del intervalo que incluye los valores menores, el límite superior del intervalo que incluye los valores mayores o no se pone ninguno de estos dos. Ej. + de ....
Problema de los bordes
Supongamos que vamos a construir una agrupación en intervalos, siendo los valores mayor y menor observados iguales a 79 y 43, respectivamente. Como el número de valores distintos sería igual a 37, que es un número primo, no pueden hacerse intervalos de amplitud constante tales que el mayor tenga al 79 como límite aparente superior y al 43 como límite aparente inferior. En estos casos suele añadirse al listado de valores distintos observados algunos otros valores no observados en la muestra.
Estos valores tendrán frecuencias absolutas iguales a cero, pero nos permitirán conseguir un número de valores distinto que sea múltiplo del número de intervalos que queremos hacer.
Para no distorsionar demasiado ninguno de los intervalos extremos es preferible repartirlos lo más homogéneamente posible entre los dos.


      1. Supuestos de distribución intraintervalo

Una vez confeccionada una distribución de frecuencias con datos agrupados en intervalos, ésta se puede utilizar para hacer representaciones gráficas y para facilitar los cálculos de estadísticos que iremos explicando.


Dado que de cada puntuación sólo sabemos el intervalo al que pertenece, un procedimiento que a veces resultará útil consiste en asumir el supuesto de concentración en el punto medio. Según este supuesto, trataríamos a esos dos datos como si fueran dos valores iguales. Entonces este es el punto medio de su intervalo.
El supuesto de distribución homogénea, los valores incluidos en un intervalo se reparte con absoluta conformidad en su interior, si en un intervalo hay cinco observaciones, aceptaremos que sus valores son los que tendríamos si partiéramos al intervalo en cinco subintervalos de igual amplitud y asignáramos a cada individuo el punto medio de un subintervalo.


    1. Representaciones gráficas

A partir de las distribuciones de frecuencias se pueden construir representaciones gráficas. La función de éstas es dar informaciones globales mediante un solo golpe de vista.




      1. Representaciones gráficas de uso frecuente




  • Diagrama de rectángulos: Para hacer un diagrama de rectángulos se colocan en el eje de abscisas las modalidades (o los números que las representan) y en el eje de ordenadas las frecuencias. Sobre cada modalidad se levanta un rectángulo cuya altura es la frecuencia correspondiente. Este tipo de representaciones se suele utilizar para variables nominales, pero también se utiliza para variables ordinales, como el nivel cultural.




  • Perfil ortogonal: Se utiliza mucho en informes psicopedagógicos o de rendimiento. Calificaciones obtenidas por un alumno a lo largo de 4 exámenes.




  • Pictograma: Son representaciones en forma de círculos en las que éstos son divididos en secciones cuya superficie es proporcional a la frecuencia de la modalidad correspondiente.




  • Diagrama de barras: Se utiliza para variables cuantitativas discretas. En el eje de abscisas se colocan los distintos valores de la variable y en el eje de ordenadas las frecuencias. Sobre cada valor de la variable se traza una línea o barra perpendicular cuya altura debe ser igual a la frecuencia.




  • Histograma: Se utiliza para variables cuantitativas continuas con datos agrupados en intervalos. En el eje de abscisas se colocan los límites exactos de los intervalos, y en el eje de ordenadas las frecuencias.




  • Polígono de frecuencias: Para variables discretas, el polígono de frecuencias es la figura que resulta de unir los extremos superiores de las que hubieran sido las barras. Si se trata de las bases superiores de los rectángulos correspondientes a un hipotético histograma construido con esos mismos datos.




  • Diagrama de barras acumulativo: Se utiliza en variables discretas. En el eje de abscisas se colocan los valores de la variable, y en el de ordenadas las frecuencias acumuladas, ya sean absolutas o relativas. Sobre cada valor se traza una perpendicular cuya longitud sea igual a la frecuencia acumulada. Desde el extremo superior de cada una de estas barras se traza una línea horizontal que se une con la barra situada a su derecha.




  • Polígono de frecuencias acumuladas: Se utilizan en variables continuas. El eje de abscisas se construye igual que en los histogramas, pero en el de ordenadas se incluyen las frecuencias acumuladas, ya sean absolutas o relativas. Sobre cada límite se levanta una perpendicular cuya longitud sea idéntica a la frecuencia acumulada y se unen los extremos superiores de dichas perpendiculares.




      1. Convenciones sobre las representaciones gráficas




  1. En el eje de abscisas colocamos los valores de la variable, y en el de ordenadas las frecuencias (absolutas o relativas, simples o acumuladas).




  1. La intersección de los dos ejes es el origen , de modo que en el eje de abscisas las puntuaciones más bajas estarán a la izquierda, y las más altas a la derecha; en el de ordenadas los valores los valores pequeños estarán abajo y los altos arriba.




  1. Si el valor mínimo del eje de abscisas fuera excesivamente grande, se debe cortar la línea




  1. Conviene incluir en cada gráfico toda la información posible para evitar ambigüedades y facilitar su interpretación por otras personas o por nosotros mismos al cabo del tiempo.




  1. Cuando un mismo gráfico se representan dos o más grupos simultáneamente y éstos son de tamaños considerablemente distintos se deben utilizar frecuencias relativas.

Las representaciones sirven para comunicar información de un solo golpe de vista, y por ello en su construcción debe tenerse en cuenta el público al que va dirigida, sus necesidades de informaciones más bien globales y generales o específicas y precisas, y cualquier otra consideración que pueda mejorar la transmisión de información ágil y precisa.




      1. Tendenciosidad en las representaciones gráficas

Un primer método consiste en recortar el eje de ordenadas, eliminando los menores valores de frecuencias con la excusa de que no hay ninguna observación que las adopte. Esto tiene como consecuencia que pequeñas diferencias parezcan mayores.


Un segundo tipo de distorsión se produce cuando se utilizan figuras representativas de aquello que se está midiendo. Suelen hacerse proporcionando sus alturas a las frecuencias correspondientes, el incremento en la altura conlleva también un incremento en la anchura. Como consecuencia de ello, la superficie de las figuras no guarda relación con las frecuencias observadas, dando la impresión de que la diferencia es mayor que la realmente registrada.


      1. Propiedades de las distribuciones de frecuencias

Los polígonos de frecuencias dependen demasiado de la unidad de medida utilizada, de la agrupación en intervalos hecha y de las fluctuaciones particulares esperables en una muestra concreta. Las curvas suavizadas suelen ser representaciones más apropiadas que los polígonos de frecuencias simples. Son cuatro las propiedades con las que describiremos las distribuciones de frecuencias:




  1. Tendencia central: Una primera propiedad es la que se refiere a la magnitud general de las observaciones hechas. Esta magnitud general puede cuantificarse mediante unos índices conocidos como índices de tendencia central o promedios, y que reciben ese nombre porque pretenden ser síntesis de los valores de la variable.




  1. Variabilidad: Grado de concentración de las observaciones en torno al promedio. Una distribución de frecuencias será homogéneo o poco variable si los datos difieren poco entre sí, y por tanto, se agolpan en torno a su promedio. Sería heterogénea o muy variable si los datos se dispersan mucho con respecto al promedio.




  1. Asimetría o sesgo: Esta propiedad se refiere al grado en que los datos tienden a concentrarse en los valores centrales, en los valores inferiores al promedio, o en los valores supriores a éste. Existe simetría perfecta cuando en caso de doblar la representación gráfica por una vertical trazada sobre la media, las dos mitades se superponen perfectamente. Las distribuciones con asimetría negativa son propias de las pruebas, tareas o tests fáciles, en las que la mayoría de los sujetos puntúan alto. Las distribuciones asimétricas positivas son típicas de pruebas, tareas o tests difíciles en las que la mayoría de los sujetos puntúan bajo.




  1. Curtosi: Se refiere al grado de apuntamiento de la distribución de frecuencias. Si es muy apuntada se llama leptocúrtica y si es muy aplastada, se llama platicúrtica.



    1. Diagrama de tallo y hojas

Las distribuciones de frecuencias no son el único medio para resumir y exponer conjuntos de datos; una alternativa a ellas son los llamados diagramas de tallo y hojas.


Su obtención requiere separar cada puntuación en dos partes. El primer o primeros dígitos, que reciben el nombre de tallo, y el dígito o dígitos restantes, que reciben el nombre de hojas; por ejemplo, X = 56 se puede separar en 5 (tallo) y 6 hoja. Estos diagramas tienen la suficiente flexibilidad como para admitir otras posibilidades.


  1. Se identifican los valores máximo y mínimo observados.

  2. Se toma una decisión acerca del número más apropiado de tallos distintos.

  3. Se listan todos los tallos distintos en una columna, ordenados de forma creciente de arriba abajo.

  4. Se escribe cada hoja junto al tallo que le corresponda, preferiblemente ordenados según su valor.

En general, un número de tallos superior a cinco y que no pase de 20 suele ser apropiado. Aparte de ser más fácil de construir, el diagrama de tallo y hojas tiene varias ventajas sobre la distribución de frecuencias, y también algún inconveniente:




  1. Ventaja: permite identificar cada puntuación individual. En las distribuciones tradicionales sólo conocemos la frecuencia del intervalo y nos obliga a tratar los datos de ciertas maneras distorsionantes. La ventaja de retener cada valor individual viene acompañada del inconveniente de que le diagrama de tallo y hojas no facilita, como la distribución de frecuencias clásica, el cálculo de los estadísticos que estudiaremos más adelante.




  1. Ofrece simultáneamente tanto un listado de las puntuaciones como un dibujo de distribución, si tumbamos el diagrama obtenemos una especie de histograma.




  1. Al contener los valores de cada observación, es más fácil de modificar para obtener un dibujo con un nivel de detalle distinto, mayor o menor, de la distribución.




  1. Pueden presentarse dos conjuntos de datos simultáneamente en el mismo diagrama, con lo que se facilita la comparación.





  1. Compartir con tus amigos:
1   2   3   4


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

    Página principal
Universidad nacional
Curriculum vitae
derechos humanos
ciencias sociales
salud mental
buenos aires
datos personales
Datos personales
psicoan lisis
distrito federal
Psicoan lisis
plata facultad
Proyecto educativo
psicol gicos
Corte interamericana
violencia familiar
psicol gicas
letras departamento
caracter sticas
consejo directivo
vitae datos
recursos humanos
general universitario
Programa nacional
diagn stico
educativo institucional
Datos generales
Escuela superior
trabajo social
Diagn stico
poblaciones vulnerables
datos generales
Pontificia universidad
nacional contra
Corte suprema
Universidad autonoma
salvador facultad
culum vitae
Caracter sticas
Amparo directo
Instituto superior
curriculum vitae
Reglamento interno
polit cnica
ciencias humanas
guayaquil facultad
desarrollo humano
desarrollo integral
redes sociales
personales nombre
aires facultad