Brebe tratado de


Otros métodos para la prueba de hipótesis nulas



Descargar 1.13 Mb.
Página22/24
Fecha de conversión10.12.2017
Tamaño1.13 Mb.
1   ...   16   17   18   19   20   21   22   23   24
5.21 Otros métodos para la prueba de hipótesis nulas

 El método del valor P y el método de intervalos de confianza son alternativas al método del valor crítico para las pruebas de hipótesis referidas en las secciones anteriores de este capítulo.

 Si se aplica el método del valor P, en lugar de comparar el valor observado de una estadística de prueba con un valor crítico, la probabilidad de ocurrencia de la estadística de prueba, dado que la hipótesis nula es cierta, se determina y compara con el nivel de significancia a. La hipótesis nula se rechaza si el valor P es menor que la a asignada. Los problemas anteriores ilustran la aplicación de este método a pruebas de dos colas y una cola, respectivamente, sobre la diferencia entre medias.

 Si se aplica el método de intervalos de confianza, se elabora el intervalo de confianza 1 - a para el valor paramétrico de interés. Si el valor hipotético del parámetro no está incluido en el intervalo, la hipótesis nula se rechaza. Los problemas 11. 15 y 11. 16 ilustran la aplicación de este método a pruebas de dos colas y una cola, respectivamente, sobre la diferencia entre medias.

 

6. Estadística no paramétrica

 6.1 Escalas de medición

 Antes de considerar las diferencias entre los métodos estadísticos no paramétricos y los procedimientos paramétricos que constituyen la mayor parte de este libro conviene definir cuatro tipos de escalas de medición en términos de la precisión representada por los vllores reportados.

 En la escala nominal, los números sólo se usan para identificar categorías. No representan ningún monto o cantidad propiamente dichos.

 Ejemplo.  Si cuatro regiones de ventas se numeran del 1 al 4 únicamente como números de identificación general, en ello está implicada la escala nominal, puesto que los números sirven sencillamente como nombres de categorías.

 En la escala ordinal, los números representan rangos o jerarquías. Indican magnitud relativa, aunque las diferencias entre los rangos no se asumen como iguales.

 Ejemplo.  Un analista de inversión clasifica cinco emisiones accionarias del 1 al 5 en términos de potencial de apreciación. La diferencia en el potencial de apreciación entre las emisiones clasificadas como 1 y 2 no sería generalmente la misma que, digamos, la diferencia entre las emisiones clasificadas como 3 y 4.

 En la escala de intervalo se representan medidas que son diferencias entre valores. Sin embargo, el punto cero es arbitrario, y no se trata de un cero "absoluto". Por lo tanto, los números no pueden compararse usando razones.

 Ejemplo.  En las escalas de temperatura ya sea Fahrenheit o Celsius, una diferencia de 5o de 70oF a 75oF por ejemplo, es el mismo monto de diferencia en temperatura de 80oF a 85oF Sin embargo, no podemos decir que 60oF sea dos veces más caliente que 30oF, porque el punto 0oF no es un punto cero absoluto (ausencia absoluta de calor).

 En la escala de razón sí existe un punto cero real, y en consecuencia las medidas pueden compararse en forma de razones.

 Ejemplo.  Además de ser cierto que una diferencia en valor de inventario de $5 000 es el mismo monto de diferencia entre, por decir algo, $50 000 y $55 000 o entre $60 000 y $65 000, también lo es que un valor de inventario de $100 000 es dos veces más grande que un valor de inventario de $50 000.

 6.2 Métodos estadísticos paramétricos contra no paramétricos

 La mayoría de los métodos estadísticos descritos en este libro se llaman métodos paramétricos. El punto focal del análisis paramétrico es algún parámetro de la población en relación con el cual la estadística de muestreo sigue una distribución conocida, con medidas tomadas en la escala de intervalo o razón. Cuando no se cumplen uno o más de estos requisitos o supuestos, pueden usarse los así llamados métodos no paramétricos. A estos métodos se les conoce también como métodos libres de distribución, con lo que se enfatiza en particular el hecho de que no se conoce la distribución de la estadística de muestreo.

 Si el uso de una prueba paramétrica, como la prueba t, está garantizado, siempre es preferible recurrir a él que al uso del equivalente no paramétrico. Esto se debe a que si aplicáramos el mismo nivel de significancia en ambas pruebas, la potencia asociada con la prueba no paramétrica se revelaría siempre inferior a la del equivalente paramétrico. Las pruebas no paramétricas suelen emplearse en conjunto con muestras pequeñas respecto de las cuales es imposible apelar al teorema central del límite.

 Las pruebas no paramétricas pueden dirigirse a hipótesis referentes a laforma, dispersión oposición (mediana) de la población. En la mayoría de las aplicaciones, las hipótesis aluden al valor de una mediana, la diferencia entre dos medianas o la diferencia entre varias medianas. Esto contrasta con los procedimientos paramétricos, centrados principalmente en medias poblacionales.

 De las pruebas estadísticas ya descritas en este libro, la prueba ji cuadrada es una prueba no paramétrica. Recuérdese, por ejemplo, que los datos que se analizan corresponden a la escala nominal (datos categóricos). Dedicamos un capítulo específico a la prueba ji cuadrada a causa de la amplia difusión de su uso y de la variedad de sus aplicaciones.

 6.3 Prueba de corridas para aleatoriedad

 Una corrida es una serie de observaciones similares. La prueba de corridas se usa para probar la aleatoriedad de una serie de observaciones cuando cada observación puede ser asignada a una de dos categorías.

 Ejemplo.  En relación con una muestra aleatoria de n = 10 individuos, supongamos que cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F, F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.

 Respecto de datos numéricos, un medio para obtener el esquema requerido de dos categorías es clasificar cada observación según si es superior o inferior a la mediana del grupo. En general, mucho menos corridas o mucho más corridas que las que sería de esperar al azar resultarían en el rechazo de la hipótesis nula de que la secuencia de observaciones es una secuencia aleatoria.



 El número de corridas de elementos semejantes se determina de acuerdo con los datos muestrales, con el uso del símbolo R para designar el número de corridas observadas. Si n1 equivale al número de elementos muestreados de un tipo y n2 al número de elementos muestreados del segundo tipo, la media y el error estándar asociados con la distribución de muestreo de la estadística de prueba R cuando la secuencia es aleatoria son

Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal. Por lo tanto, en estas circunstancias la estadística R puede convertirse a la estadística de prueba z de la siguiente manera:



 Cuando n1  20 y n2  20, en libros de texto especializados en estadística no paramétrica se dispone de tablas de valores críticos de la estadística de prueba R.

 6.4 Una muestra: Prueba de los signos

 La prueba de los signos puede utilizarse para probar una hipótesis nula referente al valor de la mediana de la población. En consecuencia, es el equivalente no paramétrico a la prueba de una hipótesis referente al valor de la media de la población. Es necesario que los valores de la muestra aleatoria se encuentren al menos en la escala ordinal, aunque no se requiere de supuestos acerca de la forma de la distribución de la población.



 Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral o unilateral. Si Med0 denota la mediana de la población y Medo designa al valor hipotético, las hipótesis nula y alternativa para una prueba de dos extremos son

Se aplica un signo de más a cada valor muestral observado mayor que el valor hipotético de la mediana y un signo de menos a cada valor menor que el valor hipotético de la mediana. Si un valor muestral es exactamente igual a la mediana hipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo se reduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número de signos de más debería ser aproximadamente igual al número de signos de menos. 0, para decirlo de otra manera, la proporción de signos de más (o de signos de menos) debe ser de alrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una prueba bilateral es H0:  = 0.50, donde  es la proporción de la población de los signos de más (o de menos). Así, una hipótesis referente al valor de la mediana se prueba en realidad como una hipótesis sobre . Si la muestra es grande, se puede hacer uso de la distribución normal.

 6.5 Una muestra: Prueba de Wilcoxon

 Lo mismo que en el caso de la prueba de los signos, la prueba de Wilcoxon puede usarse para probar una hipótesis nula referente al valor de la mediana de la población. Pero dado que la prueba de Wilcoxon considera ]a magnitud de la diferencia entre cada valor muestral y el valor hipotético de la mediana, es una prueba más sensible que la prueba de los signos. Por otra parte, puesto que se determinan las diferencias, los valores deben estar al menos en la escala de intervalo. No se requiere de ningún supuesto acerca de la forma de la distribución de la población.



 

Las hipótesis nula y alternativa se formulan respecto de la mediana de la población ya sea para una prueba unilateral o bilateral. Se determina la diferencia entre cada valor observado y el valor hipotético de la mediana, diferencia que, con el signo aritmético que le corresponda, se designa como d : d = (X – Med0). Si alguna diferencia es igual a cero, la observación asociada se excluye del análisis y el tamaño de muestra efectivo se reduce. Los valores absolutos de las diferencias se clasifican entonces de menor a mayor, asignándose el rango de 1 a la menor diferencia absoluta. Cuando las diferencias absolutas son iguales, se asigna el rango medio a los valores así relacionados. Finalmente, se obtiene la suma de los rangos en forma separada para las diferencias positivas y para las negativas. La menor de estas dos sumas es la estadística T de Wilcoxon para una prueba bilateral. En el caso de una prueba unilateral, la suma menor debe asociarse con la direccionalidad de la hipótesis nula. Para rechazar la hipótesis nula, el valor obtenido de T debe ser menor que el valor crítico dado en la tabla.



 Cuando n  25 y la hipótesis nula es cierta, la estadística T tiene una distribución aproximadamente normal. La media y el error estándar asociados con esta distribución de muestreo son, respectivamente,

Por lo tanto, en el caso de una muestra relativamente grande la prueba puede realizarse usando la distribución normal de probabilidad y calculando la estadística de prueba z, de la siguiente manera:



Véase el problema anteriores para una aplicación de la prueba de Wilcoxon a la prueba de una hipótesis nula referente a la mediana de la población.

 6.6 Dos muestras independientes: Prueba de Mann-Whitney

 La prueba de Mann-Whitney puede utilizarse para probar la hipótesis nula de que las medianas de dos poblaciones son iguales. Se supone que las dos poblaciones tienen la misma forma y dispersión, porque tales diferencias también podrían conducir al rechazo de la hipótesis nula. Es necesario que los valores de las dos muestras aleatorias independientes estén al menos en la escala ordinal.



 Las dos muestras se combinan en un conjunto ordenado, en el que cada valor muestral se identifica según el grupo muestral original. Los valores se clasifican entonces de menor a mayor, asignando el rango 1 al menor valor muestral observado. En caso de valores iguales, se les asigna el rango medio. Si la hipótesis nula es cierta, el promedio de los rangos de cada grupo muestral debería ser aproximadamente igual. La estadística calculada para efectuar esta prueba se denomina U, y puede basarse en la suma de los rangos de cualquiera de las dos muestras aleatorias, de este modo:

donde n1 = tamaño de la primera muestra

n2 = tamaño de la segunda muestra

R1 = suma de los rangos de la primera muestra

R2 = suma de los rangos de la segunda muestra

 Dado que n1 > 10, n2 > 10 y la hipótesis nula sea cierta, la distribución de muestreo de U es aproximadamente normal, con los siguientes parámetros:



Por lo tanto, la estadística de prueba para probar la hipótesis nula de que las medianas de dos poblaciones son iguales es



donde U es igual a U1 o U2.

 En situaciones en las que n1 < 10, n2 < 10 o tanto n1 como n2 < 10, la distribución normal de probabilidad no puede emplearse en esta prueba. No obstante, en libros de texto especializados en estadística no paramétrica se dispone de tablas especiales de la estadística U para esas pequeñas muestras.

 El problema ilustra el uso de la prueba de Mann-Whitney.

 6.7 Observaciones apareadas: Prueba de los Signos

 En el caso de dos muestras recolectadas como observaciones apareadas, la prueba de los signos descrita en la sección anterior puede usarse para probar la hipótesis nula de que las dos medianas de la población son iguales. Los valores muestrales deben estar al menos en la escala ordinal, y no se requiere de ningún supuesto acerca de las formas de las dos distribuciones poblacionales.

 

Se aplica un signo de más a cada par de valores cuya medida en la primera muestra es mayor que la medida en la segunda muestra, y un signo de menos cuando ocurre lo contrario. Si un par de medidas tiene el mismo valor, estos valores relacionados se excluyen del análisis, con lo que el tamaño de muestra efectivo se reduce. Si la hipótesis de que las dos poblaciones son de igual nivel de magnitud es cierta, el número de signos de más debería ser aproximadamente igual al número de signos de menos. Por lo tanto, la hipótesis nula a prueba es H0 :  = 0.50, donde  es la proporción de la población de signos de más (o de menos). Si la muestra es grande (n > 30), puede usarse la distribución normal, como se explica en la sección 11.5. Nótese que aunque se recolectan dos muestras, la prueba se aplica al conjunto de signos de más y de menos que resulta de la comparación de los pares de medidas.



 El problema ilustra el uso de la prueba de los signos para probar la diferencia entre dos medianas de datos recolectados como observaciones apareadas.

 6.8 Observaciones apareadas: Prueba de Wilcoxon

 En el caso de dos muestras recolectadas como observaciones apareadas, la prueba de Wilcoxon descrita en la sección anterior puede usarse para probar la hipótesis nula de que las dos medianas de la población son iguales. Dado que la prueba de Wilcoxon considera la magnitud de las diferencias entre los valores de cada par asociado, y no sólo la dirección o signo de la diferencia, es una prueba más sensible que la prueba de los signos. Sin embargo, los valores muestrales deben hallarse en la escala de intervalo. No se requiere de ningún supuesto acerca de las formas de las dos distribuciones.

 Se determina la diferencia entre cada par de valores, la cual, junto con el signo aritmético asociado, se designa como d. Si alguna diferencia es igual a cero, ese par de observaciones se excluye del análisis, con lo que el tamaño de muestra efectivo se reduce. Después, los valores absolutos de las diferencias se clasifican de menor a mayor, asignando el rango de 1 a la diferencia absoluta menor. Cuando las diferencias absolutas son iguales, se asigna el rango medio a los valores así relacionados. Finalmente, se obtiene por separado la suma de los rangos de las diferencias positivas y de las negativas. La menor de estas dos sumas es la estadística T de Wilcoxon para una prueba de dos extremos. En el caso de una prueba de un extremo, la suma menor debe asociarse con la direccionalidad de la hipótesis nula, como se ilustra en la aplicación de una muestra de la prueba de Wilcoxon en el problema.

 Cuando n  25 y la hipótesis nula es cierta, la estadística T tiene una distribución aproximadamente normal. Las fórmulas para la media y error estándar de la distribución de muestreo de T y la fórmula para la estadística de prueba z se especifican en la sección 21.5, sobre la aplicación de la prueba de Wilcoxon con una muestra .

 El problema ilustra el uso de la prueba de Wilcoxon para probar la diferencia entre dos medianas de datos recolectados como observaciones apareadas.

 

6.9 Varias muestras independientes: Prueba de Kruskal-Wallis

 La prueba de Kruskal-Wallis sirve para probar la hipótesis nula de que varias poblaciones tienen las mismas medianas. Así, es el equivalente no paramétrico del diseño completamente aleatorizado de un factor de análisis de varianza. Se supone que las diversas poblaciones tienen la misma forma y dispersión para que la hipótesis anterior sea aplicable, ya que diferencias en forma o dispersión podrían también conducir al rechazo de la hipótesis nula. Es necesario que los valores de las diversas muestras aleatorias independientes estén al menos en la escala ordinal.



 Las varias muestras son vistas primeramente como un conjunto de valores, y cada valor de este grupo combinado se clasifica de menor a mayor. En caso de valores iguales, se les asigna el rango medio. Si la hipótesis nula es cierta, el promedio de los rangos de cada grupo muestral debería ser más o menos igual. La estadística de prueba calculada se denomina H y se basa en la suma de los rangos de cada una de las varias muestras aleatorias, de la siguiente manera:

donde N = tamaño de muestra combinado de las diversas muestras (nótese que en este caso N no designa al tamaño de la población)

Rj . = suma de los rangos de la jésima muestra o grupo de tratamiento

nj. = número de observaciones de la jésima muestra



 Dado que el tamaño de cada grupo muestral sea de al menos nj  5 y la hipótesis nula sea cierta, la distribución de muestreo de H es similar a la distribución X2 con g1 = K - 1, donde K es el número de tratamientos o grupos muestrales. El valor de X2 que aproxima el valor crítico de la estadística de prueba es siempre el valor de la cola superior. Este procedimiento de prueba es análogo a la cola superior de la distribución F que se emplea en el análisis de varianza. En el caso de rangos empatados, la estadística de prueba H debe corregirse. El valor corregido de la estadística de prueba se denomina HC y se calcula en la siguiente forma:

donde tj representa el número de puntajes empatados en la jésima muestra.

 El efecto de esta corrección es incrementar el valor de la estadística H calculada. En consecuencia, si el valor no corregido de H conduce al rechazo de la hipótesis nula, no hay necesidad de corregir este valor para el efecto de rangos empatados. El problema ilustra el uso de la prueba de Kruskal-Wallis para probar la hipótesis nula de que varias poblaciones tienen la misma mediana.


Catálogo: 14%20Educación%20profunda%20y%20experiencias -> 09%20Apoyos%20a%20la%20experimentación -> 01%20Curso%20de%20investigación%20educativa
14%20Educación%20profunda%20y%20experiencias -> Tres lecturas basicas y tres autores firmes para entender lo que son las vivencias
14%20Educación%20profunda%20y%20experiencias -> Educacion vivencial alude a vivencias
14%20Educación%20profunda%20y%20experiencias -> Estilos latinos e italianos
14%20Educación%20profunda%20y%20experiencias -> 1. Lucha contra la depresión y la frustración Tres criterios y consignas La frustración
01%20Curso%20de%20investigación%20educativa -> De Gardner (tomado de Wikipedia)
01%20Curso%20de%20investigación%20educativa -> Las medidas son habituales en psicologia y sociologia
09%20Apoyos%20a%20la%20experimentación -> Leer con los niños
01%20Curso%20de%20investigación%20educativa -> Voluntad la voluntad es la facultad humana por la que realizamos actos de opciones y mantenemos las decisiones de forma adecuada después de hacer elegido


Compartir con tus amigos:
1   ...   16   17   18   19   20   21   22   23   24


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

    Página principal
Universidad nacional
Curriculum vitae
derechos humanos
ciencias sociales
salud mental
buenos aires
datos personales
Datos personales
psicoan lisis
distrito federal
Psicoan lisis
plata facultad
Proyecto educativo
psicol gicos
Corte interamericana
violencia familiar
psicol gicas
letras departamento
caracter sticas
consejo directivo
vitae datos
recursos humanos
general universitario
Programa nacional
diagn stico
educativo institucional
Datos generales
Escuela superior
trabajo social
Diagn stico
poblaciones vulnerables
datos generales
Pontificia universidad
nacional contra
Corte suprema
Universidad autonoma
salvador facultad
culum vitae
Caracter sticas
Amparo directo
Instituto superior
curriculum vitae
Reglamento interno
polit cnica
ciencias humanas
guayaquil facultad
desarrollo humano
desarrollo integral
redes sociales
personales nombre
aires facultad