Prueba de hipótesis (estadística)
Es un procedimiento estadístico que permite aceptar o rechazar una afirmación hecha con respecto a un fenómeno o suceso.
El procedimiento consta de seis (6) pasos
Tipos de Hipótesis
editarSe les denomina así a los supuestos (hipótesis) realizados con respecto a un parámetro o estadístico (media, proporción, entre otros).
En este paso se definen dos tipos de hipótesis:
- Ho: Hipótesis nula
- H1: Hipótesis alterna (de la cual se sospecha pudiera ser cierta, es planteada por el investigador)
Planteamiento con una variable
editarEste tipo de desarrollo va de la forma: "¿Se podría afirmar que el promedio de tiempo que se demora una persona en vestirse es de 10 minutos?".
En el cual se desea averiguar de una variable si la cantidad inducida es correcta o falsa.
Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres casos:
CASO I | CASO II | CASO III |
---|---|---|
*Ho: U = 10 min *H1: U ≠ 10 min |
*Ho: U = 10 min *H1: U > 10 min |
*Ho: U = 10 min *H1: U < 10 min |
El tiempo promedio que se demora una persona en vestirse no es igual o es diferente a 10 minutos | El tiempo promedio que se demora una persona en vestirse es más o superior a 10 minutos | El tiempo promedio que se demora una persona en vestirse es menos o inferior a 10 minutos |
Planteamiento con dos variables o por comparación
editarEste tipo de desarrollo va de la forma: "¿Se podría afirmar que las ganancias de las empresas medianas han crecido este año con respecto al año anterior?".
En el cual se compara un valor predefinido con respecto a una suposición entre una variable con otra variable para determinar si esta es correcta o falsa.
Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres casos:
CASO I | CASO II | CASO III |
---|---|---|
*Ho: U1 = U2 *H1: U1 ≠ U2 |
*Ho: U1 = U2 *H1: U1 > U2 |
*Ho: U1 = U2 *H1: U1 < U2 |
Las ganancias de las empresas medianas en este año no son iguales o son diferentes al año anterior | Las ganancias de las empresas medianas en este año son más o superiores al año anterior | Las ganancias de las empresas medianas en este año son menos o inferiores al año anterior |
Nivel de significancia (α)
editarSe le conoce así al error máximo adoptado al momento de rechazar la hipótesis nula (Ho) cuando es verdadera.
Dependiendo del tipo de significación que se da al estudio, hay tres grados:
- α = 0.01 → Demasiado significativo
- α = 0.05 → Significativo
- α = 0.10 → Poco significativo
Región de aceptación y rechazo
editarH1: ≠ | H1: < | H1: > |
---|---|---|
Valor de la distribución 'Z' o 't'
editar- Véase: Tabla de la distribución t-Student para valores tipo " t "
En este paso se procede a ubicar el intervalo de confianza para su próxima colocación en el gráfico de "aceptación y rechazo".
Hay dos formas de encontrar dicho valor: mediante la tabla " Z " o la tabla " t ".
Para definir cuál es la tabla en la que se buscará la información, se debe de considerar el número de datos con los que se cuenta.
- Si la cantidad de datos sobrepasa o es igual a 30, se usará la tabla " Z "
- Si la cantidad de datos son menores a 30, se usará la tabla " t ".
Ejemplo:
- "De una muestra de 30 alumnos..." - Se usa la tabla Z.
- "Se encuestó a 14 personas..." - Se usa la tabla t.
Determinar el intervalo de confianza
editarEl intervalo de confianza es el punto que separa a la Región de Aceptación y Rechazo.
Una variable
editarTabla Z
editarPara hallar el intervalo en esta tabla se sigue la siguiente fórmula:
Donde:
α = Nivel de significancia
Tabla t
editarPara hallar el intervalo en la tabla t-student se sigue la siguiente fórmula:
Para cuando H1 es " < " o " > " | Para cuando H1 es " ≠ "
|
---|---|
Donde:
α = Nivel de significancia |
Donde:
α = Nivel de significancia |
Dos variables
editarTabla Z
editarPara hallar el intervalo en esta tabla se sigue la siguiente fórmula:
Para usar esta fórmula, tanto n1 y n2 tienen que tener un valor mayor o igual a 30
n1 ≥ 30
n2 ≥ 30
Donde:
α = Nivel de significancia |
Tabla t
editarPara hallar el intervalo en la tabla t-student se sigue la siguiente fórmula:
Para usar esta fórmula, por lo menos n1 o n2 tiene que tener un valor inferior a 30
n1 < 30
n2 < 30
Donde:
α = Nivel de significancia |
Donde:
α = Nivel de significancia |
Estadística de prueba 'Z' o 't'
editarUna media o promedio
editarPara muestras mayores o igual a 30
editar
Donde:
= Promedio parcial (de la muestra)
= Desviación poblacional total
= Valor de la hipótesis
= Número de datos
Para muestras menores a 30
editar
Donde:
= Promedio parcial (de la muestra)
= Desviación de la muestra
= Valor de la hipótesis
= Número de datos
.
Una proporción o porcentaje
editarPara muestras mayores o igual a 30
editar
Donde:
= Proporción de la muestra
- Se puede conseguir de la siguiente forma, si el problema no lo da
-
= Valor numérico de la muestra
= Proporción poblacional (total)
= Número de datos
Para muestras menores a 30
editar
Donde:
= Proporción de la muestra
- Se puede conseguir de la siguiente forma, si no el problema no lo da
-
= Valor numérico de la muestra
= Proporción poblacional (total)
= Número de datos
Diferencia de dos medias o promedios
editar
Donde:
= Promedio de la primera variable
= Promedio de la segunda variable
= Porcentaje de la primera variable (si no se especifica es 100 (%))
= Porcentaje de la segunda variable (si no se especifica es 100 (%))
= Desviación de la primera variable
= Desviación de la segunda variable
= Número de datos de la primera variable(total)
= Número de datos de la segunda variable(total)
Diferencia de proporciones o porcentajes
editar
donde:
Donde:
= Promedio de la primera variable en proporción (por ejemplo: 0.30)
= Promedio de la segunda variable en proporción
- Se puede conseguir de la siguiente forma, si es un porcentaje
- o
= Promedio de la primera variable en porcentaje (por ejemplo: 30 (%))
= Promedio de la segunda variable en porcentaje (por ejemplo: 30 (%))
= Porcentaje de la primera variable (si no se especifica es 100 (%))
= Porcentaje de la segunda variable (si no se especifica es 100 (%))
= Número de datos de la primera variable(total)
= Número de datos de la segunda variable(total)