Métodos Estadísticos
Prueba de Hipótesis: Métodos Estadísticos.
Métodos de prueba de hipótesis
Hipótesis y Prueba de Hipotesis
Sabemos que las dos actividades más importantes de la estadística inferencial son la estimación de parámetros poblacionales y las pruebas de aseveraciones que se hacen acerca de esos parámetros. Con relación al segundo punto, las aseveraciones tienen dos componentes:
hipótesis, es una aseveración o afirmación acerca de una propiedad de una población.
prueba de hipótesis o prueba de sifnificancia, es un procedimiento para probar una aseveración o afirmación acerca de una propiedad de una población.
Ejemplos de Hipótesis
Mario Triola, en su libro Estadística cita algunos ejemplos de estudios estadísticos con pruebas de hipotesis:
Aviación: La FAA afirma que el peso promedio de un pasajero de aeronave (incluido equipaje de mano) es 185libras mayor que hace 20 años.
Negocios: El encabezado de una nota periodística afirma que la mayoría de los empleados consiguen trabajo por medio de redes de contactos.
Medicina Investigadores médicos aseveran que la temperatura corporal media de adultos sanos no es igual a 98.6°F.
Control de calidad Cuando se usa equipo nuevo para fabricar altímetros de aviones, los nuevos altímetros son mejores porque la variación en los errores es reducida y, por lo tanto, las lecturas son más consistentes. (En muchas industrias, la calidad de los bienes y servicios a menudo se puede mejorar al reducir la variación).
Métodos estadísticos para probar hipótesis
Existen una amplia variedad de métodos estadísticos para realizar pruebas de hipótesis, cada uno diseñado para abordar diferentes tipos de datos y preguntas de investigación. Algunos de los más comunes incluyen:
Pruebas paramétricas:
Prueba t: Compara las medias de dos grupos.
ANOVA: Compara las medias de más de dos grupos.
Regresión lineal: Modela la relación entre una variable dependiente y una o más variables independientes.
Pruebas no paramétricas:
Prueba de Wilcoxon: Similar a la prueba t, pero no asume una distribución normal de los datos.
Prueba de Kruskal-Wallis: Similar al ANOVA, pero no asume una distribución normal de los datos.
Prueba de chi-cuadrado: Evalúa la asociación entre dos variables categóricas.
Otros métodos:
Bootstrap: Un método de remuestreo que permite estimar la incertidumbre en las estimaciones estadísticas.
Permutaciones: Otro método de remuestreo que se utiliza para construir distribuciones de referencia nulas.
Bayesiano: Un enfoque que utiliza la probabilidad para actualizar creencias a medida que se recopilan nuevos datos.
Elección del método estadístico
La elección del método depende en gran medida del tipo de datos, el tamaño de la muestra y las preguntas de investigación específicas. Sin embargo, en la ciencia de datos contemporánea, algunos de los métodos más populares incluyen:
Regresión logística: Para modelar la probabilidad de un evento binario.
Modelos lineales generalizados: Para modelar una amplia variedad de tipos de datos, incluyendo datos contables y datos binarios.
Modelos de aprendizaje automático: Como los árboles de decisión, las redes neuronales y los bosques aleatorios, que pueden manejar conjuntos de datos grandes y complejos.
Pruebas basadas en permutaciones:Son cada vez más populares debido a su flexibilidad y robustez.
Métodos bayesianos:Están ganando terreno, especialmente en áreas como la bioestadística y la genética.
La diversidad de métodos refleja la complejidad de los datos que los científicos de datos deben analizar. Cada método tiene sus fortalezas y debilidades, y la elección del método adecuado requiere una cuidadosa consideración de las características de los datos y las preguntas de investigación.
Regla del suceso infrecuente
Muchos métodos estadísticos de pruebas de hipótesis se basan en la regla del suceso infrecuente para la estadística inferencial. Y otros tantos no. De manera muy sintética podemos resumir:
Clasificación Regla del suceso infrecuente
Pruebas paramétricas Si
Pruebas no paramétricas No
Otros métodos Depende
La regla del suceso infrecuente es un concepto fundamental, pero el campo de las pruebas de hipótesis es mucho más amplio y dinámico. La elección del método adecuado depende de una variedad de factores, y la ciencia de datos moderna ofrece un conjunto de herramientas cada vez más sofisticado para abordar preguntas de investigación cada vez más complejas.