CURSO ELEMENTAL DE ESTADÍSTICA

Una buena forma de empezar un curso de Estadística es haciendo un viaje en autobús turistico por el mundo de la Estadística, un viaje para ver, de momento muy superficialmente, qué paisaje nos vamos encontrar a lo largo de este curso: Es importante esta introducción porque nos proporciona un primer recorrido por todo lo que hemos de ver. Ahora ya empezaremos a bajar del autobús y ver con detalle las diferentes técnicas estadísticas que nos permitirán ver cómo es este proceso de decisión que incorporan para hablar de POBLACIONES a través de MUESTRAS. Una vez vista esta introducción empecemos con el primer tema del curso: Empecemos ya, ahora, con las técnicas descriptivas: Veamos ahora, para acabar el Tema 2, la curva de Lorenz, el Índice de Gini y un breve mención a la Estadística descriptiva de variables cualitativas que es muy sencilla, puesto que consiste básicamente en cuantificar las frecuencias de cada uno de los valores posibles de la variable: Una forma de salir de la descriptiva y empezar ya a ver las técnicas inferenciales (las técnicas de relación y de comparación) es abordar el complejo concepto, por polisémico, de intervalo de confianza: Un último ejemplo donde se verá un caso especial de aplicación de intervalos de confianza predictivos: Veamos algunos ejercicios, en forma de preguntas test, de los temas 2 y 3: Empecemos ahora, ya, con las técnicas de relación. Veamos esta introducción: Veamos, en primer lugar, las relaciones entre dos variables cuantitativas: Ahora veamos las relaciones entre dos variables cualitativas: Para practicar con el mecanismo del test veamos el siguiente vídeo: Es importante que veáis las entrañas de la técnica, cómo se decide a partir de unos cálculos, el significado de la tabla esperada respecto del de la tabla observada, cómo se busca un umbral dada una tabla de contingencias determinada (según el número de filas y columnas), cómo se calcula el p-valor. Mirad en este vídeo dos ejemplos más: Un último punto del tema 8, que lo veremos con un ejemplo de la covid-19: Veamos ahora cómo cuantificar la relación entre variables cuantitativas: Os cuelgo un vídeo para repasar, de forma sencilla, el concepto de Odds ratio: Un poco más del índice Kappa: Un resumen de los temas 8 y 9 del blog: Vamos a ver ahora un tema muy importante. Un tema transversal. Un tema que aborda el concepto de Significación formal en contraposición al concepto de Significación material. Además, introduce la noción importantísima de Tamaño del efecto. Vamos a ver, ahora, el caso de la relación entre una variable cualitativa dicotómica y una variable cuantitativa: la Regresión logística: En el Tema 4, de introducción de las Técnicas de relación, decíamos que una forma de empezar es relacionando dos variables únicamente. En el último vídeo de Regresión logística hemos visto la Regresión logística multivariante. Vamos a ver, en el último tema de Técnicas de relación, una introducción a la Regresión lineal múltiple: Vamos a cambiar de familia de técnicas estadística. Vamos a introducir, ahora, las técnicas de comparación: Para practicar en los conceptos de este tema os recomiendo los siguientes vídeos que resuelven preguntas tipo test del apartado de PROBLEMAS Y EXÁMENES: Vamos ahora a ver técnicas de comparación de dos poblaciones: En este primer vídeo veréis las orientaciones a seguir para ver este tema. Veréis que este vídeo os llevará a un texto y a tres vídeos. Veréis el esquema básico de cómo moverse entre estas técnicas, cómo elegir la adecuada a un caso concreto y, también, ejemplos de aplicación que veréis en unos ficheros de COMPLEMENTOS. De momento veremos ejemplos en variables dicotómicas. Más adelante veremos ejemplos en variables cuantitativas continuas (con muchos valores posibles): Aquí tenéis un vídeo analizando unos problemas en forma de preguntas test: Si os fijáis en la tabla del artículo del The Lancet el uso de estas técnicas de comparación para variables dicotómicas es el más frecuente en estudios clínicos. Son muchas las variables dicotómicas en estudios clínicos. De hecho, son, de mucho, las más frecuentes. Por lo tanto, es muy importante dominar especialmente las dos posibilidades de uso de comparación de muestras independientes (que es la situación, también, más frecuente). Saber si hay que aplicar un test de proporciones (o una ji-cuadrado, que sería equivalente: pensad que una variable dicotómica con dos grupos a comparar genera una tabla 2×2 de las estudiadas en el tema 8) o un test exacto de Fisher. Con los vídeos Tema 14: Ejemplos de aplicación (1) y Tema 14: Ejemplos de aplicación (2) hemos visto, pues, ejemplos de comparaciones de variables dicotómicas. Ahora os podéis mirar los vídeos Tema 14: Ejemplos de aplicación (3) y Tema 14: Ejemplos de aplicación (4). En estos dos vídeos veréis cómo llegamos a decidir cuál es la técnica de comparación de dos poblaciones que debemos utilizar en una variable cuantitativa. El siguiente vídeo os orienta en esta segunda parte del Tema 14: A continuación ejemplos de más preguntas test sobre este tema 14: Sería ahora conveniente volver a escuchar el vídeo del tema 10, puesto que allí se trataba un tema transversal que tanto podía verse después de haber visto las técnicas de relación como después de haber visto las de comparación. Os pongo el vídeo de nuevo: A continuación tenéis un comentario de un artículo sobre la COVID-19 donde podemos ver la problemática de este tema 14: Os cuelgo una orientación acerca del p-valor: Una cuestión importante después de haber visto estas técnicas de comparación. Existen técnicas que se suelen denominar de una población que lo que hacen en ver si a partir de una muestra podemos aceptar la hipótesis de que en una población la media es un valor determinado (en una variable cuantitativa) o que hay una proporción determinada de individuos en una variable dicotómica. Me refiero al Test de la t de Student para una población y el Test de proporción de una población. La verdad es que no son tests muy usuales, no se utilizan con mucha frecuencia. Nada que ver con los test de comparación de dos poblaciones que hemos visto en el Tema 14, pero es importante que los conozcáis. El objetivo es, como he dicho antes, comprobar si es razonable pensar que la media poblacional en una variable cuantitativa o la proporción poblacional en una variable dicotómica es un valor determinado prefijado, a la luz de una muestra concreta que tengamos. Por ejemplo: Queremos comprobar si es razonable pensar que en España han pasado la Covid un 10% de personas. Cogemos una muestra, por ejemplo, de 1000 personas y resulta que en ella hay un 8% de personas que la han pasado esta enfermedad. ¿Es razonable mantener esa hipótesis de que en la población hay un 10%? El contraste de hipótesis me proporcionará un p-valor que me dirá si es o no razonable mantener esa hipótesis. Si hiciera un intervalo de confianza del 95% de la proporción poblacional debería ver si en el intervalo está incluido ese 10% o no. Si está incluido mantendría la hipótesis y si no lo está la rechazaría. Os cuelgo un vídeo explicando brevemente esto que os acabo de escribir: Con todo esto tenemos ya mucho material visto. Os cuelgo a continuación tres vídeos con examen tipo test, que será como os evaluaré en el examen final. Estos tres vídeos os comentan varias preguntas tipo test para que practiquéis. Sin embargo, en el blog, en el apartado de PROBLEMAS Y EXÁMENES tenéis muchas preguntas de este tipo para que practiquéis. A mí siempre me ha gustado la enseñanza de conceptos mediante este tipo de preguntas. Aquí tenéis los vídeos: Aquí tenéis más preguntas test comentadas. En el primer vídeo veréis que en la pregunta 4 comento la que tiene mayor capacidad predictiva cuando pide la de menor capacidad predictiva. En el siguiente vídeo comento la confusión. En la pregunta 5 veréis que no hay solución. No lo he borrado porque creo que es útil para aprender los conceptos, como veréis. Aquí tenéis una explicación de dos calculadoras que os haré llegar. Una para calcular el intervalo de confianza de una proporción y el otro para calcular la Odds ratio y su intervalo de confianza: Ahora tenéis dos vídeos para penetrar con un poco de detalle en cómo funciona por dentro el contraste de hipótesis que hacemos en el Test de la t de Student de dos muestras independientes y varianzas iguales: A continuación tenéis un vídeo que comenta la noticia de que se va a efectuar un muestreo en España para saber cuántas personas están inmunizadas de la Covid-19: Un repaso de lo que hemos hecho hasta ahora: A continuación tenéis un vídeo con un comentario sobre un artículo sobre la covid-19 que os permitirá repasar conceptos viendo su aplicación práctica: Más ejercicios resueltos: Veamos a continuación una introducción al tema 15. El tema 15 es un tema que puede dar lugar a un curso entero, de hecho en este blog tenéis un Curso elemental de ANOVA, que podría verse como una continuación de este curso elemental de Estadística. Por lo tanto, lo que veamos aquí lo podéis entender como una introducción muy básica de lo que se desarrolla más extensamente en este curso elemental de ANOVA: Y ahora unos ejemplos: Un repaso de lo esencial en ANOVA:
https://youtu.be/rY_2j2z5apo
Ejercicios de ANOVA:
https://youtu.be/s5dV6kKAy0Q
Y ahora vamos por el tema de la determinación del tamaño de muestra. Escuchad estos dos vídeos que explican el Tema 16 del blog: Ahora tenéis un vídeo que os explica una calculadora del tamaño de muestra “on line” muy buena: Un ejemplo de aplicación: Y un comentario de la parte de determinación del tamaño de muestra de un artículo médico: Aquí tenéis ejercicios test, resueltos y comentados, del tema 16: Aquí tenéis exámenes test comentados para repasar conceptos: A continuación os cuelgo unos vídeos con el examen de junio comentado: