Archivo del Autor: estadisticallopis

Situación de Oceanografía 1

Tenemos el abstract del siguiente artículo:

De este artículo tenemos la siguiente tabla:

1.Dibuja aproximadamente la distribución de la variable Kn.

2.Dibuja aproximadamente la distribución de la variable Cd.

3.Dibuja aproximadamente el Box-Plot de la variable Cd.

4.Dibuja aproximadamente el Box-Plot de la variable Edad.

5.Haz una estimación de qué porcentaje de delfines de esta especie estudiada, a nivel poblacional, tienen un Kn entre 0,85 y 1,05.

Comparación de medias, medianas y proporciones

Es muy frecuente en Estadística evaluar si hay diferencia de medias, medianas o proporciones entre una población y un valor de referencia o entre dos poblaciones o entre más de dos poblaciones, en base al análisis de las diferencias que vemos entre las muestras de que dispongamos de esas poblaciones.

A continuación se ofrece un mapa general de todas las técnicas de comparación de medias, medianas y proporciones que se realizan en Estadística:

Es importante tener en cuenta la equivalencia que hay entre los contrastes de hipótesis. Veámoslo, como ejemplo, en la comparación de dos medias:

Podemos tener dos medias o más de dos medias que nos interesa comparar. El objetivo es entonces evaluar las diferencias que hay entre esas medias; o sea, ver cuál es la diferencia entre ellas. Se suele evaluar si se puede aceptar que la diferencia de esas medias es, poblacionalmente, cero, que es sinónimo de decir que las medias son iguales. Como siempre: queremos decir cosas poblacionales, de poblaciones que no tenemos, a partir de información muestral que sí tenemos.

En esquema:

Para evaluar si esas medias son iguales o no realizamos un contraste de hipótesis o un intervalo de confianza.

Podemos comparar la media de una población respecto a un valor de referencia, las medias de dos poblaciones o las medias de más de dos poblaciones.

Veamos ejemplos de diferencia de medias de más de dos poblaciones:

En la siguiente tabla comparamos, en tres localidades, por ejemplo, la longitud de ejemplares de una especie de insecto:

En la siguiente tabla comparamos cuatro poblaciones: pacientes que no toman ni ARA II ni IECA, pacientes que toman IECA pero no ARA II, pacientes que toman ARA II y no toman IECA y pacientes que toman los dos fármacos. Se trata de un caso de dos factores cruzados. Tenemos, además, cuatro pacientes de cada grupo. La variable estudiada es la presión diastólica:

Otro ejemplo de cuatro poblaciones (Dos factores cruzados):

Otro ejemplo de cuatro poblaciones, con dos factores no cruzados sino, ahora, anidados:

Podemos evaluar en cada uno de estos casos, a la luz de la información muestral que vemos, cuáles pueden ser las conclusiones poblacionales que nos podrán ofrecer las diferentes técnicas estadística aplicables a estas situaciones.

Podemos tener, también, interés en comparar las medianas de dos poblaciones o las medianas de más de dos poblaiones. O sea, ver cuál es la diferencia entre ellas. Se suele evaluar si se puede aceptar que la diferencia de esas medianas es, poblacionalmente, cero, que es sinónimo de decir que las medianas son iguales.

Para evaluar si esas medianas son iguales o no realizamos un contraste de hipótesis o un intervalo de confianza. Mucho más frecuentemente en este caso mediante contraste de hipótesis.

Podemos tener interés, también, en comparar las proporciones de dos poblaiones o de más de dos poblaciones. O sea, ver cuál es la diferencia entre ellas. Se suele evaluar si se puede aceptar que la diferencia poblacional es cero, que es sinónimo de decir que las proporciones son iguales:

Para evaluar si esas proporciones, a nivel poblaiones, son iguales o no realizamos un contraste de hipótesis o un intervalo de confianza, que son los dos métodos, equivalentes en realidad, para tomar decisiones en Estadística.

Trabajo BIOMEDICINA

Tenemos la siguiente base de datos de pacientes con demencia tratados con dos tratamientos distintos:

Paciente
Tratamiento
Sexo(Mujer)
APOE_e4_positivo
Edad
MM0: MiniMental en el diagnóstico
MM1: MiniMental al año del diagnóstico
Dif: MM0-MM1
Difmayor3: Casos con MM0-MM1>3

En las variables dicotómicas 1 indica lo marcado (Mujer, APOE_e4 positivo, Diferencia mayor que 3 y 0 indica lo contrario.

La base es la siguiente:

1.Hacer una estadística descriptiva básica:

Describir cada variable de la forma más adecuada: media y desviación estándar o mediana e IQR si es variable cuantitativa o frecuencia absoluta y frecuencia relativa si es una variable cualitativa. Realizar la comparación adecuada en cada caso para ver si hay o no diferencias estadísticamente significativas.

Especificar, en cada caso, qué técnica estadística se ha utilizado y por qué para obtener cada p-valor.

2.Calcular la Odds de ser APOE_e4_positivo con pérdida del nivel cognitiva cifrada en más de 3 puntos del MiniMental en un año tras el diagnóstico.

3.Calcular la Odds de ser mujer con ser APOE_e4_positivo.

4.Calcular la correlación entre edad y la pérdida del MiniMental en un año de diagnóstico.

Examen de Estadística en Economía 3

1.En un estudio de Marketing aparece la siguiente tabla:

En cada celdilla aparecen cuatro valores: la frecuencia absoluta, el porcentaje por fila, el porcentaje por columna y el porcentaje respecto al total. Aparecen, también, los totales por filas y columnas; valores éstos que nos servirían para calcular la tabla esperada.

¿Podemos decir que hay relación estadísticamente significativa entre estos grupos de edad estudiados y la Atracción por los productos de Starbucks? Haz los cálculos necesarios para responder a esta pregunta.

2.Supongamos que Amazón quiere estudiar recomendaciones entre cinco productos que comercializa (A, B, C, D y E) para establecer un mecanismo mediante el cual quien compra uno de estos cinco productos se le recomienda la compra de otro de esos cinco artículos. Para ello se analizan las compras que 10000 consumidores han realizado de estos productos por Amazón.

A partir de los datos facilitados en el Excel siguiente:

y en base a unos cálculos que debes hacer, establece un mecanimo de recomendación:

Si compra A le recomendaremos que compre el producto X

Si compra B le recomendaremos que compre el producto Y

Etc.

Trabajo práctico de Biomedicina

Realizar a mano, con papel y lápiz, la curva ROC que evalúa la capacidad predictiva de Cáncer de próstata a partir de la cantidad de PSA o de la relación Psa libre/ Psa total del paciente. ¿Cuál es la mejor variable para predecir el cáncer de próstata? ¿Qué punto de corte establecerías en cada una de las dos variables?

La base de datos con la que trabajar es la siguiente:

Examen de Estadística en Economía 2

1.En una empresa quieren ver si el producto X que ellos comercializan tiene algún tipo de asociación, en el consumo, con otros productos de otras empresas: los productos A, B y C. A partir del siguiente muestreo establecer si hay o no asociación calculando la Odds ratio, viendo si es o no estadísticamente significativa e interpretando esa asociación, si es que la hay:

2.En nuestra empresa tenemos un evaluador oficial con mucha experiencia que consideramos la referencia. Queremos contratar a un nuevo empleado y para ello previamente establecemos un pequeño curso de métodos de evaluación de nuestros productos a esos tres candidatos al puesto. Después del curso realizamos una prueba con 100 productos para establecer la clasificación de cada producto en tres categorías posibles de calidad. A partir de los resultados siguientes, ¿qué empleado contratarías y en base a qué cálculo?