Archivo de la categoría: Uncategorized

Situación 188: Examen (Temas 1-7)

1.En la muestra (8, 9, 5, 3, 6, 1, 2, 10, 123), ¿qué afirmación es cierta?

a)El primer cuartil es 2.5.

b)El tercer cuartil es 9.

c)El tercer cuartil es 8.

d) El rango intercuartílico es 5.

2.Indicar dónde hay una incoherencia:

a)IC 95% de la r: (0.23, 0.56) y p-valor de la correlación de 0.001

b)IC 95% de la r: (-0.31, 0.12) y p-valor de la pendiente de 0.34

c)IC 95% de la r: (0.23, 0.56) e IC 95% de la pendiente de la recta: (-0.34, -0.12)

d)P-valor de la r de 0.23 y p-valor de la constante de la recta de 0.001

3. ¿Qué afirmación entre las siguientes es cierta?

a)Podemos tener un primer cuartil de 8 y un tercer cuartil de 8.

b)Podemos tener una mediana de 10 y un tercer cuartil de 5.

c)Podemos tener un primer cuartil de 2, y un rango intercuartílico de -3.

d)Podemos tener un tercer cuartil de 3, una mediana de 10 y un rango intercuartílico de 6.

4. ¿Qué afirmación no es cierta?

a)Sin más información adicional una r=0.9 es una correlación con igual capacidad predictiva que una correlación r=-0.6.

b) r=0.4; IC 95%: (-0.1, 0.9) es una correlación mayor que r= – 0.3 (asociada a una pendiente de la recta construida con IC95%: (-12.3, -7.4)).

c) r=0.6 (p=0.03) es una correlación mayor que la correlación que se tiene de una regresión con IC 95% de la pendiente de (-12.3, 18.7).

d) r=0.3 (p=0.23) es una correlación igual que una r=0.8 (p=0.53)

5. Tenemos una muestra de tamaño 400 de una variable que se ajusta bien a una distribución normal. El IC de la media del 99.5% es (48.5, 51.5). La media muestral es 50. ¿Qué afirmación es cierta?

a) Un Intervalo de confianza del 95% de la media sería: (49.0, 51.0).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (37.5, 62.5).

c) Un intervalo de confianza del 68.5% de la media sería: (42.5, 57.5).

d) Un intervalo de confianza del 99.5% de valores individuales de la variable sería: (10.5, 89.5).

Situación 187: Examen (Temas 1-7)

1.¿Qué afirmación entre las siguientes es cierta?

a)En la muestra (8, 9, 5, 3, 6, 1, 2, 10, 16) el rango intercuartílico es 4.

b)Una correlación r=0.6 con IC 95% (-0.3, -0.1) es compatible con una pendiente con p=0.03.

c)Si el intervalo de confianza del 99.5% de una proporción es (0.6, 0.8) el error estándar es 0.03333.

d)Una correlación r=0.9, IC 95%(-0.1, 1) tendrá una alta capacidad predictiva porque la R2 es del 81%.

2.Indicar qué combinación de valores es posible:

a)IC 95% de la r: (0.23, 0.56) y p-valor de la correlación de 0.23

b)IC 95% de la r: (-0.31, 0.12) y p-valor de la pendiente de 0.01

c)IC 95% de la r: (0.23, 0.56) e IC 95% de la pendiente de la recta: (-0.34, -0.12)

d)P-valor de la r de 0.12 y p-valor de la ordenada en el origen de 0.01

3. ¿Qué afirmación entre las siguientes es cierta?

a)Podemos tener un primer cuartil de -5 y un tercer cuartil de -8.

b)Podemos tener una mediana de -10 y un primer cuartil cuartil de -5.

c)Podemos tener un primer cuartil de -3, y un rango intercuartílico de 3.

d)Podemos tener un tercer cuartil de -4, una mediana de -7 y un rango intercuartílico de 2.

4. ¿Qué afirmación es cierta?

a)No necesitamos más información adicional para decir que r=0.9 es una correlación con más capacidad predictiva que una correlación r=-0.6.

b) r=0.4; IC 95%: (-0.1, 0.9) es una correlación menor que r= – 0.3 (asociada a una pendiente de la recta con IC95%: (-12.3, -7.4)).

c) r=0.6 (p=0.23) es una correlación mayor que la correlación que se tiene de una regresión con IC 95% de la pendiente de (12.3, 18.7).

d) r=0.3 (p=0.23) es una correlación igual que una r=0.3 (p=0.03)

5. Tenemos una muestra de tamaño 625 de una variable que se ajusta bien a una distribución normal. El IC de la media del 99.5% es (48.5, 51.5). La media muestral es 50. ¿Qué afirmación es cierta?

a) Un Intervalo de confianza del 95% de la media sería: (49.3, 50.7).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (37.5, 62.5).

c) Un intervalo de confianza del 68.5% de la media sería: (42.5, 57.5).

d) Un intervalo de confianza del 99.5% de valores individuales de la variable sería: (12.5, 87.5).

Situación 186: Examen (Temas 1-7)

1.¿Qué afirmación entre las siguientes es cierta?

a)En la muestra (1, -4, 2, 0, 5) el rango intercuartílico es 4.

b)Una correlación r=0.3 con IC 95% (0.1, 0.5) es compatible con una pendiente con p=0.23.

c)Un intervalo de confianza de la media del 99.5% de (8.1, 8.7) tiene un error estándar de 0.3.

d)La muestra (1, 3, 4, 8) tiene el mismo rango intercuartílico que la muestra (3, 4, 6, 8, 23)

2.Indicar dónde hay una incoherencia:

a)IC 95% de la r: (0.23, 0.56) y p-valor de la pendiente de 0.001

b)IC 95% de la r: (-0.31, 0.12) y p-valor de la pendiente de 0.34

c)IC 95% de la r: (0.23, 0.56) e IC 95% de la pendiente de la recta: (-0.34, -0.12)

d)P-valor de la r de 0.23 y p-valor de la ordenada en el origen de 0.001

3. ¿Qué afirmación entre las siguientes es cierta?

a)El tercer cuartil siempre es mayor que el primer cuartil.

b)La mediana puede ser mayor que el tercer cuartil.

c)La media puede ser inferior al primer cuartil.

d)El rango siempre es mayor que el rango intercuartílico.

4. ¿Qué afirmación es cierta?

a)r=0.9 es una correlación más significativa que una correlación r=0.5.

b)Una r=0.5 con un IC 95%: (0.3, 0.7) es una correlación mayor que r= – 0.6 (p=0.01).

c)Una r=0.4 con un IC 99.5% (-0.05, 0.85) es compatible con una pendiente con p=0.02.

d)Una correlación r=0.5 tiene un coeficiente de determinación del 50%.

5. Tenemos una muestra de tamaño 10000 de una variable que se ajusta bien a una distribución normal. El IC de la media del 99.5% es (49.7, 50.3). La media muestral es 50. ¿Qué afirmación es cierta?

a) Un intervalo de confianza del 95% de la media sería: (30, 70).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (40, 60).

c) Un intervalo de confianza del 95% de valores individuales de la variable sería: (20, 80).

d) Un intervalo de confianza del 68.5% de la media sería: (49.9, 50.1).

Situación 185: Trabajo práctico

Tenemos la siguiente base de datos de pacientes que ingresaron por ictus y que fueron sometidos a un ensayo clínico aleatorizado donde se comparaba el tratamiento trombolítico mecánico con el tratamiento trombolítico farmacológico tras ingreso:

P=Paciente

G=Grupo de tratamiento (TM=Trombolisis mecánica; TF=Trombolisis farmacológica)

E=Edad

S=Sexo (0=Varón; 1=Mujer)

Ch=Charlson ajustado a la edad (Cuantificación de las comorbilidades)

nihss0=Valor del nihss en el ingreso

nihss1=Valor del nihss tras el tratamiento

M=Mortalidad intrahospitalaria (0=no muere; 1=muere)

Información sobre el nihss:

nihss

Base:

Preguntas:

1.Comprobar si el reparto aleatorio de los dos grupos ha resultado efectivo: Edad, Sexo, Charlson y nihss en el ingreso.

2.¿Hay diferencia estadísticamente significativa en el descenso en el nihss entre los dos tratamientos del ictus comparados?

3.¿Hay relación estadísticamente significativa entre el tipo de tratamiento del ictus y la mortalidad intrahospitalaria? Calcula la Odds ratio asociada a la trombectomía mecánica respecto a la farmacológica.

4.¿Al comparar los pacientes que mueren respecto a los que no mueren, dónde hay más diferencias entre ellos, en el nihss en el ingreso o en el descenso del nihss tras tratamiento?

Situación 184: Examen (Temas 1-19)

1.Si en una variable cuantitativa tenemos una Asimetría estandarizada de 0.24 y una Curtosis estandarizada de 1.33, la media muestral es 15 y la desviación estándar es 10, ¿cuál de las siguientes afirmaciones es la más coherente?

a.Entre 5 y 25 tenemos el 68.5% de los valores.

b.Entre 5 y 25 tenemos el 95% de los valores.

c.Por debajo de 12 tenemos el mismo porcentaje de valores que por encima de 18.

d.Por debajo de 5 tenemos un 1% de valores.

2.Tenemos en un estudio de relación entre dos variables cualitativas el siguiente valor de estadístico de test: 12.33.

El umbral para decidir si mantener la hipótesis nula o rechazarla en los tres contrastes de hipótesis que se realizan es:

a.24.28

b.4.75

c.0.46

d.No lo podemos saber con la información que se nos da.

3.En un ANOVA de un factor con estos IC del 95 % de la media:

¿Cuál es la afirmación cierta?

a.El p-valor del ANOVA será p>0.05.

b.Hay tres grupos homogéneos.

c.Hay dos grupos homogéneos.

d.Hay un único grupo homogéneo.

4.En una regresión lineal simple tenemos los siguientes resultados:

Podemos afirmar lo siguiente:

a.Tenemos un coeficiente de determinación del 63%

b.Un IC del 68.5% de la pendiente sería (0.36, 0.70)

c.Un IC del 95% de la ordenada en el origen sería (1.01, 7.01)

d.El p-valor de la correlación de Pearson es mayor que 0.05.

5.Si tenemos un intervalo de confianza del 95% de una proporción de botellas tomadas del mar mediterráneo con valores de un contaminante por encima del umbral tolerado que es (45%, 55%), determinar el tamaño de muestra con el que se ha trabajado:

a.100

b.200

c.300

d.400

6.En una regresión logística donde se pretende relacionar la temperatura del agua y la reproducción o no de una especie de pez criado en una piscifactoría, hemos obtenido una Odds ratio de 1.75 con un IC del 95%: (1.35, 2.88), donde hemos codificado como 1 la reproducción, podemos afirmar:

a.No hay relación entre temperatura y reproducción.

b.A mayor temperatura más probabilidades de reproducción.

c.A menor temperatura más probabilidades de reproducción.

d.Nos falta información para poder afirmar cualquiera de las tres cosas anteriores.

7.Hemos estudiado los cambios temporales de la diversidad de especies del zooplanton en el mediterráneo. Para ello se tomó una muestra de tamaño 50 en distintos puntos, al azar, en 2010 y se volvió a hacer en otra muestra al azar, también de tamaño 50, en 2020. Se midió el índice de Shannon-Weaver como medida de diversidad. Se aplicó en cada muestra el test de Shapiro-Wilk y el p-valor fue, en ambas, superior a 0.05. Se aplicó, también, el test de Fisher-Snedecor obteniendo un p-valor de 0.01. Para realizar la comparación se debió de aplicar:

a.Un test de la Mann-Whitney.

b.Un test de la t de Student de varianzas iguales.

c.Un test de la t de Student de varianzas distintas.

d.Un test de la Chi-cuadrado.

8.En el problema anterior tuvimos una diferencia de medias de 0.5 y un error standard del estadístico de test con un valor de 0.4. ¿Cuál de las siguientes afirmaciones es cierta?

a.El p-valor será menor que 0.05 porque 0.5 es mayor que 0.4.

b.El p-valor será menor que 0.05 porque el intervalo de confianza del 95% de la diferencia de medias poblacionales no contendrá al cero.

c.El p-valor será mayor que 0.05 porque el intervalo de confianza del 95% de la diferencia de medias poblacionales contendrá al cero.

d.El p-valor será mayor que 0.05 porque 0.5 es mayor que 0.4.

9.En la muestra (1, 1, 2, 2, 3, 8, 9, 10), el rango intercuartílico es:

a.7

b.9

c.4

d.6

10.En un estudio donde hemos comparado la salinidad en dos zonas del mediterráneo la salinidad de la zona 1 es de 35.1 con un tamaño de muestra de 200 y una desviación estándar de 1 y de la zona 2 es de 35.4 con un tamaño de muestra de 200 y una desviación estándar de 1. El estadístico de test es -1.96. En una distribución t de Student con valor del parámetro 398 un IC 95% es (-1.96, 1.96). ¿Qué p-valor es razonable en este estudio?

a.0.001.

b.0.5.

c.0.0000001.

d.0.05.

11.¿Cuál de las siguientes afirmaciones es cierta en un análisis de componentes principales cuya primera componente es Y=0.5X1-0.5X2+0.01X3-0.5X4?

a.La variable X3 tiene una fuerte relación con las demás.

b.No hay buena correlación entre las variables.

c.Debemos conocer el p-valor.

d.La variable X3 no tiene ningún peso en la primera componente.

12.Si un intervalo de confianza del 99.5% de la pendiente en una regresión lineal simple es (2.7, 3.3) el error estándar es:

a.0.5

b.0.05

c.0.1

d.1

13.Se pretende determinar el tamaño de muestra para un estudio donde se quiere pronosticar en qué porcentaje de puntos del mar mediterráneo se supera el valor de un umbral determinado de concentración de hidrocarburos. Es un estudio que nunca que se ha llevado a cabo en el mundo. Se pretende, además, mucha precisión: se quiere que el intervalo de confianza del 95% tenga un radio del 2%. ¿Qué tamaño de muestra necesitamos?

a.2500

b.1000

c.500

d.250

14.En un proceso de selección de operadores que clasifiquen organismos vivos del plancton marino hemos evaluado el kappa de un operador consigo mismo y resulta ser 0.95. ¿Cuál de las siguientes afirmaciones es cierta?

a.La t de Student que calculemos será significativa.

b.La Chi-cuadrado que calculemos será significativa.

c.La regresión logística que calculemos será significativa.

d.El Análisis de componentes que calculemos será significativo.

15.En un estudio de predicción de la temperatura en una zona marina nos proporcionan un IC de la media del 95% que es (18.4, 18.6). El tamaño muestral con el que se realizó tal predicción es de 100. Un IC del 99.5% descriptivo de la variable temperatura en esta zona sería:

a.(16.5, 20.5)

b.(17.5, 19.5)

c.(17.0, 20.0)

d.(18.0, 19.0)

16.En un estudio de comparación de dos poblaciones el intervalo de confianza del 95% de la diferencia de las dos proporciones poblacionales ha resultado ser (0.13, 0.56). ¿Cuál de las siguientes afirmaciones es cierta?

a.El p-valor es mayor que 0.05.

b.El p-valor es menor que 0.05.

c.El p-valor es 0.05.

d.El p-valor dependerá del tamaño de muestra.

17.Estamos comparando la salinidad de dos zonas marinas. Tenemos el siguiente cálculo de potencia estadística de la comparación muestral:

¿Cuál de las siguientes afirmaciones es cierta?

a.Si pasamos de una desviación estándar de 1 a una de 2 la potencia aumentará.

b.Si la diferencia de medias aumenta la potencia aumentará.

c.Si aumentamos el tamaño de muestra la potencia disminuirá.

d.Si aumentamos el tamaño de muestra y la desviación estándar la potencia aumentará.

18.Hemos estudiado en cinco zonas concretas del mar un metro cúbico de agua y hemos hecho un recuento de cinco especies de zooplanton presentes en cada una de esas muestras. Hemos realizado un test de la Ji-cuadrado. El valor del estadístico de test ha sido 31.99. ¿Cuál de las siguientes respuestas es correcta?

a.p=0.03

b.p=0.01

c.p=0.95

d.p=0.0001

19.¿En cuál de las siguientes afirmaciones hay una incoherencia?

a.IC 95% de la correlación de Pearson: (0.23, 0.35). IC 95% de la pendiente de una regresión lineal simple: (0.47, 2.33).

b.IC 95% de la diferencia de proporciones es (-1.77, 2.18) y el p-valor mayor que 0.05.

c.IC 95% de la correlación de Pearson: (0, 0.12) y el p-valor es 0.05

d.Correlación de Pearson: -0.5. Coeficiente de determinación del 25%.

20.¿Cuál de las siguientes afirmaciones es cierta?

a.Un Análisis clúster es una técnica de comparación entre tres grupos.

b.Una correlación de Pearson entre dos variables cualitativas con una r=0.56 y con una p<0.05 indica una relación estadísticamente significativa.

c.La V de Crámer es una medida de diferencia entre dos poblaciones a comparar.

d.La Chi-cuadrado puede usarse como técnica de relación y como técnica de comparación.

Introducción al Cálculo de probabilidades y Estadística

Una forma de introducir un curso de Cálculo de probabilidades y Estadística es relacionándolo con lo que podríamos denominar la columna vertebral de las matemáticas: la noción de función.

Puede resultar, asimismo, conveniente, situar la noción de función en un ámbito ontológico más general. Veámoslo.

Podemos considerar que el mundo, que la realidad, está constituidas de entidades, de unidades diferenciadas de un entorno, y de relaciones entre ellas.

El concepto matemático de relación es el siguiente: Es un subconjunto del producto cartesiano de dos conjuntos:

El producto cartesiano de dos conjuntos es el listado de todas las parejas de valores donde un elemento es de A y el otro de B. Una relación concreta especifica cuáles de estas posibilidades potenciales se realizan. En definitiva, entre dos conjuntos cualesquiera una relación es el listado de conexiones que se establecen entre los elementos de un conjunto y los elementos del otro. Por ejemplo, dos grupos de personas A y B las flechas marcarían cuáles son las relaciones, por ejemplo, de amistad.

En matemáticas hay un tipo muy especial de relación: la aplicación o función, que es la dibujada asÍ:

Para que una relación sea función debe todo elemento del conjunto denominado dominio (en este caso A) tener relación con uno y sólo un elemento del conjunto denominado codominio (en este caso B).

Vemos que cada elemento a del conjunto A, excepto el quinto elemento, tiene una y sólo una conexión con un elemento b del conjunto B. En este caso, diríamos que el dominio de la función no es todo A, sino el subconjunto formado por los primeros cuatro elementos y que el recorrido de esta función está formada únicamente por los tres primeros elementos del codominio B. La búsqueda del dominio y el recorrido de una función es algo muy habitual en matemáticas.

Esta noción es trascendental, puesto que muchas cosas en la vida real, en nuestra forma de ser, menejamos esta noción. Podríamos decir que esta noción de función forma parte esencial del funcionamiento del mundo.

En todo caso a nosotros esta noción nos va a ser muy útil para trazar una mirada unitaria a todo el mundo del Cálculo de probabilidades y Estadística. De hecho, buena parte de los que se realiza en esta disciplina se puede visualizar bajo el prisma de la noción de función, como iremos viendo.

Una noción más: Vamos a delimitar tres tipos de entidades en el mundo real:

  1. Entidades no matemáticas: ENM.
  2. Entidades matemáticas no numéricas: EMNN.
  3. Entindes matemáticas numéricas: EMN.

El siguiente esquema nos ayuda a ver algunas de las entidades que forman parte de estos tres tipos de conjuntos:

Podemos ver que se trata de tres listados bien distintos. En la primera lista se trata de entidades de la vida real, de nuestro entono. Son las entidades con las que se enfrentan las distintas ciencias, las entidades que constituyen el objetivo de cualquiera de las distintas ciencias. Al final de esta lista vemos una dualidad general, pero muy importante: el enfrentamiento de dos hipótesis a contrastar. Veremos que esto es algo común en los mecanimos estadísticos esenciales de decisión de todas las ciencias.

Esta mirada nos ayudará a delimitar una serie de procedimientos que constituyen la columna vertebral del mundo del Cálculo de probabilidades y de la Estadística. Nos ayudará, también, a situar las distintas acciones implicadas en el conjunto de técnicas manejadas en esta disciplina matemática. De una forma especial, este esquema nos ayudará a ver la conexión entre el nivel teórico y formal de esta materia y su importantísimo nivel aplicado.