Archivo de la categoría: ARTÍCULOS DE MEDICINA COMENTADOS

Artículo 15: Traditional and Emerging lifestyle risk behaviors and all-cause mortality in middle-aged and older adults

Se trata de un artículo muy interesante desde el punto de vista estadístico por la enorme masa de datos que maneja y la gran capacidad que tiene de ir articulando diferentes agrupaciones buscando su relación con la mortalidad.

El abstract es el siguiente:

Captura de pantalla 2016-03-05 a las 8.51.49

Durante seis años de seguimiento de 231048 personas se ha podido establecer cuáles son los riesgos de mortalidad en función de una serie de estilos de vida que se analizaron en todos estas personas. Los comportamientos analizados han sido: Fumar, beber alcohol, tipo de alimentación, actividad física, comportamiento sedentario y horas de dormir.

Los resultados de riesgos se establecen mediante la Hazard ratio (HR). La significación la obtenemos del intervalo de confianza.

La HR es una relación entre las funciones de riesgo de mortalidad de dos grupos que se quieren relacionar. Estas funciones son el reverso de las llamadas curvas de supervivencia. Una HR de 1 ó, aunque no sea 1 exactamente, si su intervalo de confianza contiene al 1, indica que los miembros de los dos grupos tienen el mismo riesgo de morir. Si la HR es mayor que 1 significativamente (el intervalo de confianza no contiene al 1) será que el grupo estudiado, respecto al grupo referencia, tiene más riesgo de morir. Tanto mayor, claro, cuanto más grande sea esa HR. Si fuera menor que 1, significativamente (sin contener al 1 su intervalo de confianza) entonces indicaría un grupo protector de la mortalidad.

Los distintos comportamientos y su relación de riesgo respecto al grupo de referencia lo muestra la siguiente ilustrativa tabla:

Captura de pantalla 2016-03-05 a las 8.53.16

Captura de pantalla 2016-03-05 a las 8.53.29

Captura de pantalla 2016-03-05 a las 8.53.40

Evidentemente esta fragmentación de la muestra en tantos grupos distintos únicamente es posible en muestras enormes como esta. Observemos que en esta fantástica tabla se pueden visualizar situaciones muy diferentes. A la derecha tenemos el porcentaje de personas que representa cada grupo respecto al total de la muestra. Y más a la derecha tenemos la HR con su intervalo de confianza que si no contiene al 1 se entiende como estadísticamente significativa.

En el artículo hay otra interesante forma de agrupar los datos. De los factores estudiados calculan un score según acumulen desde 0, 1, … , 6 factores de riesgo, según el siguiente criterio:

Captura de pantalla 2016-03-06 a las 8.43.17

Por lo tanto, pueden crear 7 grupos según el valor del score: 0, 1, 2, 3, 4, 5 y 6.

Entonces analizan los datos según diferentes grupos y según el valor del score:

Captura de pantalla 2016-03-06 a las 9.05.26

Captura de pantalla 2016-03-06 a las 9.05.39

Realmente se trata de un artículo extraordinario desde el punto de vista estadístico.

Artículo 14: Physical activity and risk of coronary heart disease and stroke in older adults

 

Se trata de un artículo de la revista Circulation que los autores realizan este magnífico resumen que muestro a continuación:

Captura de pantalla 2015-11-12 a las 11.12.14

De nuevo una magnífica oportunidad para practicar con diversos conceptos estadísticos.

Me parece, además, una enorme oportunidad para ver la capacidad comunicativa que han conseguidos los autores a la hora de sintetizar la información.

Este artículo es una magnífica oportunidad, de nuevo, para ver la importancia enorme que tiene la Regresión de Cox y, por lo tanto, la Hazard ratio, en Medicina. Observemos también que se ha ajustado, para evitar confusores, con las variables expuestas abajo y a la izquierda de la tabla.

Artículo 13: A randomized trial of intensive versus standard blood-pressure control

Este un artículo donde básicamente se comparan dos procedimientos de control de la presión arterial y se comparan esos dos procedimientos a través de una serie de variables resultados. El Abstract es el siguiente:

Captura de pantalla 2015-11-11 a las 15.41.15

La estadística descriptiva de los dos grupos comparados es la siguiente:

Captura de pantalla 2015-11-11 a las 15.41.42

Captura de pantalla 2015-11-11 a las 15.41.55

La evolución a lo largo del tiempo de estos dos métodos de control es la siguiente:

Captura de pantalla 2015-11-11 a las 15.42.14

Finalmente, podemos ver cuáles son las Hazard ratio de las curvas de supervivencia comparadas:

Captura de pantalla 2015-11-11 a las 15.42.25

Podemos ver a continuación las funciones de riesgo con las que se calcula la Hazard ratio:

Captura de pantalla 2015-11-11 a las 15.42.37

Artículo 12: The relationship between sweetened beverage consumption and risk of heart failure in men

Selecciono este artículo como un interesante ejemplo de aplicación de la Regresión logística. El abstract es el siguiente:

Captura de pantalla 2015-11-09 a las 20.42.05

La estadística descriptiva de los grupos estudiados:

Captura de pantalla 2015-11-09 a las 20.42.32

La curva de supervivencia aplicada aquí como tiempo hasta insuficiencia cardíaca si es que se produce:

Captura de pantalla 2015-11-09 a las 20.42.47

Y finalmente el cálculo de la Hazard ratio:

Captura de pantalla 2015-11-09 a las 20.42.59

 

Artículo 11: One-year outcome following biological or mechanical valve replacement for infective endocarditis

El siguiente artículo es una comparación entre las prótesis valvulares mecánicas y biológicas. Es interesante para ver la Regresión de Cox.

El abstract es el siguiente:

Captura de pantalla 2015-11-08 a las 10.02.42

La Estadística descriptiva es la siguiente:

Captura de pantalla 2015-11-08 a las 10.03.13

Se han hecho diferentes regresiones de Cox a partir de las curvas de supervivencia hasta el año. Las hazard ratio son las siguientes:

Captura de pantalla 2015-11-08 a las 10.03.47

Recordemos que la Hazard ratio lo que hace el medir la relación de riesgos, en este caso de muerte, durante el primer año, en la variable estudiada. Para compararlo con la Odds ratio puede consultarse el artículo Odds ratio versus Hazard ratio.

Obsérvese una curiosidad: En Odds ratio y en Hazard ratio la significación suele darse en términos de intervalo de confianza no mediante un p-valor. De hecho, la información es redundante. Si el intervalo no contiene al 1 el p-valor será menor que 0.05 y si lo contiene el p-valor será mayor que 0.05. Aquí curiosamente nos dan las dos cosas. Puede observarse que cuanto más se acerca el intervalo al 1 más se acerca el p-valor al 0.05. En este estudio se han seleccionado únicamente las relaciones significativas, por eso ningún intervalo contiene al 1 ni ningún p-valor es mayor que 0.05.

Obsérvese la siguiente tabla de otro estudio también de endocarditis donde se puede apreciar perfectamente esta redundancia que comento:

Captura de pantalla 2015-11-08 a las 10.34.05

Y finalmente veamos las curvas de supervivencia de los dos tipos de prótesis:

Captura de pantalla 2015-11-08 a las 10.04.20

Y estas son las curvas de supervivencia con la que se calcula la Hazard ratio de prótesis biológicas respecto a mecánicas que es 1,298. Recordemos que la Hazard ratio es una relación basada en las funciones de riesgo. La biológicas tienen mayor riesgo de muerte y por eso su curva de supervivencia va por debajo. No confundirse con esto.

 

Artículo 10: Excess mortality among persons with type 2 diabetes

Este es un artículo interesante para evaluar el papel de la hazard ratio como medida del riesgo. Es un complemento concreto a lo desarrollado en el tema dedicado a la Regresión de Cox.

El abstract de este artículo es el siguiente:

La estadística descriptiva de los dos grupos comparados es la siguiente:

En la siguiente tabla podemos ver la distribución de pacientes y de controles según edad y causas de muerte:

La tabla siguiente nos muestra las hazard ratio según edad:

A continuación tenemos las hazard ratio según edad y otros factores de riesgo y atendiendo a mortalidad por cualquier causa y a mortalidad por causa cardiovascular:

Y finalmente una nueva tabla con las hazard ratio según diferentes factores de riesgo:

 

Artículo 9: A randomized trial of social media from Circulation

Se trata de un artículo muy original de diciembre de 2014. Se trata de un ensayo para evaluar si las redes sociales pueden aumentar el acceso a los artículos de esta importante revista médica (Circulation).

El abstract es el siguiente:

IMG_0389

El objetivo es hacer un estudio randomizado comparando artículos a los que se les hace una importante difusión mediática con artículos a los que no se les hace tal difusión.

Observemos que, en abstracto, es como un ensayo clínico. Se toman artículos y al azar se los va asignando al grupo tratamiento (difusión especial mediática) o al grupo control (la difusión habitual). En lugar de trabajar con pacientes se trabaja con artículos médicos, pero formalmente es un procedimiento idéntico.

En la parte de análisis estadístico es importante la elección del tamaño de muestra. Miremos cómo está formulado:

IMG_0390

IMG_0391

Es interesante ver cómo se elige este tamaño de muestra (119 por grupo) delimitando una potencia del 90% para detectar una diferencia de un 20% o una potencia del 80% para detectar una diferencia del 17%. Partiendo del supuesto que uno de los grupos tenga un orden de visualizaciones de 560 de media y una desviación estándar de 265. Esto significa que buscan una diferencia mínima a detectar, para considerar que el “tratamiento” (su difusión por las redes sociales) es efectivo, de un 20%, como mínimo respecto al valor medio de acceso a esos artículos.

La media y la desviación estándar estiman que puede ser 560 y 265, respectivamente. Esto significa que entre las visualizaciones a los diferentes artículos de la revista hay este nivel de media y de dispersión. Estos número seguro que salen de informaciones previas que tenían del grado de impacto de los artículos publicados en esa revista.

El 20% de 560 es 112, por lo tanto, esta diferencia de 112, ó más, es lo que se esperaría ver para poder decir que hay una diferencia destacable. Por lo tanto, establecemos, a priori, que si hay realmente una diferencia de 112 ó más, entre los dos grupos, hemos de determinar el tamaño de muestra requerido para tener esta potencia del 90%; o sea, una probabilidad del 90% ó más de detectar tal diferencia como estadísticamente significativa.

Hay diferentes calculadores para realizar esta determinación. A mí con el GRANMO (http://www.imim.cat/ofertadeserveis/software-public/granmo/) me sale que es 118 el tamaño necesario, pero esta diferencia puede ser atribuible a un distinto calculador usado. Observemos la entrada de datos necesaria en la versión del GRANMO para i-phone, para determinar el tamaño de muestra de este ensayo:

IMG_0398

El riesgo beta es 0.1 porque para detectar una diferencia del 20% se quiere tener una potencia del 90%. La potencia es 1-Beta pasado a tanto por ciento. En nuestro caso, 1-0.1=0.9, multiplicado por 100 es, entonces, 90%. El resultado obtenido con la calculadora es el siguiente:

IMG_0399

Al final los autores toman muestras de 121 y 122, respectivamente, por grupo.

Comparan los dos grupos para comprobar que se trata de dos grupos de artículos homogéneos:

IMG_0392

Como puede verse, es así. Se trata de dos grupos de artículos muy similares. Es importante comprobarlo para evitar atribuir las posibles diferencias a variables que nos confundan. No obstante, la randomización acostumbra a generar, por el azar usado, grupos homogéneos, especialmente si el tamaño de muestra es considerable.

Ahora se trata, pues, ya, de evaluar los accesos a esos artículos seleccionados, a los artículos de los dos grupos del ensayo, durante un tiempo, y, después, compararlos mediante la técnica de comparación de dos poblaciones. En este caso como se trata de una variable continua, de dos muestras independientes y, según nos dicen los autores, de variables que no se ajustan a la distribución normal, usan una técnica no paramétrica, el Test de Mann-Whitney o el Test de Wilcoxon de la suma de rangos. Los resultados son los siguientes:

IMG_0395

Nos muestran, los autores, los intervalos de las diferencias de medianas en el total y en distintos subgrupos de artículos. Como podemos ver se trata de diferencias no estadísticamente significativas. Los intervalos de confianza de las diferencias de medianas incluyen siempre al 0, lo que indica que se trata de diferencias no estadísticamente significativas.

La conclusión de los autores es que la propaganda a través de las redes sociales no incrementa los accesos a este tipo de artículos, que los profesionales acceden a ellos por otros canales de interés.

 

Artículo 8: HDL cholesterol efflux capacity and incident cardiovascular events

Este es un artículo publicado en el New England Journal of Medicine el 18 de Noviembre de 2014.

Es un artículo que estudia la controversia entre si es el valor de HDL estático o bien su capacidad dinámica de eflujo de colesterol de los macrófagos lo que tiene una relación inversa con la incidencia de eventos cardiovasculares.

Este artículo es también interesante, desde el punto de vista estadístico, para aprender a manejar variables cuantitativas categorizándolas en distintos grupos, como veremos a continuación.

El Abstract es el siguiente:

IMG_0295-0

De un total de 2924 participantes en el estudio midieron analíticamente la capacidad de eflujo de colesterol y dividieron a esa muestra en cuatro cuartos según el valor de esa capacidad de eflujo. A continuación puede verse la estadística descriptiva de estos cuatro grupos:

IMG_0296-0

IMG_0297-0

El siguiente paso es mostrar que el nivel de HDL y el eflujo de colesterol son variables no correlacionadas:

IMG_0303

A continuación se trata de ver que es la capacidad del HDL para el eflujo de colesterol y no el valor de HDL estático el que está asociado, de forma favorable, con los eventos cardiovasculares; o sea, que es el factor de protección para tales eventos:

IMG_0299-0

Observemos que la Hazard Ratio de la relación del nivel de HDL con los eventos cardiovasculares no es significativamente distinta de 1. Sin embargo, la del eflujo de colesterol sí lo es. Su intervalo de confianza no incluye al 1 y está por debajo de 1, lo que indica que un eflujo de colesterol mayor va asociado de una protección ante tal tipo de eventos. En cambio, no sucede así con los niveles de HDL, indicando que no son ellos, en sí los que son protectores sino su capacidad de movilizar el colesterol de los macrófagos.

Observemos, a continuación, la distinta asociación entre los cuatro cuartiles de la variable cuantitativa “eflujo de colesterol” y los eventos cardiovasculares:

IMG_0300-0

Y observemos, finalmente, a continuación, los gráficos de las curvas de Kaplan-Meier expresadas como funciones de riesgo:

IMG_0301-0

IMG_0302-0

Es interesante ver estos gráficos y saberlos interpretar. Es interesante porque ello nos puede llevar a saber combinar nociones tan importantes en la investigación clínica en Medicina como “curvas de supervivencia”, “funciones de riesgo” y “Hazard ratio”.

Unos artículos del Blog son recomendables para poder entender bien estos resultados: Para ver el concepto de curva de supervivencia, estimador de Kaplan-Meier y función de riesgo ir al artículo: Tema 25: Análisis de supervivencia. Para ver el concepto de Hazard Ratio y sus similaridades y diferencias con el concepto de Odds ratio ir al artículo: Odds ratio y Hazard ratio. Para ver la conexión entre Hazard ratio, curvas de supevivencia y funciones de riesgo ir al artículo: Tema 22: Regresión de Cox.

Se puede observar en los gráficos la presencia del Log-rang test. Es un test estadístico para contrastar la hipótesis de igualdad de curvas de supervivencia o de igualdad de funciones de riesgo. Vemos que en ambos casos, en ambas comparaciones, de los gráficos anteriores, el p-valor es inferior a 0.05, lo que indica que esas curvas no son iguales significativamente.

Artículo 7: Glycemic control and excess mortality in type 1 diabetes

En este artículo publicado en el New England Journal of Medicine en este año 2014 se realiza un importante estudio de la relación y la cuantificación del riesgo de mortalidad en general y mortalidad por causas cardiovasculares en función del nivel de control de la glucemia en diabéticos tipo 1.

El Abstract es el siguiente:

IMG_0268

Observemos a continuación una tabla descriptiva de los diferentes grupos de estudio según el distinto nivel de control de la diabetes, evaluado mediante el nivel de Hemoglobina glicada:

IMG_0269

La siguiente tabla analiza la mortalidad en los diferentes grupos delimitados:

IMG_0270

En la tabla y gráfico siguiente se calcula la Hazard ratio según sexo y según grupo de edad, separando la muerte por cualquier causa de la muerte por causas cardiovasculares:

IMG_0271

La siguiente tabla es una tabla ajustada:

IMG_0272

Como puede verse los autores obtienen unas medidas del aumento relativo del riesgo de morir por cualquier causa o morir por causas cardiovasculares, en diabéticos tipo I. Los números, con sus correspondientes intervalos de confianza, estiman el aumento del riesgo. Por ejemplo, si tenemos una Hazard ratio, en la relación de dos grupos, de 3, significa que a lo largo del tiempo que se ha estudiado la mortalidad de ambos grupos el grupo con valor de 3 respecto al grupo referencia, la probabilidad de morir es tres veces mayor. Si a tiempo 1 la mortalidad en el grupo referencia es de 2/1000 en el grupo de estudio es de 6/1000 y si a tiempo 10 la mortalidad en el grupo referencia es de 10/1000 en el grupo de estudio es de 30/1000. Se mantiene constante esta relación (Esta es una condición para que la Regresión de Cox sea aplicable).

Es muy importante ver que al manejar la Hazard ratio estamos hablando de evolución temporal. Si el estudio se hiciera en un momento puntual determinado (por ejemplo, a los 10 años) manejaríamos la Odds ratio y aplicaríamos la Regresión logística.

En la siguiente tabla se dan valores de mortalidad según diferentes modelos:

IMG_0273

En este artículo es interesante ver cómo ensayan la comparación de distintos ajustes. ¿Qué significa ajustar? Significa evitar la incidencia de variables confusoras. Ver el Tema 26: Análisis estadístico de variables confusos. En este caso, como calculan las Hazard ratio, el ajuste lo hacen introduciendo las variables que quieran evitar la confusión en la Regresión de Cox necesaria para calcular esa Hazard ratio (Ver el Tema 22: Regresión de Cox).

Hay dos grandes formas de ajuste de un cálculo de riesgo (de una Odds ratio o de una Hazard ratio (Ver artículo La Odds ratio versus la Lazard ratio)):

1. Mediante el Propensity Score Analysis (Ver el Tema 24: Análisis de propensiones (Propensity Score Analysis).

2. Introduciendo la variable de ajuste en la Regresión logística o en la Regresión de Cox que se realice. La diferencia entre estas dos regresiones está fundamentalmente en que en la primera se mira el resultado a un tiempo fijo, por eso acabamos manejando una Odds ratio, mientras que en la segunda, en la Regresión de Cox, nos interesa la evolución, nos interesa analizar la curva de supervivencia o la función de riesgo, por eso acabamos manejando la Hazard ratio.

Artículo 6: Chimpanzee adenovirus vector Ebola vaccine. Preliminary report

Se trata de un artículo que acaba de publicarse (el 26 de noviembre de 2014) en el New England Journal of Medicine. Es un muy interesante estudio, en fase 1, de una vacuna para el Ébola.

El Abstract es el siguiente:

IMG_0285

He elegido este artículo para comentarlo porque es una buena herramienta para repasar la elección de la técnica adecuada al caso en la comparación de dos poblaciones. Y, en general,  es, a mi modo de ver, muy apropiado para ver el uso de técnicas estadísticas en contextos concretos de investigación. Veamos el apartado de Métodos estadísticos del artículo:

IMG_0286

IMG_0287

 

Observemos las técnicas usadas y su contexto. Se trabaja con diferentes variables respuesta: algunas dicotómicas (Respuesta positiva o no) y algunas continuas (Cantidad de anticuerpos). Se comparan en algunos casos muestras independientes (cuando se comparan los dos grupos con dos dosis distintas de vacuna) y en algunos otros casos se comparan muestras relacionadas, muestras apareadas, porque se analiza, en estos casos, el mismo individuo en momentos temporales diferentes para ver la evolución de alguna variable respuesta a lo largo del tiempo.

Se habla del Test exacto de Fisher, cuando se comparan variables dicotómicas y muestras independientes. Se habla también del uso del Test de la t de Student, cuando se comparan variables cuantitativas de muestras independientes. Finalmente se habla de un tercer tipo de análisis de comparación: el Test de Wilcoxon, cuando se trabaja con variables continuas y muestras relacionadas o apareadas.

Para ver las decisiones que hay que tomar para la elección de la técnica adecuada al caso en la comparación de dos poblaciones ver el Tema 14: Comparación de dos poblaciones y para practicar con casos ver los artículos Situaciones de comparación en Ciencias de la salud y Soluciones a las situaciones de comparación de dos poblaciones.

Viendo este Tema 14 se podrá apreciar que la decisión de usar el Test exacto de Fisher es por tratarse de una variable dicotómica, por comparar muestras independientes y por ser el tamaño de muestra menor de 30 por grupo (el tamaño muestral es 10 por grupo).

Podrá apreciarse, también, que se usa el test de la t de Student en las variables continuas y con muestras independientes. Se habrá comprobado el ajuste a la distribución normal y la igualdad de varianzas de ambas muestras. Realmente si se observan los datos (la ventaja de este artículo, a efectos didácticos, es que nos muestran, en los gráficos, los valores muestrales concretos) en las comparaciones de ambos grupos (alta y baja dosis), a un mismo tiempo, la normalidad se intuye perfectamente y también la igualdad de varianzas. Observad la Figura 2 y comparad, en cada uno de los tres gráficos, los dos grupos en la semana 2 y los dos grupos en la semana 4: podréis observar que los valores muestras se ajustan bien a la distribución normal: la mayoría próximos a la media y simétricos respecto a ésta. Y la dispersión de las muestras comparadas, en cada caso, es del mismo orden. Esto es lo que les lleva a aplicar en estas comparaciones el Test de la t de Student de muestras independientes y varianzas iguales.

Finalmente, podrá apreciarse el uso del test de Wilcoxon al comparar variables continuas en muestras relacionadas, en muestras apareadas. En este caso se está comparando las semanas entre sí dentro de un mismo grupo para evaluar la significación de la respuesta a lo largo del tiempo. Viendo los datos de esa evolución temporal es creíble pensar que no haya normalidad en la variable diferencia entre los tiempos comparados. Por eso se han inclinado por usar esta técnica “no paramétrica” en lugar del test de la t de Student de datos apareados.

También se habla de establecer una relación entre variables. Aquí interviene la correlación, en concreto la correlación de Spearman. Ver el Tema 5: Correlación. Se trata de ver si existe una relación directa (positiva) o inversa (negativa) en la respuesta evaluada mediante variables diferentes. En concreto se pretende cuantificar el grado de relación que hay en la respuesta mediante anticuerpos y mediante células T.

Una cosa que puede sorprender es que se hable de Media geométrica muestral, en lugar de Media muestral. La media geométrica es la raíz cuadrada del producto de los valores muestrales. Su uso es frecuente cuando los datos presentan valores que al aumentar el valor de la variable aumenta exponencialmente la magnitud de dicho valor; o sea, en variables que es recomendable transformarlas a escala logarítmica, como sucede en este artículo y puede apreciarse en la figura 2. Recordemos una relación importante: El Logaritmo de la media geométrica de una muestra es igual a la media de los valores muestrales transformados a logaritmos. Al calcular la media geométrica en lugar a la media muestra lo que se hace es calcular la media muestral de los valores transformados logarítmicamente. Es una forma de darle menos peso a los valores que se disparan exponencialmente.

Como puede verse se trata de un artículo muy rico para ver diferentes situaciones y ver, también, diferentes técnicas a aplicar.

Previamente al análisis de comparación de los dos grupos con su evolución temporal, nos describen los dos grupos que se comparan:

IMG_0288

Veamos los cuadros de resultados:

IMG_0290

Y también:

IMG_0291

Los valores de media geométrica en la variable cuantitativa y los valores de porcentajes de respuesta en la variable dicotómica, son los siguientes:

IMG_0289