análisis de supervivencia
en muchos estudios, la variable principal de interés es un retraso, como el tiempo desde el diagnóstico de cáncer hasta un evento particular de interés., Este evento puede ser la muerte, y por esta razón el análisis de tales datos a menudo se conoce como análisis de supervivencia. El evento de interés puede no haber ocurrido en el momento del análisis estadístico, y del mismo modo, un sujeto puede perderse para el seguimiento antes de que se observe el evento. En tal caso, se dice que los datos son censurados en el momento del análisis o en el momento en que el paciente se perdió para el seguimiento. Los datos censurados todavía traen alguna información ya que aunque no sabemos la fecha exacta del evento, sabemos que ocurrió más tarde que la hora de censura.,
tanto el método de Kaplan-Meier como el modelo de riesgos proporcionales (pH) de Cox permiten analizar datos censurados , y estimar la probabilidad de supervivencia, S(t), es decir, la probabilidad de que un sujeto sobreviva más allá de algún tiempo t. estadísticamente, esta probabilidad es proporcionada por la función de supervivencia S(t) = P (T > t), donde T es el tiempo de supervivencia. El método de Kaplan Meier estima la probabilidad de supervivencia no paramétricamente, es decir, asumiendo ninguna función subyacente específica ., Hay varias pruebas disponibles para comparar las distribuciones de supervivencia entre los grupos, incluidas las pruebas log-rank y Mann-Whitney-Wilcoxon . El modelo de pH de Cox tiene en cuenta múltiples factores de riesgo simultáneamente. No postula ninguna distribución, ni forma para la función de supervivencia, sin embargo, la tasa de incidencia instantánea del evento se modela en función del tiempo y los factores de riesgo.,
la tasa de riesgo instantáneo en el tiempo t, también llamada incidencia instantánea, muerte o tasa de fracaso, o riesgo, es la probabilidad instantánea de experimentar un evento en el tiempo t, dado que el evento aún no ha ocurrido. Es una tasa de evento por unidad de tiempo, y se permite variar con el tiempo. Al igual que el riesgo de eventos por unidad de tiempo, se puede hacer una analogía considerando la velocidad dada por un velocímetro de automóvil, que representa la distancia recorrida por unidad de tiempo. Supongamos, que el evento de interés es la muerte, y estamos interesados en su asociación con n covariables, X1, X2,…,, Xn, entonces el peligro viene dado por:
La tasa de peligro basal h0(t) es una función no negativa no especificada del tiempo. Es la parte del riesgo dependiente del tiempo y corresponde a la tasa de riesgo cuando todos los valores de covariables son iguales a cero. β1, β2, …, ßn son los coeficientes de la función de regresión ß1×1 + ß2×2+… ßnxn., Supongamos que estamos interesados en una sola covariable, entonces el peligro es:
tomando x2 = x1 + 1, el Hazard ratio reduce a hr = EXP(β) y corresponde al efecto de un aumento de unidad en la variable explicativa X sobre el riesgo de Evento. Dado que β = log (HR), β se conoce como el log hazard ratio. Aunque se permite que la tasa de riesgo HX(t) varíe con el tiempo, la razón de riesgo HR es constante; Esta es la suposición de riesgos proporcionales., Si la FC es mayor que 1 (β > 0), el riesgo de eventos aumenta para los sujetos con valor de covariable x2 En comparación con los sujetos con valor de covariable x1, mientras que una FC inferior a 1 (β < 0) indica una disminución del riesgo. Cuando la FC no es constante en el tiempo, se dice que la variable tiene un efecto variable en el tiempo; por ejemplo, el efecto de un tratamiento puede ser fuerte inmediatamente después del tratamiento, pero se desvanece con el tiempo. Esto no debe confundirse con una covariable variable en el tiempo, que es una variable cuyo valor no se fija en el tiempo, como el tabaquismo., De hecho, una persona puede ser un no-fumador, un fumador, no fumador. Sin embargo, tenga en cuenta que una variable puede variar en el tiempo y tener un efecto que cambia con el tiempo.
en un modelo de pH de Cox, La FC se estima considerando cada vez t en que ocurre un evento. Al estimar la FC Global durante el período de seguimiento completo, se dan los mismos pesos a la FC muy temprana que afecta a casi todos los individuos y a la FC muy tardía que afecta solo a los muy pocos individuos que aún están en riesgo. Por lo tanto, la FC se promedia a lo largo de los tiempos del evento., En caso de riesgos proporcionales, este procedimiento de ponderación no afecta a la FC Global. Si, por otro lado, la FC cambia con el tiempo, es decir, las tasas de riesgo no son proporcionales, la ponderación igual puede dar lugar a una FC no representativa y puede producir resultados sesgados . Cabe señalar que la FC se promedia sobre los tiempos del evento en lugar de sobre el tiempo de seguimiento. No cambia si se cambia la escala de tiempo sin alterar el orden de los eventos.,
ejemplo
aplicamos algunos de los métodos presentados a pacientes con cáncer de mama, ya que se han reportado efectos variables en el tiempo, como el estado de los receptores ganglionares o hormonales . Estudiamos a mujeres con cáncer de mama operable no metastásico que se sometieron a cirugía entre 1989 y 1993 en nuestra institución y que no recibieron tratamiento neoadyuvante previo. Los criterios de exclusión incluyeron antecedentes de carcinoma de mama, cáncer de mama contralateral concurrente y falta de datos patológicos., El seguimiento se realizó de acuerdo con los requisitos europeos de Buenas Prácticas Clínicas y consistió en exámenes físicos regulares, mamografía radiográfica anual y evaluaciones adicionales en caso de sospecha de metástasis. Las características clínicas y patológicas fueron analizadas de acuerdo con la ficha hospitalaria registrada en el momento del inicio del tratamiento. Se midió el tamaño patológico del tumor (≤ o > 20 mm) en muestras quirúrgicas frescas. Se utilizó una versión modificada del sistema de clasificación Scarff-Bloom-Richardson (SBR grado I, II o III)., PVI (sí, No) se definió como la presencia de émbolos neoplásicos dentro de la lumina vascular linfática o capilar inequívoca en áreas adyacentes al tumor de mama. Se realizaron análisis inmunohistoquímicos exploratorios en un microarray tisular (TMA) para evaluar el estado del receptor hormonal (HRec) (positivo si ER positivo y/o receptor de progesterona positivo). Los niveles de expresión de ER y PgR se evaluaron semicuantitativamente de acuerdo con un protocolo estándar con valores de corte en 10% de células tumorales positivas. El nivel de expresión de Her2 se evaluó según el sistema de puntuación de Herceptest ., El nivel de expresión de Mib1 se evaluó semicuantitativamente. Se dispuso de información sobre todos los factores para 979 mujeres (Cuadro 1). La mediana del tiempo de seguimiento fue de 14 años (intervalo de confianza del 95%: 13,7-14,2) y 264 mujeres presentaron metástasis.
ejemplo práctico
los factores pronósticos se seleccionaron inicialmente con base en el conocimiento actual sobre el riesgo de metástasis., A continuación se analizaron mediante un modelo convencional de regresión de Cox; todos fueron estadísticamente significativos en el nivel del 5% en los análisis univariados, y luego se introdujeron en un modelo multivariado de Cox., El riesgo de metástasis se incrementó en mujeres de menor edad en comparación con las de mayor edad; tumores de grado II y III en comparación con tumores de grado I; tumores grandes en comparación con tumores pequeños; afectación de los ganglios linfáticos en comparación con no afectación; y PVI en comparación con no PVI (archivo adicional 1: log hazard ratios (log(HR)) y hazard ratios (HR = exp()) con intervalos de confianza del 95% (IC del 95%) y valores de p para covariables modelo cuando se ajustaba a un modelo de Cox convencional multivariable y un modelo de Cox con interacciones tiempo por covariable.)., Con base en este modelo, todas las variables, excepto el receptor hormonal, el estado de Her2 y Mib1, afectaron significativamente el riesgo de metástasis.
evaluación de la no proporcionalidad: estrategia gráfica
en presencia de una variable categórica, se puede trazar la distribución de supervivencia de Kaplan-Meier, S(t), en función del tiempo de supervivencia, para cada nivel de la covariable. Si se cumple la suposición de PH, las curvas deben separarse constantemente., También se puede aplicar una transformación de las curvas de supervivencia de Kaplan-Meier y trazar el log de la función (- log (S (t))) como una función del tiempo de supervivencia del log, donde log representa la función logaritmo natural. Si los riesgos son proporcionales, las parcelas log-menos-log específicas del estrato deben mostrar diferencias constantes, es decir, aproximadamente paralelas. Estos métodos visuales son fáciles de implementar, pero tienen limitaciones. Cuando la covariable tiene más de dos niveles, las gráficas de Kaplan-Meier no son útiles para discernir la no proporcionalidad porque las gráficas se vuelven demasiado desordenadas ., Del mismo modo, aunque la suposición de PH no puede ser violada, las curvas log-menos-log rara vez son perfectamente paralelas en la práctica, y tienden a ser escasas en puntos de tiempo más largos, y por lo tanto menos precisas. No es posible cuantificar qué tan cerca de paralelo está lo suficientemente cerca, y por lo tanto cuán proporcionales son los peligros. La decisión de aceptar la hipótesis de PH a menudo depende de si estas curvas se cruzan entre sí. Como resultado, la decisión de aceptar la hipótesis de PH puede ser subjetiva y conservadora, ya que se debe tener evidencia fuerte (líneas de cruce) para concluir que se viola la suposición de PH., En vista de estas limitaciones, algunos sugieren proporcionar errores estándar a estas parcelas . Sin embargo, este enfoque puede ser computacionalmente intensivo y no está directamente disponible en los programas informáticos estándar. Las gráficas Kaplan-Meier y log-minus-log están disponibles en la mayoría de los paquetes estadísticos estándar (Tabla 2).
ejemplo de trabajo (cont’)
Las curvas de supervivencia de Kaplan-Meier y los gráficos log-minus-log se muestran para algunas variables (Figuras 1 y 2)., Las curvas de supervivencia de Kaplan-Meier parecían separarse constantemente para todos, excepto el estado de los receptores hormonales, el estado de Her2 y el estado de mib1. Las gráficas logaritmo-menos logaritmo parecían aproximadamente paralelas para la edad, el tamaño del tumor, la afectación de los ganglios linfáticos y el IVP. Una vez más, las gráficas para el estado del receptor hormonal, el estado Her2 y el estado mib1 tendieron a indicar una violación de la suposición de PH. También hubo algunas sospechas con respecto al grado SBR.,
evaluación de la no proporcionalidad: estrategias de modelización y pruebas
los métodos gráficos para verificar el supuesto de PH no proporcionan una prueba diagnóstica formal, y se requieren abordajes confirmatorios. Existen múltiples opciones para probar y contabilizar la no proporcionalidad.
Cox propuso evaluar la desviación de la no proporcionalidad mediante la introducción de una variable construida dependiente del tiempo, es decir, agregar un término de interacción que involucra tiempo al modelo de Cox, y probar su significación ., Supongamos que uno está interesado en evaluar si alguna variable X tiene un efecto variable en el tiempo. Una variable dependiente del tiempo se crea formando un término de interacción (producto) entre el predictor, X (continuo o categórico), y una función de tiempo t (f(t) = t, t2, log(t),…). Añadiendo esta interacción al modelo (ecuación 2), el riesgo se convierte entonces en:
la razón de riesgo viene dada por HR(t) = hx+1(t)/hx(t) = exp para un aumento unitario en la variable X, y es dependiente del tiempo a través de la función f(t)., Si γ >0 (γ < 0), entonces el HR Aumenta (Disminuye) con el tiempo. El ensayo de no proporcionalidad de los peligros equivale al ensayo si γ es significativamente diferente de cero. Uno puede usar diferentes funciones de tiempo como polinomio o decaimiento exponencial, pero a menudo se prefieren funciones fijas de tiempo muy simples como funciones lineales o logarítmicas . Este enfoque de modelado también proporciona estimaciones de la razón de riesgo en diferentes puntos de tiempo, ya que los valores t de tiempo pueden ajustarse a la función de razón de riesgo., Las variables dependientes del tiempo proporcionan un método flexible para evaluar la desviación de la no proporcionalidad y un enfoque para construir un modelo para la dependencia del riesgo relativo a lo largo del tiempo. Sin embargo, este enfoque debe utilizarse con precaución. De hecho, si la función del tiempo seleccionado está mal especificada, el modelo final no será apropiado. Esta es una desventaja de este método sobre un enfoque más flexible.
ejemplo de trabajo (cont’)
creamos interacciones tiempo por covariable para cada variable del modelo, introduciendo productos entre las variables y una función lineal del tiempo., Como se muestra en el archivo adicional 1 (ÍNDICE DE RIESGO log estimado(log (HR)) y índice de riesgo (HR = exp ()) con intervalos de confianza del 95% (IC del 95%) y valores de p para las covariables del modelo cuando se ajusta un modelo de Cox convencional multivariable y un modelo de Cox con interacciones tiempo por covariable.), las interacciones significativas de tiempo por covariable involucraron el grado SBR, el estado del receptor hormonal, el estado Her2 y el PVI (p < 0.05). Por lo tanto, estos resultados indicaron que las razones de riesgo asociadas con estos factores no fueron constantes a lo largo del tiempo., Los parámetros () asociados con la mayoría de las interacciones fueron negativos, lo que sugiere que las razones de riesgo fueron disminuyendo con el tiempo. El hazard ratio estimado asociado a un SBR grado II (frente a grado I) en función del tiempo t fue dado por: HR(t) = exp(1,71 – 0,14 t). Los Hazard ratios fueron de 4,8, 3,6 y 2,7 a 1, 3 y 5 años respectivamente. De manera similar, la razón de riesgo estimada relacionada con el estado del receptor hormonal fue: HR(t) = exp(0,73 – 0,14 t), es decir, razones de riesgo de 1,8, 1,3 y 1,0 a 1, 3 y 5 años respectivamente., Mientras que el modelo convencional de Cox no mostró ningún efecto significativo para los receptores hormonales, Her2 y Mib1, estas variables tuvieron un efecto significativo una vez que se incluyeron las interacciones tiempo por covariable.
La desviación de la no proporcionalidad también se puede investigar utilizando los residuos del modelo. Un residual mide la diferencia entre los datos observados y los datos esperados bajo el supuesto del modelo. Los residuos de Schoenfeld se calculan y notifican en cada momento de fallo bajo el supuesto de PH, y como tal no se definen para los sujetos censurados ., Se definen como el valor covariable para el individuo que falló menos su valor esperado asumiendo las hipótesis de la retención del modelo. Existe un residual para cada individuo, para cada covariable. Una gráfica suave de los residuos de Schoenfeld se puede utilizar para visualizar directamente la relación de riesgo logarítmica . Asumiendo la proporcionalidad de los peligros, los residuos de Schoenfeld son independientes del tiempo. Por lo tanto, una trama que sugiere un patrón no Aleatorio contra el tiempo es evidencia de no proporcionalidad., Gráficamente, este método es más confiable y más fácil de interpretar que trazar la función log(-log(s(t)) presentada anteriormente. La presencia de una relación lineal con el tiempo se puede probar mediante la realización de una regresión lineal simple y una tendencia de prueba. Una pendiente significativamente diferente de cero sería una prueba contra la proporcionalidad: una tendencia creciente (decreciente) indicaría una razón de riesgo creciente (decreciente) con el tiempo., Se recomienda observar cuidadosamente la gráfica residual además de realizar esta prueba, ya que algunos patrones pueden ser evidentes en las gráficas (cuadráticas, logarítmicas), pero permanecen sin ser detectados por la prueba estadística. Además, la influencia indebida de los valores atípicos podría hacerse evidente . Aunque el método basado en los residuos de Schoenfeld suavizados proporciona estimaciones dependientes del tiempo, puede tener algunos inconvenientes ., Las estimaciones de incertidumbre asociadas con las estimaciones dependientes del tiempo resultantes pueden ser difíciles de usar en la práctica, y el estimador proporcionado puede no tener buenas propiedades estadísticas, como la consistencia. Es importante destacar que los valores p resultantes de las pruebas de tendencia basadas en los residuos de Schoenfeld se obtienen de forma independiente para cada covariable del modelo, asumiendo que el modelo de Cox está justificado para las otras covariables del modelo; como tal, los resultados deben interpretarse con cuidado. Las pruebas basadas en los residuos de Schoenfeld se pueden implementar fácilmente en la mayoría de los paquetes estadísticos estándar (Tabla 2).,
ejemplo de trabajo (cont’)
para cada covariable, se trazaron los residuos de Schoenfeld escalados a lo largo del tiempo y se realizaron pruebas para una pendiente cero. Los valores de p correspondientes, así como el valor de p asociado a una prueba global de no proporcionalidad se presentan en la Tabla 3. La prueba global sugirió una fuerte evidencia de no proporcionalidad (p < 0.01). Las Variables que se consideraron más propensas a contribuir a la no proporcionalidad fueron el grado SBR (p < 0.01), PVI (p = 0.05) y el estado del receptor hormonal (p = 0.05)., Estos hallazgos numéricos sugieren un hazard ratio No constante para estas variables. Los residuos ayudan a visualizar el índice de riesgo logarítmico a lo largo del tiempo para cada covariable (figura 3). Agregamos líneas discontinuas y punteadas que representan respectivamente el efecto nulo (índice de riesgo logarítmico nulo) y el índice de riesgo logarítmico promedio estimado por el modelo convencional de Cox. Con respecto al grado SBR, las parcelas sugirieron un fuerte efecto durante los primeros cinco años. Este efecto tendió a disminuir después., Del mismo modo, el impacto de la IPV cambió con el tiempo, con riesgos nuevamente más altos de metástasis en los primeros años, y luego este efecto tendió a desaparecer. En cuanto al estado de los receptores hormonales, los gráficos indicaron que un estado negativo aumentaba el riesgo de metástasis al principio y se convertía en protector después.
The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., Gráficamente, el proceso de puntuación observado se representa versus tiempo para cada variable del modelo, junto con los procesos simulados asumiendo que el modelo de Cox subyacente es verdadero, es decir, asumiendo riesgos proporcionales. Cualquier desviación del proceso de puntuación observado de los simulados es evidencia en contra de la proporcionalidad. Estas parcelas se pueden utilizar para evaluar cuando la falta de ajuste está presente. En particular, una puntuación observada muy por encima del proceso simulado es una indicación de un efecto superior al promedio, y viceversa., Este método está particularmente bien ilustrado en una publicación reciente de Cortese et al. . Las pruebas de bondad de ajuste se pueden implementar en función de los residuos acumulados. El enfoque basado en residuos acumulativos supera algunos inconvenientes encontrados con los residuos de Schoenfeld, ya que los estimadores resultantes tienden a tener mejores propiedades estadísticas, y se derivan valores p justificados . El enfoque de residuos acumulativos se aplica en algunos paquetes estadísticos estándar (Cuadro 2).
ejemplo de trabajo (cont’)
Las pruebas basadas en residuos acumulados se presentan en la Tabla 4., Al nivel de significación del 5%, las estadísticas de las pruebas indican un efecto no constante en el tiempo para el grado del tumor, así como el estado de los receptores hormonales, her2 y Mib1. Para la ilustración, también trazamos el proceso de puntuación resultante Para algunas variables (Figura 4). De acuerdo con las estadísticas de la prueba basadas en los residuos acumulativos, observamos una fuerte desviación de los procesos observados de las curvas simuladas bajo el modelo para el grado y el estado del receptor hormonal. Estas parcelas son particularmente útiles para identificar dónde está presente la falta de ajuste., Por ejemplo, el proceso inicial de puntuación positiva asociado con los receptores hormonales, sugiere que el efecto de esta variable es inicialmente más alto que el efecto promedio, y por lo tanto más bajo que el efecto promedio posterior. Es decir, el riesgo de metástasis aumenta inicialmente para las mujeres con ambos receptores hormonales negativos en comparación con el riesgo promedio, y disminuye después.
otro enfoque simple para probar los efectos variables en el tiempo de las covariables implica ajustar diferentes modelos de Cox para diferentes períodos de tiempo. De hecho, aunque la suposición de PH puede no mantenerse durante todo el período de seguimiento, puede mantenerse durante un período de tiempo más corto., A menos que haya un interés en un valor de tiempo de corte particular, se pueden crear dos subconjuntos de datos basados en la mediana del tiempo del evento . Es decir, un primer análisis se lleva a cabo censurando a todos los que aún están en riesgo más allá de este punto de tiempo, y un segundo considerando solo aquellos sujetos que aún están en riesgo después. En tal caso, la interpretación de los modelos está condicionada a la duración del tiempo de supervivencia, por lo que los resultados deben interpretarse con cautela., Incluso si el período de análisis se acorta, uno debe asegurarse de que la suposición de PH no se viole dentro de estos períodos de tiempo reducidos. Además, dado que se consideran menos tiempos de Eventos, Los análisis pueden sufrir una disminución de la potencia. Finalmente, aunque este método es particularmente fácil de implementar y podría proporcionar información suficiente en algunos entornos, es decir, si uno está interesado en un corto período de tiempo, debe tenerse en cuenta que este método no está probando directamente la suposición de PH, y se necesitaría una parametrización diferente para realizar tal prueba.,
ejemplo de trabajo (cont’)
la mediana del tiempo del evento fue de 4,3 años. Se aplicó un modelo de Cox censurando a todos los sujetos que seguían en riesgo después de 4,3 años, mientras que solo aquellos sujetos que seguían en riesgo más allá de este punto de tiempo se incluyeron en otro modelo (archivo adicional 2: razón de riesgo estimada (exp()) con intervalos de confianza del 95% (IC del 95%) y valores de p para las covariables del modelo en dos modelos independientes de Cox para dos períodos de tiempo diferentes.)., Todas las variables, excepto la edad, fueron estadísticamente significativas en el primer modelo, ya que el estado negativo de los receptores hormonales, el estado positivo de Her2 y el estado positivo de Mib1 se relacionaron con un aumento del riesgo de metástasis. En las mujeres que aún tenían riesgo después de 4,3 años, la edad más joven, el mayor tamaño del tumor y el compromiso de los ganglios linfáticos se relacionaron con un aumento del riesgo de metástasis. Los efectos de otras variables han desaparecido. Curiosamente, el estado negativo del receptor hormonal tuvo un efecto protector significativo en este segundo modelo (HR = 0.,5), mientras que el primer análisis sugirió un aumento significativo del riesgo para (HR = 1,7). Las pruebas de no proporcionalidad basadas en los residuos acumulativos sugirieron un efecto persistente variable en el tiempo del grado para el análisis restringido a los primeros 4,3 años.
también es posible tener en cuenta la no proporcionalidad mediante la partición del eje temporal propuesto por Moreau et al. . El eje de tiempo se divide y las razones de riesgo se estiman dentro de cada intervalo. Por lo tanto, las pruebas de no proporcionalidad equivalen a las pruebas si las HR específicas del tiempo son significativamente diferentes., Sin embargo , los resultados a veces pueden ser impulsados por el número de intervalos de tiempo, y los intervalos de tiempo deben seleccionarse cuidadosamente.
abandonar el supuesto de riesgos proporcionales, y como tal, el modelo de Cox, es otra opción. De hecho, se dispone de otros modelos estadísticos poderosos para tener en cuenta los efectos que varían en el tiempo, incluidos los modelos aditivos, los modelos de tiempo de falla acelerada, los modelos de splines de regresión o los polinomios fraccionados .,
finalmente, se puede realizar un análisis estadístico estratificado por la variable sospechosa de tener un efecto variable en el tiempo; esta variable debe ser por lo tanto categórica o categorizada. Cada estrato k tiene un peligro basal distinto, pero los valores comunes para el vector de coeficiente β, es decir, el peligro para un individuo en el estrato k es hk(t) = exp(ßx) la estratificación asume que las otras covariables actúan de la misma manera en cada estrato, es decir, HRs son similares en todos los estratos., Aunque la estratificación es eficaz para eliminar el problema de la no proporcionalidad y fácil de implementar, tiene algunas desventajas. Más importante aún, la estratificación por una variable no proporcional impide la estimación de su fuerza y su prueba dentro del modelo de Cox. Por lo tanto, este enfoque debe ser seleccionado si uno no está directamente interesado en cuantificar el efecto de la variable utilizada para la estratificación., Por otra parte, un modelo de Cox estratificado puede conducir a una pérdida de potencia, porque más de los datos se utilizan para estimar las funciones de peligro separadas; este impacto dependerá del número de sujetos y estratos . Si hay varias variables con riesgos que varían en el tiempo, esto requeriría que el modelo se estratifique sobre estos múltiples factores, lo que de nuevo es probable que disminuya la potencia general.