Regressão de Cox

Introdução, Análise Uni e Multivariada, Apresentação Gráfica e Descrição
Análise de Dados Ambientais

Luiz Diego Vidal Santos

REGRESSÃO DE COX — INTRODUÇÃO

Modelo de riscos proporcionais de Cox

A regressão de Cox (1972) é o modelo mais utilizado em análise de sobrevida para avaliar o efeito de múltiplas covariáveis sobre o tempo até o evento.

Por que Cox?

  • O teste log-rank compara grupos, mas não ajusta por confundidores
  • A regressão de Cox permite a análise multivariada
  • É um modelo semiparamétrico — não exige especificar a distribuição de \(S(t)\)

O modelo

\[h(t | X) = h_0(t) \cdot \exp(\beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_p X_p)\]

Componentes do modelo

  • \(h(t | X)\) — risco no tempo \(t\) dado as covariáveis
  • \(h_0(t)\) — risco basal (baseline hazard), não especificado
  • \(\beta_i\) — coeficientes das covariáveis
  • \(\exp(\beta_i)\)Hazard Ratio (HR) — a medida de efeito!

Pressuposto fundamental: riscos proporcionais

A razão de riscos entre dois grupos é constante ao longo do tempo:

\[\frac{h(t | X=1)}{h(t | X=0)} = \exp(\beta) = \text{constante}\]

Interpretação do Hazard Ratio (HR)

Regras de interpretação

  • HR = 1 → risco igual entre os grupos
  • HR < 1 → risco menor no grupo exposto (“proteção”)
  • HR > 1 → risco maior no grupo exposto (“risco”)

Quantificação

  • HR < 1: faça 1 − HR
    • Ex.: HR = 0,60 → 40% menor risco
  • HR entre 1 e 2: percentual
    • Ex.: HR = 1,35 → 35% maior risco
  • HR ≥ 2: múltiplos
    • Ex.: HR = 2,80 → 2,8× maior risco

Atenção à nomenclatura!

Modelo Exp(B)
Logística OR (Odds Ratio)
Poisson IRR (Incidence Rate Ratio)
Poisson Robusta RP (Razão de Prevalência)
Cox HR (Hazard Ratio)

O HR expressa a razão de riscos instantâneos entre os grupos, não razão de chances ou de incidência.

Exemplo

HR = 2,15 (IC 95%: 1,42–3,26; p < 0,001)

“O risco de óbito foi 2,15 vezes maior no grupo exposto (HR = 2,15; IC 95%: 1,42–3,26).”

REGRESSÃO DE COX — PRÁTICA

Análise univariada e multivariada

Estratégia de análise

  1. Análise univariada (bruta)
    • Testar cada covariável individualmente
    • Identificar candidatas com p < 0,20 (ou a priori)
  2. Análise multivariada (ajustada)
    • Incluir covariáveis selecionadas
    • Modelo final: variáveis com p < 0,05

No SPSS

Analisar → Sobrevivência → Regressão de Cox

  • Tempo: variável de tempo
  • Status: variável de evento (definir o valor do evento)
  • Covariáveis: preditores

No R

library(survival)

# Univariada
cox_uni <- coxph(Surv(tempo, status) ~ pred1,
                 data = dados)
summary(cox_uni)

# Multivariada
cox_multi <- coxph(
  Surv(tempo, status) ~ pred1 + pred2 + pred3,
  data = dados)
summary(cox_multi)

# HR e IC 95%
exp(coef(cox_multi))
exp(confint(cox_multi))

Saídas essenciais:

  • HR (Exp(B)), IC 95%, p-valor
  • Teste de verossimilhança global
  • Concordância (c-statistic)

Verificação dos pressupostos

Riscos proporcionais

O pressuposto central é que o HR é constante ao longo do tempo.

Como testar:

  1. Resíduos de Schoenfeld
    • Teste global e por variável
    • p > 0,05 → pressuposto atendido
  2. Gráfico log(-log)
    • Curvas paralelas → riscos proporcionais

No R

# Teste de Schoenfeld
cox.zph(cox_multi)
plot(cox.zph(cox_multi))

Resíduos de Schoenfeld — linhas suavizadas devem ser horizontais

Diagnósticos adicionais

Se o pressuposto for violado:

  • Estratificar pelo fator que viola → strata()
  • Incluir interação com o tempo
  • Considerar modelos de riscos não proporcionais (modelos flexíveis)

Outros diagnósticos

Diagnóstico Finalidade
Resíduos de Martingale Forma funcional das covariáveis
Resíduos de Deviance Observações influentes
dfbeta Influência de cada observação nos β
Concordância (c) Capacidade preditiva (0,5–1,0)

APRESENTAÇÃO GRÁFICA

Curvas ajustadas e Forest Plot

Curvas de sobrevida ajustadas

Curvas de sobrevida ajustadas por covariáveis do modelo de Cox

No R:

library(survminer)
ggadjustedcurves(cox_multi,
                 variable = "grupo",
                 data = dados)

Forest Plot

Representação visual dos HR e IC 95% de cada variável:

ggforest(cox_multi, data = dados)

Forest Plot — HR e IC 95% de cada variável do modelo de Cox multivariado

REGRESSÃO DE COX — DESCRIÇÃO

Como reportar

Modelo de descrição para artigos/relatórios

“Para identificar fatores associados ao tempo até [evento], utilizou-se o modelo de riscos proporcionais de Cox. Inicialmente, conduziu-se análise univariada para cada covariável. As variáveis com p < 0,20 na análise univariada foram incluídas no modelo multivariado. O pressuposto de riscos proporcionais foi verificado pelo teste de resíduos de Schoenfeld (p > 0,05 para todas as variáveis). Os resultados foram expressos por meio do Hazard Ratio (HR) com intervalos de confiança de 95%. O nível de significância adotado foi de 5%.”

Estrutura do relatório

Seção O que incluir
Método Cox, estratégia de seleção, verificação de pressupostos, software
Resultados Tabela com HR bruto e ajustado, IC 95%, p-valor
Figuras Kaplan-Meier + Forest Plot
Tabela Variável, HR bruto (IC; p), HR ajustado (IC; p)