Análise de Sobrevivência

Transcrição

Análise de Sobrevivência
Análise de Sobrevivência
(aula 1)
Profa Alcione Miranda dos Santos
Departamento de Saúde Pública -UFMA
Introdução
Análise de Sobrevivência é o estudo de indivíduos (itens observados) onde um
evento bem definido (falha) ocorre depois de algum tempo (tempo de falha).
Exemplos:
tempo de falha de equipamentos industriais (engenharia)
tempo de sobrevida de um paciente (medicina)
tempo de duração do período de desemprego ou greve (economia)
Características:
A variável resposta é não-negativa.
Principalmente univariada e contínua
Presença comum de censura
Exemplo 1: Sobrevida em diálise
Exemplo 2: Sobrevida em AIDS
Exemplo 3: Aleitamento Materno
Outros exemplos....
Tempo de incubação de uma doença
Tempo até a menopausa
Tempo até remissão de câncer
Tempo até surgimento de cárie
Caracterizando Dados de Sobrevivência
Os conjuntos de dados de sobrevivência são
caracterizados pelos tempos de falha e pelas censuras.
Em estudo clínicos, um conjunto de variáveis
explicativas é geralmente medido em cada paciente.
Os seguintes elementos constituem o tempo de falha:
Tempo inicial
Escala de medida
Evento de interesse (falha)
Tempo de Falha
Tempo de início de estudo deve ser precisamente
definido.
A escala de medida é quase sempre o tempo real ou “de
relógio”.
O evento de interesse, é na maioria dos casos
indesejável, e como já mencionado, chamado de falha.
Exemplos: morte ou recidiva
Censura
Observações incompletas freqüentemente ocorrem nos
estudos de sobrevivência.
Nestes estudos, pacientes abandonam o tratamento ou
continuam vivos depois do final dos estudos, resultando
em algumas observações incompletas, ditas censuradas.
Ressalta-se o fato de que, mesmo censurados, todos os
resultados provenientes de um estudo de sobrevivência
devem ser usados na análise estatística.
Tipos de Censura à direita
Tipo I: Observações são acompanhadas até um período
pré-estabelecido de tempo.
Tipo II: Observações são acompanhadas até obter-se
um número pré-determinado de falhas.
Tipo III: Aleatória à direita: acontece quando um
paciente é retirado no decorrer do estudo sem ter ocorrido
falha, ou se por exemplo, o paciente morrer por uma
razão diferente da estudada.
Exemplos:
falha
censura
Representação dos Dados de Sobrevivência
Os dados de sobrevivência para o indivíduo i (i=1, ...,n) são representados
em geral, pelo par (ti,,ci ), sendo
ti - o tempo de observação do indivíduo i.
ci - uma variável indicadora de falha ou censura, isto é,
 1, se t é um tempo de falha
i
ci = 
 0, se t i é um tempo censurado
Desta forma, a variável resposta em análise de
representada por duas colunas no banco de dados.
sobrevivência é
Função de Sobrevivência
Qual é a probabilidade de um paciente com Aids sobreviver
mais de 365 dias? Ou, mais formalmente, qual é Pr(T > 365) ?
Função de Sobrevivência:
S (t ) = Pr(T ≥ t )
Função de Risco
Qual é o risco de um paciente com Aids vir a óbito após sobreviver
365 dias? Esse risco de morrer aumenta ou diminui com o tempo?
Pr((t < T < t + ∆t ) | T > t )
λ (t ) = lim
∆t
∆t →0
Definição de λ (t ) : a probabilidade instantânea de um indivíduo sofrer
o evento em um intervalo de tempo t e t + ∆t dado que ele
sobreviveu até o tempo t.
Estimação da Função de Sobrevivência
Dados com observações não censuradas:
Ŝ (t ) =
número de pacientes com T > t
número de total de pacientes
Dados com observações censuradas:
Estimador Kaplan-Meier
Estimação na Ausência de Censura
Exemplo: A figura abaixo apresenta um histograma que mostra a distribuição
dos tempos de falhas associados a um certo grupo de indivíduos
A probabilidade de sobrevivência no tempo t = 400 h é
estimada por:
Sˆ (400) =
no. de indivíduos que não falharam até o tempo t = 400
número de indivíduos no estudo
21
Sˆ (400) =
= 0,389
54
Por sua vez, a taxa de falha no período compreendido
entre 400 e 500h é dada por
^
λ ([400,500) ) =
no. de falhas no período [400,500)
no. que não falharam até t = 400
^
λ ([400,500) ) =
9
= 0,429
21
Estimador Kaplan-Meier
O estimador do produto-limite (PL) ou de Kaplan-Meier é um
estimador não paramétrico da função de sobrevivência.
A expressão geral do estimador de Kaplan-Meier pode ser
apresentada após estas considerações preliminares:
t1< t2<...< tk , os k tempos distintos e ordenados de falha;
dj o número de falhas em tj , j = 1, ..., k, e
nj o número de indivíduos sob risco em tj, ou seja, os
indivíduos que não falharam e não foram censurados até o
instante imediatamente anterior a tj.
Estimador Kaplan-Meier
O estimador de Kaplan-Meier é, então, definido como:
 n1 − d1   n2 − d 2   nk − d k
ˆ
.
...
S KM (t ) = 
 n1   n2   nk



Exemplo:
Considere os seguintes tempos de vida (em dias).
Observações censuradas são marcadas por +.
55
61+
74
81
93+
122+
138
151
168
202+
220+
238+
Vamos calcular o estimador Kaplan-Meier.
11
ˆ
= 0,917
S KM (55) =
12
11 9
ˆ
S KM (74) = . = 0,825
12 10
11 9 8
ˆ
S KM (81) = . . = 0,733
12 10 9
11 9 8 5
Sˆ KM (138) = . . . = 0,611
12 10 9 6
STATA: Estimador Kaplan-Meier
Tempo
Status
238
1
220
0
202
0
168
1
151
1
138
1
122
0
93
0
81
1
74
1
61
0
55
1
stset tempo, failure (status==1)
failure event: status == 1
obs. time interval: (0, tempo]
exit on or before: failure
----------------------------------------------------------------------------12 total obs.
0 exclusions
----------------------------------------------------------------------------12 obs. remaining, representing
7 failures in single record/single failure data
1603 total analysis time at risk, at risk from t =
0
earliest observed entry t =
0
last observed exit t =
238
STATA: Estimador Kaplan-Meier
sts list
failure _d: status == 1
analysis time _t: tempo
Beg.
Net
Survivor
Std.
Time
Total
Fail
Lost
Function
Error
[95% Conf. Int.]
------------------------------------------------------------------------------55
12
1
0
0.9167
0.0798
0.5390
0.9878
61
11
0
1
0.9167
0.0798
0.5390
0.9878
74
10
1
0
0.8250
0.1128
0.4609
0.9533
81
9
1
0
0.7333
0.1324
0.3790
0.9056
93
8
0
1
0.7333
0.1324
0.3790
0.9056
122
7
0
1
0.7333
0.1324
0.3790
0.9056
138
6
1
0
0.6111
0.1569
0.2546
0.8375
151
5
1
0
0.4889
0.1664
0.1623
0.7545
168
4
1
0
0.3667
0.1637
0.0908
0.6574
202
3
0
1
0.3667
0.1637
0.0908
0.6574
220
2
0
1
0.3667
0.1637
0.0908
0.6574
238
1
1
0
0.0000
.
.
.
-------------------------------------------------------------------------------
STATA: Estimador Kaplan-Meier
sts graph
0.00
0.25
0.50
0.75
1.00
Kaplan-Meier survival estimate
0
50
100
150
analysis time
200
250