Análise de Sobrevivência
Transcrição
Análise de Sobrevivência
Análise de Sobrevivência (aula 1) Profa Alcione Miranda dos Santos Departamento de Saúde Pública -UFMA Introdução Análise de Sobrevivência é o estudo de indivíduos (itens observados) onde um evento bem definido (falha) ocorre depois de algum tempo (tempo de falha). Exemplos: tempo de falha de equipamentos industriais (engenharia) tempo de sobrevida de um paciente (medicina) tempo de duração do período de desemprego ou greve (economia) Características: A variável resposta é não-negativa. Principalmente univariada e contínua Presença comum de censura Exemplo 1: Sobrevida em diálise Exemplo 2: Sobrevida em AIDS Exemplo 3: Aleitamento Materno Outros exemplos.... Tempo de incubação de uma doença Tempo até a menopausa Tempo até remissão de câncer Tempo até surgimento de cárie Caracterizando Dados de Sobrevivência Os conjuntos de dados de sobrevivência são caracterizados pelos tempos de falha e pelas censuras. Em estudo clínicos, um conjunto de variáveis explicativas é geralmente medido em cada paciente. Os seguintes elementos constituem o tempo de falha: Tempo inicial Escala de medida Evento de interesse (falha) Tempo de Falha Tempo de início de estudo deve ser precisamente definido. A escala de medida é quase sempre o tempo real ou “de relógio”. O evento de interesse, é na maioria dos casos indesejável, e como já mencionado, chamado de falha. Exemplos: morte ou recidiva Censura Observações incompletas freqüentemente ocorrem nos estudos de sobrevivência. Nestes estudos, pacientes abandonam o tratamento ou continuam vivos depois do final dos estudos, resultando em algumas observações incompletas, ditas censuradas. Ressalta-se o fato de que, mesmo censurados, todos os resultados provenientes de um estudo de sobrevivência devem ser usados na análise estatística. Tipos de Censura à direita Tipo I: Observações são acompanhadas até um período pré-estabelecido de tempo. Tipo II: Observações são acompanhadas até obter-se um número pré-determinado de falhas. Tipo III: Aleatória à direita: acontece quando um paciente é retirado no decorrer do estudo sem ter ocorrido falha, ou se por exemplo, o paciente morrer por uma razão diferente da estudada. Exemplos: falha censura Representação dos Dados de Sobrevivência Os dados de sobrevivência para o indivíduo i (i=1, ...,n) são representados em geral, pelo par (ti,,ci ), sendo ti - o tempo de observação do indivíduo i. ci - uma variável indicadora de falha ou censura, isto é, 1, se t é um tempo de falha i ci = 0, se t i é um tempo censurado Desta forma, a variável resposta em análise de representada por duas colunas no banco de dados. sobrevivência é Função de Sobrevivência Qual é a probabilidade de um paciente com Aids sobreviver mais de 365 dias? Ou, mais formalmente, qual é Pr(T > 365) ? Função de Sobrevivência: S (t ) = Pr(T ≥ t ) Função de Risco Qual é o risco de um paciente com Aids vir a óbito após sobreviver 365 dias? Esse risco de morrer aumenta ou diminui com o tempo? Pr((t < T < t + ∆t ) | T > t ) λ (t ) = lim ∆t ∆t →0 Definição de λ (t ) : a probabilidade instantânea de um indivíduo sofrer o evento em um intervalo de tempo t e t + ∆t dado que ele sobreviveu até o tempo t. Estimação da Função de Sobrevivência Dados com observações não censuradas: Ŝ (t ) = número de pacientes com T > t número de total de pacientes Dados com observações censuradas: Estimador Kaplan-Meier Estimação na Ausência de Censura Exemplo: A figura abaixo apresenta um histograma que mostra a distribuição dos tempos de falhas associados a um certo grupo de indivíduos A probabilidade de sobrevivência no tempo t = 400 h é estimada por: Sˆ (400) = no. de indivíduos que não falharam até o tempo t = 400 número de indivíduos no estudo 21 Sˆ (400) = = 0,389 54 Por sua vez, a taxa de falha no período compreendido entre 400 e 500h é dada por ^ λ ([400,500) ) = no. de falhas no período [400,500) no. que não falharam até t = 400 ^ λ ([400,500) ) = 9 = 0,429 21 Estimador Kaplan-Meier O estimador do produto-limite (PL) ou de Kaplan-Meier é um estimador não paramétrico da função de sobrevivência. A expressão geral do estimador de Kaplan-Meier pode ser apresentada após estas considerações preliminares: t1< t2<...< tk , os k tempos distintos e ordenados de falha; dj o número de falhas em tj , j = 1, ..., k, e nj o número de indivíduos sob risco em tj, ou seja, os indivíduos que não falharam e não foram censurados até o instante imediatamente anterior a tj. Estimador Kaplan-Meier O estimador de Kaplan-Meier é, então, definido como: n1 − d1 n2 − d 2 nk − d k ˆ . ... S KM (t ) = n1 n2 nk Exemplo: Considere os seguintes tempos de vida (em dias). Observações censuradas são marcadas por +. 55 61+ 74 81 93+ 122+ 138 151 168 202+ 220+ 238+ Vamos calcular o estimador Kaplan-Meier. 11 ˆ = 0,917 S KM (55) = 12 11 9 ˆ S KM (74) = . = 0,825 12 10 11 9 8 ˆ S KM (81) = . . = 0,733 12 10 9 11 9 8 5 Sˆ KM (138) = . . . = 0,611 12 10 9 6 STATA: Estimador Kaplan-Meier Tempo Status 238 1 220 0 202 0 168 1 151 1 138 1 122 0 93 0 81 1 74 1 61 0 55 1 stset tempo, failure (status==1) failure event: status == 1 obs. time interval: (0, tempo] exit on or before: failure ----------------------------------------------------------------------------12 total obs. 0 exclusions ----------------------------------------------------------------------------12 obs. remaining, representing 7 failures in single record/single failure data 1603 total analysis time at risk, at risk from t = 0 earliest observed entry t = 0 last observed exit t = 238 STATA: Estimador Kaplan-Meier sts list failure _d: status == 1 analysis time _t: tempo Beg. Net Survivor Std. Time Total Fail Lost Function Error [95% Conf. Int.] ------------------------------------------------------------------------------55 12 1 0 0.9167 0.0798 0.5390 0.9878 61 11 0 1 0.9167 0.0798 0.5390 0.9878 74 10 1 0 0.8250 0.1128 0.4609 0.9533 81 9 1 0 0.7333 0.1324 0.3790 0.9056 93 8 0 1 0.7333 0.1324 0.3790 0.9056 122 7 0 1 0.7333 0.1324 0.3790 0.9056 138 6 1 0 0.6111 0.1569 0.2546 0.8375 151 5 1 0 0.4889 0.1664 0.1623 0.7545 168 4 1 0 0.3667 0.1637 0.0908 0.6574 202 3 0 1 0.3667 0.1637 0.0908 0.6574 220 2 0 1 0.3667 0.1637 0.0908 0.6574 238 1 1 0 0.0000 . . . ------------------------------------------------------------------------------- STATA: Estimador Kaplan-Meier sts graph 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate 0 50 100 150 analysis time 200 250