domingo, 30 de agosto de 2015

Relevância. O tipo de desfecho




A segunda parte da análise crítica de um artigo deve focar na relevância ou no impacto da terapia que foi testada. Devemos avaliar o tipo de desfecho e a magnitude daquela terapia. A magnitude ( análise quantitativa) pode variar de um pequeno efeito a um grande efeito. Essa etapa da avaliação é muito importante, pois sem ela não é possível ponderar adequadamente o efeito quantitativo daquela intervenção que na análise de veracidade foi comprovada benéfica.

Devemos dividir a avaliação desta etapa em duas:

  • O impacto quanto ao tipo de desfecho.
  • O impacto quanto ao NNT ( número necessário a tratar)
Nessa postagem falaremos sobre a análise do desfecho.

Os desfechos (end points) são medidas quantitativas que estão implícitas quando ocorre a enunciação dos objetivos da pesquisa. Por exemplo, se num hipotético trabalho o desfecho principal é aferir a mortalidade por IAM, determinando o impacto clínico de um novo anticoagulante, o desfecho medido será a mortalidade - Para isso,  será realizado a contabilidade do número de mortes por IAM no grupo intervenção( que recebeu o anticoagulante) vs o número de mortes no grupo placebo. Nesse caso, o desfecho mortalidade é um desfecho duro (hard endpoint) , facilmente mensurado e objetivo, o que evita o viés de aferição. Os desfechos mais frouxos ( soft endpoints)  como a angina de peito estão mais susceptíveis a tendenciosidade do observador. Os desfechos frouxos ou moles, são mais susceptíveis a erros de aferição - um indivíduo pode declarar que o desfecho foi alcançado, ao passo que o outro observador não. Definir claramente quais serão os desfechos e como serão aferidos é algo que diferencia os ensaios clínicos de outros delineamentos de estudo, a solidez da validade interna e relevância depende de como estes desfechos serão aferidos.

- O viés de aferição do desfecho pode estar presente quando o investigador conhece a intervenção designada pelo paciente, o paciente conhece os efeitos da intervenção a que está sendo submetido       (não houve cegamento) e o desfecho é definido de forma pouca objetiva.

Ainda nesse aspecto, enuncia-se que os desfechos podem   ser divididos em desfechos clínicos  e desfechos substitutos.


  • DESFECHOS CLÍNICOS - NORTEARÃO CONDUTAS.

Os desfechos clínicos representam aqueles que realmente tem impacto na vida do paciente. Mortalidade por todas as causas é o desfecho clinico mais importante e seguindo esta ordem temos: AVC e IAM . Existem outros desfechos clínicos que também são bastante significativos, tais como, qualidade de vida na asma, ou taxas de reinternação na ICC crônica devido a descompensação.

A implementação de Ensaios Clínicos com o uso de desfechos duros exige do trabalho um grande tamanho amostral, além de um grande custo, assim pesquisadores e a indústria buscam alternativas, e assim,  destaca-se o uso de desfechos substitutos.

Os desfechos substitutos ou em inglês surrogate endpoints constituem-se de variáveis fisiológicas ou laboratoriais que tentam predizer os efeitos clínicos da terapia. 
O uso de níveis tensionais de pressão arterial = Predizer AVC
Graus de estenose coronariana = mortalidade por DAC
Variações da glicemia = Complicações do DM
Disfunção ventricular de acordo com FE = Morte na ICC
Contagem de células CD4+ = Infecção pelo HIV
Osteoporose = Doenças Ósseas

O uso desfechos substitutos permite que o trabalho tenha um seguimento mais curto, tamanho amostral menor e redução de  custos. Ele é ideal para os ECR de fase I e fase II quando visa-se a segurança de uma intervenção, mas é inadequado quando  trata-se da tomada de conduta que influenciará na vida de muitos pacientes. Isso porque aquelas variavéis fisiológicas não garantem redução de desfechos duros.

A título de exemplo:

 O estudo ALLHAT foi desenhado para comparar quatro anti-hipertensivos ( lisinopril, clortalidona, anlodipino e doxasozina)  quanto aos efeitos sobre  um desfecho combinado de iam fatal e não-fatal. Foram randomizados 42 mil pacientes com HAS de alto risco num follow-up de 4 anos. Durante o seguimento, observou-se no grupo que estava fazendo uso de alfa-adrenérgico, um aumento da incidência de AVC e eventos cardiovasculares combinados em relação ao grupo clortalidona. Ademais, houve aumento da incidência de ICC. Esse resultados fizeram com que o braço doxasozina fosse interrompido. Nota-se nesse estudo, que as médias das PAS e PAD no grupo doxasina foram basicamente as mesmas do grupo clortalidona ao final do seguimento. Ou seja, ambos os fármacos foram capazes de controlar a PA - um desfecho substituto, contudo, em um dos dos fármacos (doxasozina) houve aumento de eventos adversos clínicamente importantes. Já imaginou basear nossa conduta num estudo com desfecho substituto? É  como se fosse um tiro no escuro...

2 - O uso de flacanimida , morizina ou placebo no pós- infarto. Estes antiarrítmicos no pós-infarto estiveram associados ao aumento de mortalidade. Após um ano de seguimento no estudo CAST I e CAST II, verificou-se que 95% dos pacientes do grupo placebo estavam vivos comparados a 90% do grupo antiarrítmico. Estes estudos chamaram atenção para o efeito arrítmico dessas medicações da classe I de Vaughan Williams, confirmaram a máxima da medicina baseada em evidência de que Plausibilidade Biológica não garante eficácia e efetividade terapêutica, além  de demostrarem claramente que o controle das ESV( desfecho substituto) no pós-infarto não reduz mortalidade, pelo contrário aumenta.



Agora, tomado posse desses conhecimentos partindo para análise do WOSCOPS. O que evidenciamos? É simples...

O desfecho primário foi um composto por Infarto não-fatal e morte por DAC, ou seja, um desfecho duro. Além disso não há evidência que o desfecho tenha sido definido de maneira incorreta, o que consta no tópico "Identification and Classification of Endpoints". Há de se tomar cuidado com a definição de IAM que alguns momentos toma a forma de um desfecho substituto, quando apenas a elevação dos biomarcadores de necrose miocárdica são levadas em conta. Isto não ocorreu no estudo supracitado.  Ao final do seguimento observou-se uma redução de 248 eventos coronarianos no grupo placebo vs 174 no grupo que usou pravastatina com redução de risco relativo de 31% a um IC de 95%, 17 vs 43%, p<0,001.







Referências: Major cardiovascular events in hypertensive patients randomized to doxasozine and chlortalidone: the antihypertensive and lipid-lowering treatment to prevent heart attack trial (ALLHAT). ALLHAT Colaborative research group. JAMA 2000, 2083: 1967 - 75.


Cardiac Arrhytmia Supression Trial. Preliminary report: efect of ecainide and flecainide on mortality in a randomized trial of arrhytmia supression after myocardial infarctation. N Engl J Med 1989, 321: 406-12.






sábado, 8 de agosto de 2015

A Veracidade. Parte II

Retomando a série enquanto a análise crítica de evidências, daremos prosseguimento com a análise da veracidade. Lembremos que o grande objetivo da ciência é diferenciar causa de acaso, portanto, inicialmente devemos ficar atento para ocorrência de erros sistemáticos e aleatórios que podem invalidar os resultados de um estudo.

A análise de um artigo inicia pela validade interna, pois como mencionado previamente, não há sentido em adotar uma conduta que pode ser falsa.

"Método é tudo" - (Erros sistemáticos e Erros aleatórios)


A primeira pergunta que deve ser feita é: Existe efeito de confusão influenciando nos resultados do estudo?

O delineamento adotado pelo estudo é muito importante para responder essa questão, portanto, é imprescindível que se faça a diferenciação entre um Ensaio Clinico Randomizado e um Estudo Observacional. Estudos observacionais são concebidos através de amostras de grupos pré-definidos e devido a este aspecto estão susceptíveis a um alto risco de erros sistemáticos, entre eles, o viés de confusão. Ademais, demonstram apenas associações e não causalidade. O que torna um Ensaio Clínico a ferramenta mais poderosa e ideal para o desenvolvimento de condutas terapêuticas e  sua capacidade de alocar de maneira aleatória os grupos testados - A randomização(sorteio) faz com que os grupos testados fiquem  homogêneos, minimizando o efeito de confusão nas relação de causa-efeito.
No que se refere ao estudo WOSCOPS retirando este fragmento de texto em Métodos  "randomly assigned in a double-blind fashion", pode-se perceber que como esperado, trata-se um de ensaio clínico randomizado, o que garante o controle do viés de confusão e seleção.

Veja parte da Tabela 1. Características gerais da amostra. Grupos são homogêneos


A segunda pergunta é: Foi demonstrada significância estatística? 

É muito importante saber que a significância estatística é diferente de significância clínica (NNT), contudo, a significância estatística torna-se importante para demonstrar a influência do acaso (azar) sobre os resultados apresentados por um determinado estudo. Todo e qualquer estudo deve ser realizado através de uma amostragem - a amostra representa nada mais que um grupo de pacientes(pessoas) que possuem características semelhantes a população-alvo da pesquisa. Se vamos avaliar a eficácia de um anti-hipertensivo para o tratamento de Hipertensão não iremos testá-lo em todos os pacientes com hipertensão do mundo( isso é impossível), mas sim em uma pequena parte desses pacientes. Quando trabalhamos com amostras devemos estar atentos enquanto ao papel do acaso. É devido a isto que os estatísticos desenvolveram o valor de P. O valor de P de maneira mais simplista estima a probabilidade daquele resultado ter sido decorrente do acaso. Não podemos eliminar totalmente a influência do acaso, apenas minimizá-la, por isso toleramos um valor de P de no máximo 5%. Vejamos o seguinte exemplo: Se hipoteticamente for verificado que a intervenção através da droga X no tratamento de Câncer de Pulmão aumenta a sobrevida em 30% x Placebo 15%, posso sugerir que a droga aumenta sobrevida. Entretanto, se não for apresentado significância estatística este resultado pode ter sido "falsamente positivo". A exigência de significância estatística evita o erro do tipo I -  rejeitando a hipótese nula quando ela é verdadeira.

Em relação ao WOSCOPS - pontuamos a intervenção ------- desfecho.
Verificamos que a pravastatina 40 mg foi eficaz em reduzir um combinado de Iam não-fatal e morte por DAC, demonstrando uma redução de risco relativo de 31% a um Intervalos de Confiança de 95% para um valor de P < 0,001 - Influência mínima do acaso. Contudo, isso ainda não é suficiente para garantir a validade destes achados - Esbarraremos ou não no problema das comparações múltiplas?

Terceira pergunta. A conclusão foi feita com base em desfechos primários ou secundários?
Quando analisamos um artigo devemos observar nos métodos quais os desfechos analisados - Os desfechos podem ser pontuados em desfechos primários ou secundários. A conclusão de um artigo para este ser considerado válido tem que ser baseado no desfecho primário para qual seu desenho foi concebido, isto porque geralmente os desfechos secundários são muitos, fazendo com que o problema das comparações múltiplas façam com que algum daqueles resultados possa ser proveniente do acaso.
Assim, resumidamente temos que:
Desfechos Primários quando desfechos Clínicos (hard endpoints) - são norteadores de conduta.
Desfechos Secundários -  são apenas geradores de hipóteses - devem ser testados por estudos posteriores.

"Briefly, the primary end point of the study was the occurrence of nonfatal myocardial infarction or death from coronary heart disease as a first event; these two categories were combined". - No presente estudo analisado verifica-se que o desfecho primário foi um combinado de Iam não-fatal mais morte por DAC, e que a conclusão desse artigo de acordo com nota tomada em postagem prévia foi totalmente baseada nesse aspecto validando ainda mais suas informações para norteamento de conduta, pois afastamos definitivamente a probabilidade da ocorrência do acaso.

A quarta pergunta é: Há viés de aferição?
Agora, devemos voltar a nos preocupar com a ocorrência de outros tipos de viéses, dentre eles, o viés de aferição. O viés de aferição é decorrente da mensuração inadequada das variáveis em estudo. Pode ser muito comum estudos observacionais que envolvem variáveis dicotômicas de exposição e doença em que os critérios para definir o que é ou não a exposição/doença podem não estar bem definidos, acarretando em erros de mensuração.  
Nos Ensaios Clínicos devemos nos preocupar com algumas coisas: O cegamento duplo de pesquisador e paciente, a mensuração de desfechos duros - mais objetivos - e que não são susceptíveis a tendenciosidade do observador no momento de mensuração e o controle por placebo. O placebo tem uma importante função de cegar o médico no momento de interpretar os desfechos.
Nesta postagem realizamos uma abordagem completa mais detalhada em relação ao viés de aferição.
Em relação, ao nosso estudo em análise , este foi um estudo duplo-cego baseado em desfechos duros e controlado por placebo que evita viés de aferição e desempenho.

A próxima pergunta seria: O estudo foi conduzido com a intenção de tratar?
O objetivo de um Ensaio Clínico Randomizado que testa uma determinada terapia é simular a prática médica real. Quando alocamos pacientes em estudo randomizado , temos o grupo intervenção e temos o grupo controle. Acontece que nem todos os pacientes que foram alocados para o grupo intervenção completarão o tratamento e muitos do grupo controle poderão tomar a droga. Isso cham-se cross-over e em todo ensaio clínico randomizado, toleramos um certo nível de cross-over(30%). Isso é tolerado porque a prática médica real acontece assim. Muitos dos pacientes com Hipertensão por exemplo, não são aderentes à droga, nem se quer tomam as medicações. Muitos dos pacientes que tomam antibióticos nem se quer completam o tratamento de acordo com o tempo que é prescrito. A intenção de tratar é baseada na premissa de simular o ato da prescrição médica e nesse aspecto a eficácia de uma determinada medicação é baseada na aceitação  do paciente ao medicamento. Isto não pode ser excluído do estudo. A análise primária com a intenção de tratar deve garantir que o paciente que foi alocado para o grupo droga será sempre droga independente de tê-la usado ou não e o placebo será sempre placebo.

WOSCOPS  foi conduzido com a intenção de tratar o que anula a possibilidade deste viés.

Última pergunta - Houve truncamento?
WOSCOPS não foi um estudo truncado o que confere uma alta validade para seus resultados. O truncamento se refere ao ato de truncar - cortar - interromper precocemente um estudo quando seus resultados são considerados de grande magnitude. Na verdade, sabemos que o truncamento superestima os resultados de um estudo, tornando sua veracidade questionável. Não há motivos para truncar uma pesquisa, a menos que o tratamento esteja fazendo mal ao paciente. 

Em conclusão, sabemos que o WOSCOPS é um estudo com baixo risco de viéses e verdadeiro. Foi um estudo randomizado, duplo-cego, controlado por placebo, com intenção de tratar, sem truncamento e com poder estatístico adequado superior a 80% para demonstrar a diferença esperada na incidência dos desfechos entre os grupos.

Resumindo - 
Randomização -  Evita efeito de confusão
Duplo-Cego controlado por placebo - Evita viés de aferição e desempenho
Intenção de tratar -  Evita viés de tratamento
Não truncado - Não superestima os resultados.
A conclusão com base em desfechos primários duros com significância estatística minimiza o acaso, evitando erro do tipo I, além de nortear conduta.
O poder estatístico de mais de 80%  - Evita erro do tipo II.











quinta-feira, 6 de agosto de 2015

Série de Dislipidemias(WOSCOPS) - Parte I

Recentemente fora publicado no New England Journal of Medicine, o primeiro trabalho (IMPROVE-IT) a testar adequadamente a associação entre estatina e ezetimiba que utilizou desfechos relevantes (hard endpoints). Este trabalho que foi amplamente discutido em postagem prévia nos trouxe algumas lições, entre elas, ter solidificado a necessidade da realização da análise crítica de evidências, isto porque, o trabalho foi publicado após a última diretriz da AHA para dislipidemias, que trouxe algumas mudanças de paradigmas: a queda das metas terapêuticas do LDL-C no tratamento das dislipidemias que implicaram também da não necessidade da associação com outros medicações não estatinas (até aquele momento cientificamente inadequadas, como as ezetimibas).

Baseado nestas implicações, vamos iniciar uma série de treinamento de análise críticas em terapêutica de Ensaios Clínicos Randomizados discorrendo sobre  estudos clássicos de dislipidemias. Nosso objetivo aqui, além de maturar nossa capacidade científica, é entender o porque das últimas recomendações da última diretriz e discutir mais sobre as lacunas e questionamentos que ficam quanto ao uso das estatinas.

Falaremos sobre o WOSCOPS, o primeiro estudo a testar o uso de estatina em prevenção primária e que gerou a recomendação na diretriz do tratamento de indivíduos com LDL C maior ou igual a 190.
Antes do início do processo de análise, algumas coisas devem ficar claras.
I) Um artigo científico não deve ser lido da mesma forma como se lê um livro - a leitura deve ser mais atenta, deve-se saber o que procurar.
II) Devemos iniciar a leitura pelo resumo, focando-se inicialmente nos resultados e logo depois na conclusão - isto é importante para realização de uma fixação mental, de maneira que possamos comparar estes achados assim que vamos progredindo na análise.
III) Como já foi aqui exaustivamente falado - o crivo da análise crítica deve passar por três partes - Veracidade, Relevância e Aplicabilidade. Evitar o  "efeito boiada" é importante, ou seja,  sair por ai alardeando resultados e conclusões de artigos científicos sem se focar na validade interna. Como adotar uma conduta, se ela foi proveniente de artigo que possue resultados falsos?
IV) Método é tudo.

WOSCOPS foi um estudo publicado no New England Journal of Medicine em 1995, foi randomizado, duplo-cego. Os critérios de inclusão foram: Homens com LDL maior que 155, sem história prévia de IAM. Homens portadores de angina estável, mas sem internação nos últimos 12 meses poderiam ser randomizados. O trabalho seguiu-se por um follow-up médio de 5 anos. Envolveu cerca de 6000 homens com idade entre 45 e 64 anos, alocados aleatoriamente para receber Pravastatina 40 mg x Placebo.
Desfecho Primário: Combinado de Morte por DAC + IAM.



Quais os resultados: 

O uso da pravastatina reduziu os níveis de LDL-C em 26%, com benefícios claros já durante os primeiros seis meses. No grupo placebo houve 248 eventos coronários definitivos ( IAM não-fatal e Morte por DAC) , enquanto que no grupo intervenção houve 174 eventos, com um redução de risco de 31% - p < 0,001).
Houve também redução da morte por causa cardiovascular - Esta saiu de 2,3 para 1,6% no grupo estatina.
Além da redução de risco de 22% p<0,051 de morte por todas as causas no grupo pravastatina.
Não houve diferença significante na elevação das transaminases nos 2 grupos.
O LDL-C médio foi de 192 mg/dl.

Qual a conclusão?

O tratamento com pravastatina reduziu a incidência de IAM e morte cardiovascular em homens com moderada hipercolesterolemia e sem história prévia de IAM.

Tomando nota destes achados passaremos a análise da veracidade, que será divulgada no próximo post.