domingo, 25 de fevereiro de 2018

Independência da associação e análise multivariada




Suplementos de antioxidantes são  muito ingeridos pelo público leigo ou mesmo frequentemente prescritos por médicos.
O uso de omega 3 tem ganhado popularidade devido aos seus efeitos anti-inflamatórios no endotélio vascular, portanto com o potencial teórico de reduzir a incidência de doenças cardiovasculares em indivíduos já expostos ou mesmo de prevenir novos eventos em indivíduos com risco cardiovascular "usual".
Diversos estudos observacionais prospectivos demonstraram benefício desses suplementos na redução de eventos cardiovasculares ou morte súbita.
Resultados estes, que foram contrapostos por estudos clínicos, entre eles, o ensaio clínico ALPHA OMEGA, que randomizou mais de 4 mil indivíduos com idade entre 60 e 80 anos com história  de infarto agudo do miocárdio para receber doses de omega 3 por um seguimento de 40 meses, onde a análise final não constatou redução de desfechos duros nos indivíduos já infartados.
Destaca-se também recentemente , nova meta-análise de ensaios clínicos randomizados, que avaliou o efeito de omega 3 em diferentes subgrupos de pacientes com doença cardiovascular, também não demonstrando benefício dessa intervenção. 

Para compreendermos a diferença entre os resultados frequentemente divergentes de estudos observacionais e ensaios clínicos, é importante entender como os fenômenos causais ocorrem e o conceito de independência da associação.


Na busca por determinar a causalidade dos fenômenos existentes, precisamos observar inicialmente se há associação entre as variáveis (fatores) avaliados.
Identificada a associação, devemos verificar se ela é realmente causal, quanto mais forte uma associação maior a probabilidade de ela ser causal, todavia, além da força desta associação, ela deve ser independente de fatores confundidores - confounding factors.

Uma associação pode ser afetada pelo viés de confusão que coloca em cheque toda cadeia de causalidade, já definido  em abordagens prévias.

Como bem documentado , estes fatores de confusão podem ameaçar de maneira contundente a validade de um estudo observacional.

Uma variável que prejudica a independência de uma associação deve apresentar todas essas três características:

  • Estar associada com à exposição 
  • Estar associada ao desfecho (doença) 
  • Não fazer parte da cadeia causal entre exposição e doença, criando uma associação "artificial" ou falsa 


A esta variável damos o nome de variável confundidora.





Quais são os potenciais fatores confundidores? 

No caso do uso de anti-oxidantes é bem provável , que em estudos observacionais , fatores como modo de vida -  que envolvem dieta, atividade física ou mesmo a ausência de um fator de risco podem interferir na associação criando associações espúrias.
É bem provável que indivíduos que consomem suplementos vitamínicos sejam também mais saudáveis naturalmente.

Uma abordagem para identificar quais os fatores classicamente associados com exposição e doença seria prover uma análise dos fatores já identificados em estudos prévios.
Fatores de risco não modificáveis, como idade e sexo são sempre candidatos.

Outra forma de identificar estas potenciais variáveis, envolvem uma análise estatística inicial mais "liberal", buscando associações entre variáveis que podem ter associação com o desfecho através de plausibilidade biológica e depois controlá-las através de análises multivariadas.

A independência de uma associação será confirmada após a análise multivariada, onde a relação bruta entre exposição e doença é sempre diferente quando identificado o fator confundidor.

O que é análise multivariada ? 

Na maioria das situações clínicas, muitas variáveis agem juntas para produzirem efeitos. No mundo multivariado, de múltiplos fatores causais essas relações são complexas. A análise multivariada serve para construir um modelo de predição independente e para participar da avaliação de causalidade de um determinado fator.
Diversas variáveis são colocadas no mesmo modelo matemático e analisadas simultaneamente - buscando ajustar (controlar) o efeito de todas essas variáveis, determinando então seu efeito independente.
Além disso, a análise multivariada serve para identificar interação, que é frequentemente confundida com confusão.
A interação refere-se apenas a modificação de efeito - por exemplo, uma droga tem efeito diferente em gêneros diferentes? 

Os testes mais utilizados para realização de análise multivariadas envolvem o uso da regressão logística, ANOVA multivariada, ANCOVA e regressão linear múltipla.

Quando analisamos um estudo (nesse caso, observacional), devemos avaliar se ele é resultado de acaso, viés ou de fato é uma realidade.
Se nessa análise, associações forem identificadas  devemos verificar se elas foram independentes, prestando atenção na realização de análises para controle de fatores confundidores

Portanto, como principais conhecimentos do post de hoje, devemos ter em mente que: 

  • A associação precisa ser forte e independente - 
  • Ensaios clínicos são menos susceptíveis a vieses de confusão quando comparados a estudos observacionais - 
  • Ao analisarmos um estudo que busque associações, na análise crítica, devemos buscar por análises multivariadas para controle de fatores confundidores - 



















sábado, 17 de fevereiro de 2018

A força de associação as medidas de efeito e a decisão clínica



As abordagens anteriores foram importantes para definirmos o significado do valor P e do Intervalo de Confiança (IC) , durante essa abordagem foram mencionados termos importantes, tais como, associação  e força da associação.
A força de associação é um importante critério de causalidade de Hill e basicamente quanto mais forte é essa associação, maior a probabilidade de ela ser causal.
Uma associação fraca geralmente tem maior probabilidade de ser mediada por fatores de confusão.

A força da associação pode ser "mensurada" através das medidas de efeito, que utilizam conceitos de riscos diversos e podem ser determinadas por diferentes proporções para propostas diferentes.

Aqui abordaremos as seguintes medidas de efeito:  o risco absoluto, risco relativo, a redução absoluta do risco , redução do risco relativo.

Conceito prático e definição.

Em 1999, foi publicado na revista Lancet o clássico ensaio clínico  CIBIS II , este estudo avaliou eficácia do uso de Bisoprolol na redução de mortalidade em paciente portadores de Insuficiência Cardíaca Congestiva (ICC).
Neste estudo, foram alocados aleatoriamente 2647 pacientes portadores de ICC classe III e IV sintomáticos com fração de ejeção igual ou inferior a 35%  que recebiam terapia padrão com diuréticos e ieca para receber bisoprolol versus placebo.
A dose de bisoprolol variou de 1.25 mg até o máximo de 10 mg e ao final de um seguimento médio de 1,3 anos observou-se redução de mortalidade por todas as causas no grupo bisoprolol - (156 [11,8%] vs 228 [17,3%] com um hazart ratio de 0,66 % (IC 95 % 0,54 -0,61, p < 0,0001).

Analisando este estudo , o que seria o  risco absoluto e qual o risco absoluto de morte nos grupos?

O risco absoluto é a probabilidade de um evento acontecer em uma determinada população.
Tem o mesmo valor que a medida de incidência e frequentemente esses termos são intercabíveis. Este risco pode ser traduzido como risco basal de um indivíduo e é a melhor forma de compreender fatores de risco e como esses fatores podem afetar a condição clínica de um paciente.
Ao nos questionarmos;  qual a incidência de uma determinada doença em grupo inicialmente livre dela, teríamos a expressão para o cálculo do risco absoluto, traduzido através da seguinte fórmula: I* = n ⁰ de casos novos durante um intervalo de tempo /  n ⁰ de pessoas no grupo.

respondendo a segunda pergunta,  teríamos que fazer o cálculo abaixo, realizado através de dados extraídos da seguinte tabela que relaciona expostos e não expostos e a ocorrência dos desfechos nos grupos.



Ra  no grupo bisoprolol = a/ a + b = 156/981 = 0,159 = 16%

Ra  no grupo placebo   = c/ c + d  = 228/920 = 0,247 = 25 %

Assim, o risco absoluto no grupo placebo era de 25 % durante todo o seguimento, enquanto que após o tratamento com bisoprolol o risco de morte passou a ser de 19 %.



Quanto ao risco relativo, o que seria? qual a forma de calculá-lo?


O risco relativo é uma medida de efeito utilizada para medir a probabilidade dos indivíduos expostos de desenvolverem a doença em relação aos não expostos. Quantas vezes é mais provável para que as pessoas expostas se tornem doentes em relação às não expostas?



Para calcularmos o risco relativo devemos utilizar a seguinte fórmula: RR = I expostos / I não expostos.

Neste caso, poderíamos obter o risco relativo a partir da relação entre as incidências de eventos nos grupos.

Retirando  dados da mesma tabela chegaríamos a um valor muito próximo do hazart ratio mencionado.
Isso quer dizer que o risco de mortalidade de um indivíduo com ICC classe III ou IV em uso de bisoprolol foi 66 % menor do que aqueles que não utilizaram à droga.

Um estudo publicado no jornal americano de medicina (JAMA) analisou os efeitos da  duração da amamentação na incidência de diabetes nas mulheres que amamentaram comparativamente às mulheres que não amamentaram.
Os pesquisadores analisaram dados do Estudo (CARDIA) num follow-up de 30 anos. O estudo foi feito com 1235 mulheres negras e brancas sem diabetes antes da gestação e que tiveram pelo menos um filho nascido vivo depois do início do estudo.
Após um acompanhamento médio de cerca de 24 anos , verificou-se que o risco relativo de incidência de diabetes foi de 0,75 ( IC 95% de 0,51 - 1.09 ) para as mulheres que amamentaram de zero a seis meses; 0,52 ( IC 95 % de  0, 31 a 0, 87) para as mulheres que amamentaram por mais de seis e menos de um ano; e 0,53 ( IC 95% de 0,29 a 0,98) para as mulheres que amamentaram por mais de 12 meses com um valor P = 0,01 em comparação as mulheres que não amamentaram.


Interpretando os resultado do estudo acima, o risco relativo para os indivíduos que amamentaram mais de 6 meses foi sempre < 1 , o que indica que a amamentação dentro deste período esteve associada como um fator de proteção para ocorrência de diabetes, ou seja, o grupo que amamentou apresentou um risco relativo 50 %  menor de desenvolver diabetes do que aquelas que não amamentaram.

O risco relativo é o resultado mais comum relatado em estudos sobre riscos, indicando a força de associação entre a exposição e a doença.

Prosseguindo na análise, poderia me perguntar qual a redução absoluto de riscos e a redução relativa dos riscos?

Tomando o estudo CIBIS II novamente como exemplo, a RAR seria basicamente calculado pela subtração dos riscos entre controle  e grupo droga.
Logo, RAR  (RAR =  Ra c - Ra t =   26 - 19 % = 9%. Ou seja, a droga ( bisoprolol) reduziu em 9% o risco de mortalidade na ICC classe III e IV, indicando a verdadeira magnitude do benefício dessa droga na terapia.

A partir do próprio risco relativo poderíamos calcular a redução do risco relativo pela seguinte expressão 1 - RR = 1 - 0,64 = 0,36 ou 36 %.

Redução absoluta do risco e o risco relativo - 

Este estudo  comparou o efeito da idade e densidade mineral óssea nos riscos relativos e absolutos de mulheres com idade de 50 a 99 anos pós - menopausa. O mesmo demonstrou claramente que o risco  relativo permaneceu constante, enquanto o risco atribuível mudou conforme o risco basal. Os resultados verificaram que  risco relativo da DMO permaneceu estável conforme o passar da idade , enquanto a redução absoluta do risco (risco atribuível) quase dobrou conforme o passar das décadas, independente da DMO.
Interpretando estes resultados para a realidade dos ensaios clínicos e para prática clínica, o fato é que a redução absoluta do risco não depende apenas do efeito intrínseco do tratamento, mas também do risco basal, já o risco relativo depende do efeito intrínseco do tratamento , sendo constante.

Aplicando o risco relativo ao risco absoluto de um paciente, poderemos saber a exata redução absoluta de risco com uma determinada terapia naquele indivíduo.
Suponhamos que as estatinas promovem uma redução relativa de risco de 31% e ao realizar o cálculo do risco de eventos cardiovasculares em 10 anos com score ASCVD da AHA meu paciente apresentou um risco basal de 30%.  31 %  x 30 % = 0,093 = uma redução absoluta do risco de 9%, por outro lado,  se o risco basal dele fosse menor essa redução absoluta também seria menor.

Ao compararmos as reduções absolutas e as reduções relativas , observamos que os números decorrentes do riscos relativos são muito mais "atraentes" , dando a falsa impressão de que para aplicar uma terapia em uma situação clínica seria melhor concentrar-se nos riscos relativos.
De fato, clínicos podem interpretar que um tratamento é muito mais eficaz concentrando-se apenas na redução do risco relativo pelo seu valor geralmente maior que a redução absoluta do risco, dando a falsa impressão de que o tratamento é muito mais benéfico do que o real.
Contraditoriamente ,  um estudo publicado no British Medical Journal  ao analisar as medidas de efeito mais utilizadas nas revistas de grande impacto, demonstrou uma maior frequência de uso das medidas relativas em relação às medidas absolutas, as medidas absolutas foram relatadas apenas em 18 % dos artigos.

Contudo, para a tomada de decisão clínica  ou para verificar a magnitude do dano de um fator de risco é melhor concentra-se na redução absoluta do risco ou para estudos epidemiológicos sobre fatores de risco ( no risco atribuível à exposição ) do que nos riscos relativos.



















sábado, 3 de fevereiro de 2018

O que é o Intervalo de Confiança ?

                                       




Ao estudar uma associação entre variáveis utilizando o mais adequado teste estatístico para aquela situação, tem - se o resultado de um valor P. O valor P nos é útil para determinar se aquela associação é significativa do ponto de vista estatístico e determinar a influência do acaso nos resultados. Porém , a análise isolada de um valor P significativo não nos oferece informações a respeito do tamanho do efeito observado no tratamento (de forma que não podemos inferir significância clínica), não nos oferece informações a respeito do poder do estudo e de sua precisão e não nos permite estimar também a força daquela associação.

A força da associação é um importante critério para estabelecer causalidade e a investigação epidemiológica tem nos permitido utilizar ferramentas como as medidas de associação, entre elas, o risco relativo ou razão de chances  para quantificar o grau de uma associação entre exposição e desfecho.

Contudo, as medidas de associação não nos fornecem informações a respeito da significância estatística do estudo, geralmente atreladas ao valor P. Com o objetivo de reunir informações a respeito da força da associação e significância estatística foram criados os Intervalos de Confiança (IC).

Os intervalos de confiança colocam mais ênfase na magnitude do efeito e nos permitem inferir se um estudo foi ou não preciso



Conceito prático e definição.


Estudo recente publicado na revista stroke foi realizado com o intuito de observar a associação entre doença periodontal e a incidência de avc isquêmico.
Os pesquisadores analisaram dados de 10.362 participantes de meia-idade sem história de avc e que estavam participando da coorte ARIC (atherosclerosis risk in communities) e que foram seguidos regularmente desde a década de 80.
Os participantes foram classificados quanto a aqueles que faziam acompanhamento regular , ou seja, visitavam o dentista pelo menos uma vez ao ano, ou irregular - aqueles que faziam acompanhamento odontológico apenas quando sentiam desconforto, precisavam de tratamento ou nunca frequentavam o dentista.
Dentro de um seguimento de 15 anos  observou-se a ocorrência do desfecho (avc) em 584 participantes.
Após determinados ajustes para variáveis de confusão, verificou-se que os pacientes que faziam seguimento regular (menores taxas de doença periodontal) apresentaram uma menor incidência de avc  - (HR ajustado = 0,77; IC 95%, 0,63 - 0,94).



O que significa isso?


Na medicina baseada  em evidências ao realizarmos uma pesquisa precisamos trabalhar com a técnica de amostragem, isso porque estudar toda a população se torna inviável, se assim o fosse, teríamos a real certeza de nossos resultados.

Quando estudamos uma amostra populacional podemos ter azar nessa observação e atestar valores muito diferentes da realidade, para estimarmos uma maior precisão a respeito da magnitude do efeito necessitamos desses intervalos de confiança.
Suponhamos que eu tenha a respeito do estudo acima, ficado um pouco receoso com o resultado e tenha realizado um estudo similar que demonstrou um risco hazart de 0,76, enquanto num terceiro estudo replicado de maneira similar foi demonstrado um risco hazart de 0,75 até chegar a realização de 100 estudos.
Ao completar 100 estudos vamos observar variações quanto a estimativa ponto que é basicamente o valor do Hazart ratio, Risco relativo, Razão de chances - esta variação nas medidas de associação reflete uma faixa de valores possíveis para a real magnitude do efeito,  chamada de intervalo de confiança.

Um intervalo de confiança de 0,63 - 0,94 , implica em dizer que se eu repetir o estudo 100 vezes, em 95 dessas 100 vezes o valor do RR estará dentro daquele intervalo para mais ou para menos. Os outros cinco estudos excluídos estão associados a valores tão extremos que foram descartados porque provavelmente ocorreram devido ao acaso.

Outra importante constatação  com relação a isto é que quanto mais estreito o intervalo de confiança, mais preciso será o estudo.

O IC de 95% é o mais comumente utilizado na literatura , entretanto, podem ser estabelecidos outros valores para o IC com base em 99% ou 90%.
 Lembrando que o IC define a incerteza na estimativa da magnitude do efeito na população real e não na população do estudo.
O intervalo de confiança é calculado através do tamanho da amostra, pelo erro técnico de medida do estudo e pelo grau de confiança, nos permitinfo inferir também informações semelhantes oriundas das atribuídas ao valor P.

Se o risco relativo = 1 (efeitos iguais no grupo intervenção e controle), estiver entre o limite inferior e superior do intervalo de confiança, pode-se inferir que o valor P seria superior ou igual a 5%.
Caso esse valor para o risco relativo seja inferior a 1 ou superior a 1 (efeito de proteção ou de risco, respectivamente) não estiver interpolado pelos limites superior e inferior do intervalo (ou seja, não cruzar o 1), pode-se inferir que o estudo possui significância estatística.

Interpretando os resultados na prática - 



Estudo 1 - RR = 10 ( IC 95%; 1,4 - 22,5) 

Estudo 2 - RR = 10 ( IC 95%; 0,5 - 11,9) 
Estudo 3 - RR = 10 (IC 95 %; 1,4 - 2,1) 

De posse desses conceitos podemos dizer que o estudo 2 , não alcançou significância estatística, provavelmente seus resultados são decorrentes do acaso , não sendo confiável porque ora a variável de exposição se comporta como fator de proteção , ora como fator de risco (lembre - se que neste exemplo o IC passa pelo número 1).
Embora o estudo 1 e o estudo 3 tenha sido significativos, o estudo 3 é o mais preciso , pois tem o IC mais estreito.

Para resumir:  é importante denotar que o IC possui mais vantagens em relação ao valor P, como dar mais ênfase a magnitude do efeito e fornecer informações mais acuradas sobre o poder estatístico do estudo.




domingo, 28 de janeiro de 2018

O acaso - o valor P e a significância clinica x a estatística


O grande objetivo da ciência é identificar fenômenos causais e entender como eles ocorrem.
Durante esse processo, os resultados podem ser influenciados por dois fenômenos. Viés e acaso.
Os viéses também chamados de erros sistemáticos nada mais são do que falhas sistemáticas na metodologia da pesquisa que fazem com que os resultados de um estudo sejam diferentes dos valores verdadeiros. 
Erros sistemáticos podem ser evitados através de uma boa metodologia de pesquisa - escolhendo o delineamento  mais adequado para aquilo que pretende-se observar, ou controlando fatores, como por exemplo, de confusão e seleção por intermédio do uso de análises multivariadas.

 Passado o desafio de controlá-los existe um fenômeno onipresente - o acaso - que pode ser minimizado , mas não evitado, porque este evento pode exercer sua influência tanto do lado verdadeiro como do outro.

Dentro do método estatístico, existem basicamente duas formas de se avaliar a influência do acaso em uma observação. Uma abordagem estimativa ( mais modernamente utilizada) e a abordagem mais tradicional que é realizada através do teste de hipóteses.

O que é o teste de hipóteses ?

No desafio de determinar a causalidade de uma associação, o pesquisador lança mão de ferramentas estatísticas que tentem "descartar" o acaso como responsável possível pelos resultados daquela observação.
O teste de hipótese levanta a questão de que uma diferença entre os grupos pode ou não estar presente, partido-se sempre da premissa de que um fenômeno é inexistente até que prove-se o contrário, o que chamamos de hipótese nula.
De forma análoga, poderíamos sintetizar a definição da hipótese nula, na máxima de que todos são inocentes até que seja provado o oposto. O pesquisador faz o papel de "promotor", com intuito de rejeitar a hipótese de não associação entre as variáveis.
Quando determinados através desse mesmo teste que uma diferença (efeito) entre os grupos existe, ficamos com a hipótese alternativa.
Para avaliar este fato os testes estatísticos utilizam o valor P.

A maioria das estatísticas encontradas na literatura médica, dizem respeito ao valor P , muitas vezes interpretado de forma errônea.
Portanto, o valor P refere-se a medida quantitativa da probabilidade de que as diferenças de efeito evidenciada no tratamento de uma determinada doença  em algum trabalho científico poderiam ter apenas decorrido em função do acaso, presumindo inicialmente que de fato não existem diferenças entre os grupos.

Uma outra forma interessante de estabelecer o que seria o valor P, seria o seguinte questionamento:
Presumindo que não houvesse diferença de efeito no tratamento observado entre os grupos, e o estudo fosse repetido muitas vezes, quantos estudos concluíriam que a diferença entre os grupos foi tão grande quanto a encontrada no estudo?

Na literatura frequentista o valor P é chamado de P(alfa) e isto é utilizado para diferenciá-lo das estimativas de outro erro - o erro do tipo II , chamado de P(beta).
Além disso, o ponto de corte adotado geralmente para estabelecer uma significância ao valor P, seria o valor P < 0,05. Quando o valor P alcança um valor inferior a este ponto diz-se que houve uma associação estatisticamente significativa.

Alguns críticos dizem que é arbitrário oferecer um valor fixo ao  P, argumentando que os valores podem ser mais baixos ou mais altos, dependendo das consequências em uma observação falso-positiva. 
Tomamos como exemplo, um estudo que tem como objetivo avaliar  o efeito de uma intervenção em uma doença muito grave - devido a gravidade da própria doença acho que seria razoável em estabelecer um ponto de corte maior para o valor P, levando-se em consideração também, a existência ou não de um tratamento efetivo e a segurança deste novo tratamento.
Em contrapartida, um autor poderia ter uma menor tolerância com um falso-positivo na avaliação de uma doença que já tem um tratamento efetivo e o novo tratamento pudesse não ser tão seguro.
Contemplando este argumento sobre a  influência do acaso, autores poderiam pré-definir um valor P menor que 0,03, 0,05, 0,011 - entretanto, geralmente o valor inferior a 5% é observado.
Quanto menor o valor P, menor a probabilidade de o resultado de uma  análise ter sido influenciado pelo acaso, logo quando um estudo apresenta uma associação estatística com um valor P = 0,03, considerando um valor P menor que 0,05 , quer dizer que existe apenas uma probabilidade de 3 % daquela diferença ter sido observada em decorrência do acaso, sob a óptica da hipótese nula, contudo o valor P isoladamente é insuficiente para estabelecer precisão e significância clínica.

Significância estatística x significância clínica.

É um equívoco achar que um valor P muito pequeno é sinônimo de significância clínica, pesquisadores muitas vezes ficam tão atentos ao valor P no intuito de demonstrarem um estudo positivo, ou mesmo indivíduos na análise de um artigo científico,  que esquecem de mensurar a relevância do tamanho do efeito. O efeito da intervenção pode ser medido através de variáveis dicotômicas e  a melhor maneira de medi-lo é através da diferença em relação ao tamanho do efeito observado entre os grupos.
Vamos fazer a suposição bem simplista de que quero testar o efeito de uma droga ( um anti-inflamatório) na redução da sensação dolorosa em pacientes portadores de artrose de joelhos. O desfecho diminuição da dor foi aferido através de uma escala numérica pontuada de 0 a 10, em que zero significaria ausência de dor e 10 a dor mais insuportável que se poderia ter. 
Alocando os paciente de maneira aleatória entre indivíduos que receberam a droga e indivíduos que receberam placebo, ao final do estudo observou-se uma significância estatística entre os grupos com um valor de P = 0,02, contudo o grupo que recebeu a medicação teve a dor reduzida em 4 pontos e o grupo placebo apenas em 1 ponto. Conclui-se então que embora refutada a hipótese nula, a melhor estimativa é que houve uma redução de 3 pontos na presença de dor. 
Cabe ao autor e ao crítico decidir se isso é uma diferença clinicamente relevante que possa ser útil no contexto da prática clínica.

Um exemplo interessante a citar para a prática é que o uso de  Diacereína tem um efeito nulo ou pouco significante ( em termos de magnitude) na redução da dor proveniente da osteoartrose, como atesta este estudo realizado pela Cochrane. A medicação é frequentemente utilizada, porque médicos muitas vezes não utilizam o princípio da hipótese nula e ficam "ansiosos" em realizar "alguma coisa" - a mentalidade do médico ativo -  ou consideram que para um desfecho subjetivo como a dor , essa pequena magnitude pode ser relevante para alguns indivíduos.

Outro ponto a considerar nesta mesma análise é que pequenas diferenças, muitas vezes suficientes para demonstrar relevância clínica de tratamentos fortes, podem não ocorrer devido ao tamanho amostral da pesquisa.

E as interpretações de valores P limítrofes ?

Na busca exagerada por significância estatística, autores tendem a interpretar valores limítrofes do  P como uma tendência a significância. Muitas vezes usam e abusam de malabarismos estatísticos durante a análise de dados da pesquisa para alcançar um resultado positivo, o que chamamos em estatística de "P hacking". O fato é que o uso dessa expressão é errôneo, se um estudo detectou valor para P = 0,056 ou a 0,06 , assumindo um nível de significância menor que 5%, significa que  a probabilidade de se obter um resultado decorrente do acaso é de 6%, assumindo que o mesmo tratamento não tenha efeito real, nesse caso a hipótese nula não pode ser refutada.
Um exemplo interessante, seria citar o estudo WOSCOPS que não demonstrou redução de mortalidade por todas as causas com uso de pravastatina para prevenção primária , com um valor P = 0,051.

Recentemente a conceituada revista americana de medicina ( JAMA), publicou um artigo científico a respeito do valor P e o teste de hipóteses e como eles devem ser interpretados.
Segue um anexo abaixo, sobre os principais equívocos a respeito da interpretação destes conceitos e que resume basicamente tudo que foi abordado nesse post.




















sábado, 20 de janeiro de 2018

O uso de estatinas na ICC é imprescindível?


Desde o primeiro estudo clínico 4S, publicado em 1994, demonstrando benefício do uso de sinvastatina  na redução de morbimortalidade em uma população de indivíduos com doença arterial coronariana, surgiram outros trabalhados demonstrando benefício dessa classe medicamentosa.
Observou-se também um crescimento no interesse por estudar o benefício dessas medicações em determinados subgrupos, como idosos e pacientes com Insuficiência Cardíaca.

Classicamente, os pacientes com ICC sempre foram excluídos ou pouco representados no estudos de desfechos e contraditoriamente estudos observacionais e pequenos estudos experimentais demonstraram benefício do uso dessas medicações, contudo baseado no baixo nível de evidência dessas pesquisas , sujeitas a viéses de confusão e erros aleatórios o uso de estatinas nessa população continuava bastante contraditório.

Ao tentarmos provar o benefício de uma medicação em um estudo experimental, necessitamos de ter algum mecanismo biológico que possa implicar num teste de hipótese, lembrando sempre da máxima de que "Plausibilidade biológica não garante benefício clínico". 

A razão pela qual as estatinas poderiam ser benéficas nesse tipo de paciente está associada ao fato de que a etiologia isquêmica  possui associação causal com uma boa quantidade de casos de ICC, pacientes portadores de doença aterosclerótica são naturalmente mais "inflamados" com maior produção de citocinas inflamatórias - fisiopatologicamente as estatinas atuariam como mediadores inflamatórios, ademais a própria ICC é responsável por ativação adrenérgica , diminuição da atividade do sistema parassimpático  e disfunção autonômica. Modelos experimentais demonstram que as estatinas têm potencial de reduzir essas alterações.

Aquém da controvérsia do estudos, modelos experimentais demonstraram também motivos para que essas medicações pudessem ser deletérias. Existem evidências de que pacientes gravemente enfermos - como pacientes sépticos, grandes queimados, se beneficiariam de níveis mais elevados de colesterol.
Além disso, a inibição da coenzina Q10 - como mecanismo implicado ao uso das estatinas, poderia ser deletéria nos pacientes com ICC que já há possuem em níveis mais reduzidos.

Para responder essa  questão foi elaborado um grande ensaio clínico com acrônimo de CORONA
Este estudo randomizou 5011 pacientes com idade superior a 60 anos portadores de ICC classe II, III e IV de etiologia isquêmica para o uso de atorvastatina 10 mg x placebo.
O desfecho primário proposto foi observar redução de mortalidade por causa cardiovascular associada a redução de IAM e AVC. Enquanto que o desfecho secundário foi um combinado de morte por todas causas, morte por doença coronariana , morte por doença cardiovascular e número de hospitalizações.
Durante o follow-up de cerca de 02 anos não foi observada redução no desfecho primário no grupo intervenção , a despeito da redução das taxas de LDL  e diminuição das taxas de PCR ultrassensível.

Um estudo negativo também está susceptível a erros sistemáticos e erros aleatórios. 
Quanto a existência de viéses, embora o estudo tenho sido simples cego - o uso de desfechos "hards" diminui a possibilidade de viés de aferição.

Além disso , é muito importante questionar se um estudo foi negativo devido a erro do tipo II - O erro tipo II ocorre quando você  não encontra uma associação que existe, que não foi encontrada por baixo poder estatístico, o que não aconteceu no estudo acima , pois o mesmo teve um poder de 90 %  para as diferenças que propôs detectar.

Devido a conclusão de não evidência de benefícios,  os autores propuseram que o tempo do uso da rosuvastatina não tenho sido suficiente para promover os efeitos da redução de eventos cardiovasculares nos pacientes com ICC de etiologia isquêmica. 
Outro ponto a  considerar é que o estudo foi limitado a não envolver pacientes com ICC diastólica ou de etiologia não isquêmica não sendo passível de extrapolar seus benefícios para estes subgrupos.


O estudo GISSI-HF trial realizado de forma similiar respondeu algumas das questões acima ao não encontrar benefício no uso de rosuvastatina em ICC de qualquer etiologia.

Dessa forma, não existem evidências para recomendar o uso de estatinas na maioria dos pacientes com ICC - o uso não deve ser encorajado de maneira independente dos níveis de LDL- colesterol ou doença aterosclerótica.








   









sábado, 13 de janeiro de 2018

Estudo FOURIER e evolocumabe uma revolução ainda distante da prática clínica.




Já havia estudo prévio demonstrando reduções significativas nas taxas de LDL através do uso do anticorpo monoclonal evolocumabe - os resultados demonstraram uma redução significante de 60%. Restava então saber, se essa redução do desfecho substituto (LDL) seria acompanhada da redução de desfechos clínicos, evitando eventos cardiovasculares maiores.

No ano de 2017,  então,  fomos brindados com os resultados do aguardado estudo FOURIER.

O estudo em questão foi conduzido por cerca de 48 semanas e randomizou de forma  duplo-cega e controlada por placebo 27.564  indivíduos com idade entre 40 e 85 anos portadores de doença aterosclerótica com LDL maior ou igual 70 ou HDL maior ou igual a 100  para uso de evolocumabe (140 mg por 2 semanas ou 420 mg por mês ) associado ao uso de estatinas de alta intensidade ou moderada intensidade
O estudo foi desenvolvimento justamente com objetivo de testar o benefício do uso do anticorpo monoclonal associado a uso de estatinas na redução de eventos cardiovasculares.

Vamos então a análise crítica.

De maneira até bastante insistente , sempre enunciamos aqui nesse espaço que uma evidência deve ser avaliada em três etapas. Inicialmente devemos verificar se possui validade interna, ou seja, garantir que os resultados não foram decorrentes de erros aleatórios e sistemáticos. Passada esta estapa, por último, devemos analisar a relevância dos resultados e sua aplicabilidade.

Metodologicamente o estudo criticado nessa postagem foi impecável.


Randomizado ( evitando viéses de confusão), duplo-cego ( evitando viéses de mensuração do desfecho) , controlado por placebo - com desfechos duros e feito com a intenção de tratar ( evitando viéses de tratamento).

Outro dado importante é que o estudo não foi truncado. Sabe-se que o trucamento ( interrupção precoce) tende a superestimar a magnitude do benefício alcançado com a intervenção. 

Para finalizar , quando nos atentamos a significância estatística, observamos que este estudo foi positivo, com valor de P menor que 5 % para o desfecho primário em questão, afastando a possibilidade de erro do tipo I.


Concluímos então que o estudo  FOURIER, possuí baixo risco de viéses e erro aleatório.

Garantida a validade interna , vamos então a análise da relevância e aplicabilidade.  Julgo esta a parte mais interessante da análise, pois o estudo em questão foi muito divulgado e festejado pelos pesquisadores e por membros da comunidade cardiológica.

O principal desfecho englobou um combinado de morte por doença cardiovascular, iam, avc não hemorrágico, hospitalização por angina instável e revascularização miocárdica.

Há uma forte menção no estudo , embora a conclusão, tenha sido tomada com base em desfecho primário, para os desfechos secundários, no caso do estudo citado - estranhamente os desfechos secundários foram um combinado de morte cardiovascular, iam ou avc , portanto, desfechos mais "hards" que os primários , logo mais interessantes para a prática clínica. 

Definido o desfecho, passamos a análise dos resultados.

Quando presta-se atenção na redução dos níveis de LDL, observa-se claramente um redução intensa -a média de LDL no inicio do estudo era de 92. Após cerca de 2 anos o LDL médio foi de 30. Uma redução média absoluta de 56 mg/dl ou 59%.
87% dos pacientes experimentaram uma redução para 70 mg ou mais e 67 % para  40 mg ou mais. De maneira bastante interessante 42 % experimentaram reduções inferior a 25 mg ou menos.



Essa redução intensa na taxa de LDL foi acompanhada de uma redução de risco relativo de 15% para o desfecho primário, às custas basicamente na redução nas taxas de IAM, mas isoladamente sem redução da mortalidade cardiovascular ou por todas as causas.

Quando falamos sobre o desfecho secundário, verificamos uma redução de cerca de 20 % no risco relativo.



Quando avaliamos a relevância de um estudo  devemos prestar atenção no tipo de desfecho e na redução absoluta do risco com seu respectivo NNT, reduções relativas são intrínsecas ao tratamento - reduções absolutas variam conforme o risco basal do paciente, portanto, mais interessante para a prática clínica. Além disso, o NNT , dependente da RAR, tem uma importante significância clínica.

Alguns ensaios clínicos , nos obrigam a calcular o NNT, entretanto na discussão do estudo, os autores mencionaram que 74 pacientes necessitariam ser tratados em 2 anos para prevenir morte cardiovascular, avc ou iam.



Vamos a aplicabilidade...

Primeiro, devemos ter em mente que este é um estudo de prevenção secundária, portanto, esperaria um impacto maior do tratamento.
Um NNT de 74 é considerado de baixa magnitude para eventos não fatais ( levando em conta que não houve redução de mortalidade).
De maneira paradoxal, alguns estudos de prevenção primária com desfechos compostos como, por exemplo, o clássico WOSCOPS, demonstraram NNT menores, apenas com o uso de estatinas.
Talvez, o tempo de follow- up do estudo FOURIER tenha sido muito pequeno, isto deve ser observado porque o efeito mais pronunciado da redução de eventos cardiovasculares apenas com o uso de estatinas ocorre mais a longo prazo, no próprio estudo é possível verificar que o benefício aumentou com o passar do tempo.
Um estudo com follow - up maior , poderia elucidar esta questão.

Quando analisamos aplicabilidade devemos levar em conta o custo-efetividade.
Julgo que o alto NNT apresentado ao custo elevado da medicação - cerca de 1200 dólares por mês cria um problema para o uso da medicação.
Um exercício mental é extrapolar isto para a nossa realidade no SUS, onde já temos uma grande dificuldade de implementar o uso de estatinas de alta intensidade devido ao custo para alguns pacientes.

A grande novidade do estudo foi demonstrar a existência de outras alternativas ao uso da estatina para paciente intolerantes ou que não conseguem reduções maiores com o uso da mesma em altas doses, portanto, nesse caso, o estudo funcionaria como uma evidência direta para aquele paciente com condições de arcar com os custos do tratamento, contudo esse mesmo custo cria um distanciamento do seu uso para a grande maioria das pessoas.

Outro ponto interessante é que o estudo reforça a tese do "more is more" - contudo ainda ficam os questionamentos sobre a existência de um ponto de inflexão ou uma curva em J.
Finalizando, fica outro ponto a considerar -  os valores absolutos são mais importante que as reduções percentuais - existindo então a necessidade de metas terapêutícas?