O CORONAdiário tem publicado breves análises sobre a evolução da pandemia do coronavírus no Brasil e no mundo, baseadas nos números divulgados: casos registrados, óbitos, testes realizados e recuperados. Só que os dados não são iguais, pois há diferenças de critérios. Qualquer um que já tenha trabalhado com dados e ido um pouco mais a fundo para ver como são gerados conhece o problema, ainda mais se trabalhou com a coleta e compilação das informações primárias. Para completar, cada dia surgem novas notícias sobre subnotificações de casos e óbitos em todos os cantos. Isso leva a questionar sobre a validade de qualquer inferência decorrente dos dados.
As diferenças de critérios utilizados em cada país para computar um caso (ou óbito) são a primeira fonte de distorção. Alguns só se consideram aqueles que tiveram confirmação por um teste, enquanto em outros, o diagnóstico clínico basta. Só que muitas vezes nem os falecidos são testados, principalmente quanto o número de mortes dispara.
Começando pelo dado básico: casos registrados. Quantos infectados há? Ninguém sabe e nem há como saber. Quanto mais se testa, mais casos se encontra. Assim, o número de casos identificados está relacionado à quantidade de testes feitos. Só que em países em que o número de casos explodiu os testes podem ser limitados aos suspeitos em situação mais grave, deixando de fora parte da população. Muitos casos são assintomáticos ou com sintomas leves, facilmente confundidos com uma gripe comum. Assim, muitas pessoas podem ter tido contato com o vírus, criaram anticorpos e passam ao largo de qualquer estatística. Para saber o número exato, a população inteira teria de passar por teste, algo muito difícil de ser realizado. Países que conduzem testes em massa podem ter um número menos impreciso, mas ainda assim longe da realidade. Uma estimativa plausível seria com testes por amostragem da população*.
Para tornar as coisas ainda um pouco mais complicadas, existem diferentes tipos de testes, cada um com suas limitações e nenhum é 100% preciso, o que gera como resultado os falsos negativos (pessoas infectadas que não foram corretamente identificadas, apesar do teste). Os testes rápidos não são os mais indicados para identificar o vírus se a pessoa foi infectada poucos dias antes. Os testes mais precisos - RT-PCR, a sigla significa reação da transcriptase reversa, seguida de reação em cadeia da polimerase, que detecta um pedaço da sequência do RNA do vírus - são mais caros e demorados. Com alta demanda por esses testes e limitações de capacidade para realizá-los, podem tardar dias para se obter o resultado. (Para mais detalhes, veja essa matéria de O Globo).
Por causa dessas restrições, os óbitos são um indicador melhor. Contudo, parece haver uma subnotificação, em função dos critérios adotados. Na Inglaterra, se a pessoa não foi hospitalizada para tratar de Covid-19 ela não aparece entre as estatísticas de fatalidades da doença. Na Espanha, o jornal El País noticiou um aumento de três mil enterros em Madri em relação à média mensal, além dos casos reconhecidos.
O número de testes seria, em teoria, algo menos sujeito a distorções. Para se ter um número fidedigno, porém, cada país deveria compilar os resultados dos diversos locais de testes. Isso nem sempre ocorre, por dificuldades diversas. O sistema precisa receber os resultados dos exames feitos em cada hospital e cada laboratório, o que é factível, mas também de testes rápidos que podem ser feitos em outros lugares - até individualmente. Considerando que a coleta de dados foi feita a contento, há a questão da forma de compilação e divulgação. Alguns países informam o número de testes; outros, o número de pessoas testadas (uma pessoa pode ser testada várias vezes, até para diminuir a probabilidade de falsos negativos) e alguns não deixam claro o critério utilizado.
Essas são alguns dos pontos na origem dos dados. Há também outras questões, como o tratamento de dados retroativos - por exemplo, há um óbito no dia 3, mas apenas no dia 8 sai o resultado do exame. Por isso, algumas fontes são explícitas em indicar que se tratam dos casos/óbitos acrescentados no dia, independentemente da data em que ocorreram. Uma mudança de metodologia de classificação na China causou um pico no número de casos registrados em 13 de fevereiro, sem que isso significasse que houve um surto naquele dia. Para atenuar esse fenômeno, médias móveis costumam ser utilizadas.
Diferentes organizações compilam dados globais e seus números não batem. As diferenças não são expressivas, mas existem. até por uma questão de horário, pois nem o critério de dia é uniforme. Pode se considerar um dia pelo calendário local ou uma hora arbitrária (como GMT - a hora de Greenwich).
Com tudo isso, vale a pena utilizar os dados? Sim, desde que se conheça suas limitações e com a devida cautela. Só não considere um número qualquer como a expressão última da realidade. É, na melhor das hipóteses, uma boa aproximação. Mais do que números individuais, valem as tendências das curvas.
* Está em curso um teste assim conduzido pela Universidade Federal de Pelotas, inicialmente no Rio Grande do Sul e a ser estendido para o resto do Brasil.
sexta-feira, 10 de abril de 2020
Assinar:
Postar comentários (Atom)
-
A taxa de letalidade divulgada pelo Ministério da Saúde é de 4,6%. Essa taxa é a simples divisão de óbitos por casos registrados. No entanto...
-
Leia o CORONAdiário (média móvel de sete dias) As explicações sobre os gráficos estão nos links abaixo: - explicando o dashboard - I...
-
Duas curvas andam quase em paralelo: os casos registrados e os óbitos. Com alguns dias de atraso, os óbitos alcançam o número de casos regis...
Nenhum comentário:
Postar um comentário