As lições da análise de dados para o combate ao novo coronavírus


Por Fábio Meneghim* O crescimento vertiginoso dos casos de infecção pelo novo coronavírus representa um grande desafio para governos e órgãos públicos do mundo inteiro. Em meio a uma explosão de informações vindas de todos os lados, é hora de ater-se aos números e aos dados. Em um momento turbulento como esse, eles devem ser a base de qualquer tomada de decisão.

A análise de dados ensina, em primeiro lugar, a importância da transparência. Por exemplo, para um país chegar a números sólidos sobre a COVID-19 no seu território, é preciso contar com a cooperação de todos os órgãos de saúde, tanto públicos quanto privados.

A qualidade dos dados também deve ser levada em conta. O número de fatalidades, por exemplo, é um numerador, ou seja, um valor praticamente idêntico à realidade, já que todo óbito é devidamente registrado nos hospitais. Já o número de infectados é um denominador, ou seja, um número aproximado da realidade. Afinal, muitas pessoas podem estar infectadas com o coronavírus e, por não apresentarem os sintomas, não realizaram o teste e não foram contabilizadas na estatística.

Dados incompletos podem prejudicar ações de saúde, além de mexer negativamente com o clima da sociedade – seja criando um pânico excessivo, seja criando a impressão de que tudo está bem quando não está. A desinformação causada por dados mal colocados ou mal apurados pode ter graves consequências.

No caso do novo coronavírus, um exemplo claro disso é o mistério em torno dos efeitos da cloroquina no tratamento dos doentes. Um estudo promovido por um médico francês afirma que o remédio tem eficácia no combate à COVID-19. Outros cientistas ressaltam os efeitos colaterais do medicamento e contestam as pesquisas a favor do seu uso. No fim das contas, em meio a essa falha na apresentação de dados sólidos, muitos brasileiros foram às farmácias em busca da cloroquina e acabaram com os estoques do medicamento, prejudicando quem faz o seu uso regular, como pacientes que sofrem de lúpus.

Afinal, qual o percentual de pessoas acometidas pela COVID-19 que foram curadas ou tiveram os sintomas reduzidos graças à cloroquina? Que fatores contribuíram para isso? Perguntas que apenas uma profunda coleta e análise de dados poderia responder, e a partir daí gerar conclusões sobre o uso do medicamento.

Tenho acompanhado algumas iniciativas bem interessantes neste período. Uma delas é do Kaggle , uma comunidade de profissionais da ciência de dados e machine learning que está promovendo alguns desafios para ajudar a comunidade global e os governos a tomarem decisões mais assertivas. Um desses desafios é fazer uma curadoria de cerca de 45 mil artigos científicos para encontrar expressões, palavras e dados em comum para responder a algumas perguntas-chave sobre o novo coronavírus. Esse tipo de pesquisa está um passo à frente daquilo que as organizações e órgãos de saúde têm feito pelo mundo e pode trazer insights relevantes.

Enquanto isso, em meio a um ambiente com dados ambíguos e pouco precisos, o que está ao nosso alcance é tomar ações baseadas na análise do custo dos falsos positivos e falsos negativos. No primeiro caso, trata-se de uma pessoa que não tem o vírus, mas foi incorretamente classificada como infectada, e que, portanto, receberia medicação e ficaria em quarentena. O custo desse erro seria relativamente baixo, já que a vida da pessoa não está em risco. Já o falso negativo permitiria a uma pessoa infectada andar em locais públicos e espalhar o vírus, gerando um custo muito alto para toda a sociedade.

Foi assim que a Organização Mundial da Saúde (OMS) chegou à conclusão de que o isolamento social do maior número de pessoas possível é a arma mais eficaz para evitar ou retardar a expansão do novo coronavírus. Uma medida emergencial, mas efetiva enquanto outros dados não trazem mais luz ao debate.

A humanidade está diante de um grande desafio, no qual preservar vidas é o objetivo principal. Nesse contexto, mais do que nunca, os dados são nossos aliados. Basta saber o que fazer com eles para tomar as melhores decisões.

Fábio Meneghim – é gerente de vendas da Hitachi Vantara.