Existem cerca de 545 espécies de arbovírus e cerca de 150 dessas podem infectar seres humanos (LOPES; NOZAWA; LINHARES, 2014). A Dengue e a Chikungunya, que são transmitidas pelos mosquitos Aedes Aegypti e o Aedes Albopictus, são as mais conhecidas. Segundo os relatórios de (PLISA, 2020a, 2020b), no ano de 2019 essas duas doenças juntas ocasionaram um total de 3.349.019 casos nas Américas, resultando em 1.667 mortes. Dessa quantidade total de casos, 3.167.542 são de casos notificados de Dengue, sendo que apenas 1.413.801 (44,63%) destes foram efetivamente confirmados; enquanto que dos 181.477 casos notificados de Chikungunya, 101.190 (55,76%) foram confirmados. Esta baixa porcentagem de confirmação se deve ao fato de que essas doenças possuem sintomas semelhantes, tornando difícil a correta classificação entre Dengue, Chikungunya ou outra doença. O Brasil é um dos países mais afetados pelos arbovírus, onde cerca de 15,4% dos casos de 2019 ocorreram no país. Isto ocorre devido ao fato de que o Brasil é um país tropical, e possui condições climáticas favoráveis à proliferação do mosquito. Segundo Lima-Camara (2016), o Brasil também possui uma grande quantidade de outras arboviroses concomitantes, e somado com a ineficiência de alguns testes sorológicos por conta de apresentar reação cruzada, o diagnóstico de arbovírus no país torna-se um problema ainda mais sério. Estes problemas de classificação associados também ao fator de financiamento reduzido na área de saúde, destaca a necessidade de uma abordagem de baixo custo e acessível. Com isso, o presente trabalho propõe um modelo de deep learning para classificação de Dengue e Chikungunya utilizando dados clínicos para treinamento. Após uma análise do estado da arte sobre o tema, percebe-se uma grande lacuna de estudos que aplicam deep learning para classificação de arboviroses usando dados clínicos. A maioria dos trabalhos estão focados na classificação do sorotipo de Dengue, como em Pandiyarajan e Thangairulappan (2018), ou classificação se o paciente está ou não com Chikungunya, como em Hossain et al. (2019). Além disso, nenhum deles utiliza dados clínicos documentados pelos sistemas de saúde para treinar os seus modelos, recorrendo a alternativas mais simples (HOSSAIN et al., 2019) ou utilizando amostras de pele (PANDIYARAJAN; THANGAIRULAPPAN, 2018) que necessitam de aparelhos para coleta. O presente trabalho irá utilizar dados clínicos da base de dados do SINAN (Sistema de Informação de Agravo de Notificação) (SINANWEB, 2020) contendo dados do estado do Amazonas e do banco de dados aberto da cidade do Recife (Dados Recife, 2020), ambos entre os anos 2015 e 2019. Estas bases possuem dados clínicos, como sintomas e afins, que serão usados no treinamento do modelo para classificação. Atualmente, este trabalho está em desenvolvimento, no processo de pré-processamento da base de dados e seleção das melhores features da base que irão ser inseridas no treinamento do modelo.
Read more