Este repositório contém o módulo de aprendizado não supervisionado (clusterização) de um projeto mais amplo voltado à análise e modelagem de dados sobre a Dengue no Brasil utilizando técnicas de inteligência computacional.
O estudo incluiu abordagens supervisionadas e não supervisionadas, sendo elas:
- Previsão de surtos com base na série histórica por meio de regressão preditiva.
- Clusterização de métricas agregadas por municípios para a identificação de correlação entre perfis socioclínicos e regionais.
Para acessar o projeto completo, com todas as análises e código, visite o repositório principal.
📄 Leia o artigo do projeto para mais detalhes.
🎥 Confira também a apresentação em vídeo.
Este projeto foi desenvolvido no âmbito da disciplina de Inteligência Computacional em Saúde, ministrada pelo professor Andre Pacheco.
Os dados utilizados neste projeto foram obtidos a partir do portal OpenDataSUS, mantido pelo Departamento de Informática do Sistema Único de Saúde (DATASUS) do Ministério da Saúde do Brasil. A partir do conjunto de dados “Árboviroses/ Dengue”, foram obtidos registros referentes às notificações de dengue, conforme coletados pelo Sistema de Informação de Agravos de Notificação (SINAN).
Os arquivos, disponibilizados em formato CSV, organizam notificações individuais por ano. Cada linha da base de dados representa uma notificação individual de dengue, incluindo informações sobre sinais e sintomas clínicos, comorbidades, idade, sexo, raça/cor, escolaridade, datas de início dos sintomas, notificação e evolução do caso, além de local de residência e notificação. O dicionário de dados oficial do SINAN foi utilizado como referência para interpretação e padronização das variáveis incluídas na análise.
Tanto os dados como o dicionário podem ser encontrados aqui.
Por se tratarem de arquivos .ipynb, podem ser executados em diversos ambientes. Todavia, recomendamos fortemente a utilização do JupyterLab ou da extensão do Jupyter para VSCode.
Faça o download do projeto:
git clone https://github.com/intel-comp-saude-ufes/2025-1-P1-analise-e-modelagem-de-casos-de-dengue-no-brasil.git && cd 2025-1-P1-analise-e-modelagem-de-casos-de-dengue-no-brasilCrie um ambiente virtual para isolar as dependências do projeto.
python3 -m venv venvsource venv/bin/activateInstale as dependências.
pip install -r requirements.txtCaso opte pela utilização do JupyterLab:
pip install jupyterlabSe estiver usando a extensão do Jupyter para VSCode, basta abrir os arquivos e clicar em Run All. Caso esteja no JupyterLab, execute:
jupyter labe siga o mesmo procedimento.
- Os gráficos resultantes das análises são gerados em ./charts.
- É recomendável que execute os scripts em um computador com pelo menos 16GB RAM.
- Os detalhes de implementação estão documentados nos códigos.