Rotulação Automática de Grupos com Árvores de Decisão: Uma Abordagem Comparativa

Dissertação de Mestrado
Aluno: Manoel Messias Pereira Medeiros

Resumo: O volume exponencial de dados impulsiona o crescimento da análise de dados. O agrupamento de dados é uma técnica importante, mas a interpretação dos grupos pode ser desafiadora. A rotulação automática de grupos com árvores de decisão pode ajudar a resolver este problema. Afim de se validar este modelo de rotulação automática de grupos com uso de árvores de decisão este trabalho apresenta uma comparação entre quatro algoritmos de árvore de decisão no contexto da rotulação automática de grupos.

Inicialmente, destaca-se a importância dos modelos de rotulação de grupos como ferramentas para auxiliar especialistas na interpretação de dados, fornecendo uma definição concisa das principais características dos grupos. A escolha do algoritmo de árvore de decisão impacta significativamente na performance do modelo, conforme demonstrado em um estudo comparativo utilizando os algoritmos ID3, C4.5, CART e CHAID. Os resultados revelaram que o algoritmo CHAID obteve os melhores resultados nas bases Íris e Sementes, enquanto o algoritmo C4.5 foi mais eficaz nas bases Vinho e Vidros. As taxas de concordância do algoritmo de melhor desempenho em cada base se aproximaram ou superaram a média encontrada na literatura. A validade do modelo de rotulação automática de grupos foi confirmada, destacando a importância da escolha criteriosa do algoritmo de árvore de decisão.Os resultados deste estudo ressaltam o potencial dos modelos de rotulação automática de grupos e a relevância da seleção adequada do algoritmo de árvore de decisão.

Pesquisas futuras são essenciais para aprimorar o modelo e expandir suas aplicações, contribuindo para diversos campos, como descoberta de padrões em bancos de dados, identificação de grupos em estudos de bioinformática e segmentação de mercado-alvo com
necessidades semelhantes.

Download do Trabalho

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *