Vigência: 2021-2022
Resumo: O problema de agrupamento (clustering) tem sido considerado como um dos problemas mais relevantes dentre aqueles existentes na área de pesquisa de aprendizagem não-supervisionada (subárea de Aprendizagem de Máquina). Embora o desenvolvimento e aprimoramento de algoritmos que solucionam esse problema tenha sido o principal foco de muitos pesquisadores o objetivo inicial se manteve obscuro: a compreensão dos grupos formados. Tão importante quanto a identificação dos grupos (clusters) é sua compreensão e definição. Uma boa definição de um cluster representa um entendimento significativo e pode ajudar o especialista ao estudar ou interpretar dados. Portanto, existe a necessidade de descobrir o que caracteriza cada cluster formado. A existência de um rótulo permite a identificação de quais características definem um grupo. Diversas propostas de métodos de rotulação foram desenvolvidas no âmbito do LINA (Laboratório de INteligência Artificial) da UFPI. Cada um utiliza uma técnica diferente tais como: uso de redes neurais, Fuzzy C-means, uso de Interdependência Classe-Atributo, graus de pertinência de grupos e erro de regressão. Acredita-se que com a combinação dos métodos até agora propostos, podemos chegar a uma rotulação de melhor qualidade do que quando aplicados individualmente. Baseado neste conceito, o objetivo desse projeto consiste em apresentar uma abordagem, baseados em ensemble, capaz de combinar as diferentes técnicas de rotulação já consolidadas com o objetivo melhor realizar o processo de rotulação.