Descoberta de Risco em Licitações do Tribunal de Contas do Estado do Piauí baseado em Aprendizagem de Máquina Supervisionada utilizando atributos textuais e descritivos

Dissertação de Mestrado
Aluno: Valney da Gama Costa

Resumo:

Resumo
A licitação é o processo administrativo em que um órgão público oferta às empresas interessadas a oportunidade de efetuarem propostas para a realização de serviços ou compra de um ou mais produtos para este ente e escolhe dentre elas a que melhor supre o que é pedido, respeitando critérios definidos em lei. O Tribunal de Contas do Estado do Piauí é um dos órgãos públicos de controle externo, responsável pela fiscalização contábil, financeira e orçamentária de outros órgãos e entidades do estado do Piauí. Os auditores
do TCE/PI têm dificuldade em examinar todos os procedimentos licitatórios publicados antes da efetivação e gasto financeiro dos envolvidos. Este trabalho tem como objetivo descobrir antecipadamente ou durante a execução dos procedimentos licitatórios, um rótulo de risco que facilite sua fiscalização. Portanto pretende-se definir a criação de um modelo de decisão baseada em aprendizagem de máquina em conjunto com técnicas de processamento de linguagem natural, para tratamento de atributos textuais e descritivos, aplicado aos procedimentos licitatórios publicados no Tribunal de Contas do Estado do Piauí, melhorando as técnicas de fiscalizações dos Tribunais de Contas a partir de dados públicos das próprias licitações publicadas no órgão, e informações de análises anteriores de auditores. Os modelos desenvolvidos utilizaram os algoritmos J48, RandomForest e Redes Neurais Multicamadas (MLP) e obtiveram acurácias médias até 81%, com destaque ao algoritmo de RandomForest, responsável por obter acurácia máxima de 82%.

Download do Trabalho

Rotulação Automática de Grupos Através do Uso de Filtros de Ganho de Informação de Atributos

Dissertação de Mestrado
Aluna: Marina dos Reis Barros Alencar

Resumo:

Identificar semelhanças nos dados que não foram rotulados, classificados ou categorizados é uma das funções do aprendizado não supervisionado. O agrupamento (do inglês clustering) é uma técnica que permite dividir automaticamente o conjunto de dados de acordo com uma similaridade. A grande vantagem do uso das técnicas de agrupamento é que, ao agrupar dados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Dessa forma, este trabalho tem como objetivo a interpretação desses grupos através de rótulos. O rótulo é um conjunto de valores relevantes que representam uma definição para um grupo. Esta abordagem utilizou técnicas com aprendizagem de máquina não supervisionada, aplicação dos filtros de ganho de informação através da seleção de atributos e um modelo de discretização. Na metodologia proposta foi aplicado o algoritmo não supervisionado para formação dos grupos e diferentes filtros de seleção de atributos para expor a relevância dos atributos e comparar o funcionamento deles. Também, para contribuir no processo de rotulação foi utilizado um método de discretização auxiliando no cálculo da variação de valores dos dados. O modelo proposto foi aplicado na rotulação das bases de dados disponíveis no repositório UCI, sendo elas, Íris, Seeds, Wine e Glass. Obtendo-se uma taxa de acerto média de 83.66% com desvio padrão médio de 4.98.

Download do Trabalho

Um descritor híbrido de dados clínicos com textura ou deep features para classificação de patologias renais

Aluna: Laiara Cristina da Silva
Dissertação de Mestrado

Resumo:

A importância da função glomerular na fisiologia renal e o fato de suas lesões afetarem outros segmentos do néfron caracterizam as enfermidades glomerulares, como um dos principais problemas em Nefrologia nos dias de hoje. No Brasil, as glomerulopatias são uma das causas mais comuns de falência renal e responsáveis por cerca de 27% dos transplantes. Desta forma, encontrar e classificar lesões glomerulares são etapas fundamentais para o diagnóstico de muitas doenças renais e que contam com a experiência de um nefropatologista. Além disso, muitos fatores como fadiga e trabalho repetitivo inerentes à profissão podem conduzir a um diagnóstico errado. Por outro lado a Aprendizagem de Máquina se apresenta como importante ferramenta devido à sua capacidade de simular o conhecimento de um especialista a partir de experiências passadas, por isso, vêm sendo utilizada com sucesso na resolução de muitos problemas complexos. Tendo isso em vista, este trabalho realiza um estudo comparativo entre os algoritmos de Aprendizagem de Máquina Árvore de Decisão, SVM, Random Forest e MLP a fim de propor um modelo de classificador que auxilie o profissional especialista na definição de um diagnóstico de patologia renal. Concomitante ao estudo comparativo entre os classificadores, este trabalho também analisa 6 descritores de textura das imagens, cuja combinação de 1 ou mais desses descritores será adicionada aos dados clínicos correspondentes à cada imagem e juntos servirão como entrada de um classificador. Além disso, outro conjunto híbrido de dados clínicos com deep features foram testados, ao todo foram testadas 5 redes pré-treinadas. Os melhores resultados que obtivemos foi quando concatenamos os recursos de DC e HOG, que resultou em um excelente índice Kappa e acurácia de 98,46% e quando concatenamos DC e MobileNet, obtivemos índice Kappa excelente e acurácia de 95,38%.

Download do trabalho