Projeto e desenvolvimento de um sistema para definição de aspectos e análise de sentimentos em textos

Carregando...
Imagem em miniatura
Data
2016-02-03
Orientador
Evandro Franzen
Banca
Título do periódico
ISSN
Título do Volume
Editor
Resumo
Opiniões possuem grande relevância no comportamento humano. As tomadas de decisões em organizações baseiam-se, muitas vezes, na opinião de seus steakholders. Já são inúmeras empresas que atuam na obtenção de opiniões a partir de plataformas como páginas web, redes sociais, blogs, fóruns e sites de avaliação de produto. Nestes ambientes é que a mineração de opiniões ou analise de sentimento pode ser aplicada com o objetivo de identificar automaticamente a opinião nas expressões, com flexibilidade e rapidez, realizando avaliações, polarizando sentimentos em uma grande massa de conteúdo na forma de texto. No processo de data mining ocorre a limpeza de ruídos, filtragem de informações, segmentação, atribuição de valores, lógicas de agrupamento, utilizando algoritmos de classificação, agrupamento, associação conforme objetivos e resultados. A busca pela classificação da polaridade no texto é baseada em diversos métodos de acordo com a necessidade ou cenário: O método léxico de classificação tem o pré-processamento simples nos textos com menos tokens e normalizações sem a necessidade de treinos, o método aprendizado de máquinas de processo supervisionado é sensível às atribuições das features, tem seu desempenho de acordo com a qualidade de dados treino. Este trabalho propõe o uso de técnicas de mineração de opiniões, a partir dos dados extraídos em sites de lojas eletrônicas, permitindo a definição de aspectos e polaridade aos dados, possibilitar a extração dos dados para arquivos de extensão arff, suportado pela ferramenta Weka. Execução de processo não-supervisionado de filtragem em conjuntos de dados para treinamento, permitindo a seleção, o pré-processamento e aplicação de algoritmos para definição do sentimento, gerando estatísticas para posterior análise.

Opinions have great relevance in human behavior. Decision making in organizations are based often on the opinion of steakholders. There are now numerous companies operating in obtaining opinions from platforms such as web pages, social networks, blogs, forums, product review sites. In these environments is that mining of opinions or feelings of analysis can be applied in order to automatically identifying the view in the expressions with flexibility and speed, conducting assessments, polarizing feelings in a large body of content in text form. In the data mining process occurs noise cleaning, information filtering, segmentation, assignment of values, logical grouping, using ranking algorithms, clustering, association as objectives and results. The search for the text polarity classification is based on various methods according to necessity or setting: The lexicon method of classification which has the simple preprocessing in the texts under tokens and normalization without the need for training, supervised process of machine learning method is sensitive assignments of features, has its performance according to the quality of training data. This paper proposes the use of opinions mining techniques, based on data extracted in electronic shopping sites, allowing the definition of the data paints and polarity, allow for the extraction of data files arff extension, supported by the Weka tool. Execution of unsupervised process of filtering data sets for training, allow the selection, preprocessing of data and the application of algorithms to define the feeling, generating statistics for later analysis.
Descrição
Palavras-chave
Mineração de opiniões; Classificação da polaridade; Aprendizado de maquinas e sistemas de informação
Citação
SAUSEN, Frederico Jacobi. Projeto e desenvolvimento de um sistema para definição de aspectos e análise de sentimentos em textos. 2015. Monografia (Graduação em Sistemas de Informação) – Universidade do Vale do Taquari - Univates, Lajeado, 25 nov. 2015. Disponível em: http://hdl.handle.net/10737/930.