Contextual Information Extraction Technique based on 5 steps

Contextual Information Extraction Technique based on 5 steps (CIET.5) é uma nova técnica de extração de informações contextuais baseada no Modelo de Espaço Vetorial, proposta no meu projeto de mestrado intitulado “Exploração de informações contextuais para enriquecimento semântico em representações de textos”. Informações detalhadas dessa técnica podem ser obtidas em sua página oficial. Analogamente à técnica CIRT.5 (veja a página da aplicação), essa técnica assume que a relação de frequência entre os termos é dependente, considerando a dependência de um conjunto de termos correlacionados (contexto) diretamente proporcional à frequência com que seus termos ocorrem em um documento de texto. Como são consideradas similaridades entre todos os contextos extraídos, os documentos de texto da coleção analisada tornam-se intercambiáveis em relação ao compartilhamento de informações semânticas e contextuais.

A técnica de extração de contextos textuais CIET.5 foi inicialmente explorada de maneira empírica na área de Sistemas de Recomendação. Nesse trabalho em questão, essa técnica foi avaliada como um procedimento de enriquecimento textual em uma coleção de textos de reviews, tendo sido utilizados modelos de linguagem baseados em word embeddings, pré-treinados a partir de textos extraídos da Wikipédia. De acordo com os resultados obtidos, verificou-se que sistemas de recomendação baseados em contextos normalmente são mais efetivos do que aqueles que não os consideram, o que permite caracterizar a CIET.5 como uma alternativa à soluções tradicionais que ignoram aspectos textuais semânticos e contextuais.

Deixe uma resposta