O software entrega, através da estatística das palavras, o “mundo lexical” no discurso, e cabe ao pesquisador, no contexto, interpretar e tirar suas conclusões.
Sempre recebo essa dúvida: qual software de análise textual eu devo utilizar no meu projeto? ATLAS.ti, Alceste, IRaMuTeQ ou NVIVO? Ou não devo utilizar nenhum? A resposta é: depende. O software de análise textual a ser utilizado na sua pesquisa depende em verdade da disponibilidade do mesmo e da metodologia adotada para o trabalho.
Análise de Conteúdo Qualitativo
Seria difícil imaginar, antes da década de 1980, a automatização de análises de textos usando a informática. Com o advento e popularização do computador pessoal, pacotes de software estatísticos surgiram e permitiram que se facilitasse sobremaneira as análises de dados qualitativos, quais sejam, discursos, grupos focais, entrevistas, artigos, relatórios, todos de base textual.
Os softwares de análise textual estão cada vez mais fornecendo insights sobre psicologia, sociologia, ciência política, ciência cognitiva e assim por diante – em geral, o estudo da tomada de decisões individuais ou coletivas. Aqui, observamos que um desafio colocado aos estudiosos de discursos é o uso inovador de software de análise textual avançado para analisar sistematicamente os discursos dos atores. Longe de serem mecânicos, tais métodos (se usados apropriadamente) podem ser tremendamente esclarecedores.
Os pesquisadores de análise textual quantitativa podem ser encontrados em muitas disciplinas, em especial nas humanas. Há uma série de desafios enfrentados pelo estudo empírico qualitativo de textos, por exemplo, compreender a dimensionalidade subjacente dos dados textuais – pode-se facilmente ser capturado em uma única dimensão ideológica (geralmente esquerda – direita) ou são necessárias várias dimensões? Se for o último, como medimos e entendemos o texto em N dimensões?
As análises textuais quantitativas também são desafiadas enquanto produzem resultados robustos. Uma forma de validar descobertas é submetê-las a uma metodologia totalmente diferente. Por exemplo, pode-se empregar entrevistas com quem produziu os textos sob investigação, pedindo-lhes que avaliem a validade dos resultados da análise textual.
Softwares Tornam o Subjetivo Mais Objetivo
Os softwares para análises qualitativas, ou Qualitative Data Analysis Software (QDAS) para computação qualitativa não-numérica surgiram na década de 1980 e, desde sua origem, permitem manipulação de textos digitalizados ou escaneados, classificação hierárquica e temática, e ferramentas gráficas para filtragem (análise fatorial).
Eles evoluíram nesses 40 anos com novas tecnologias para mineração de dados, análise textual e incorporação de dados multimídias (como vídeos e áudios) e de redes sociais. Além disso, os QDASs têm como vantagens: economia de tempo demandado para organizar, analisar e tratar informações coletadas e trabalhar com dados qualitativos (entrevistas, textos, grupos focais, questionários on-line, etc.).
Possuem aplicação em diferentes contextos, como, por exemplo: linguística, processamento de pesquisas, consultoria, marketing, publicidade, jornalismo, história, sociologia, direito, medicina, pesquisa documental, análise de imprensa, entre outros, e seu uso atribui rigor científico na análise dos textos, pois quantifica um texto para extrair suas estruturas mais significativas.
Essas estruturas estão estreitamente relacionadas com a distribuição de palavras em um texto, o que é raramente aleatória. No entanto, os métodos informatizados de análise em nada excluem a necessidade de conhecimento e interpretação subjetiva por parte do pesquisador durante o tratamento das informações.
Qual Software Utilizar?
Atualmente, os quatro softwares mais conhecidos no Brasil são o ALCESTE, ATLAS.ti, NVIVO e o IRaMuTeq.
O Alceste foi criado por Max Reinert em 1990 baseado na sua série de artigos sobre o que ele chamou de “mundos lexicais”. Por meios puramente distributivos, os conjuntos de palavras que caminham juntas no discurso são isolados e representados para o pesquisador, como um traço de algum “mundo lexical” que permanece por interpretar. O software faz isso usando apenas uma abordagem estatística para analisar a distribuição das palavras no corpus, enquanto permanece completamente surdo para o significado das próprias palavras. Os únicos aspectos semânticos embutidos no software são alguns dicionários gramaticais que permitem reduzir as formas verbais a uma única raiz (reduzindo todas as flexões de um único verbo ao seu radical, ou nomes do plural ao singular) e classificar as palavras em várias classes gramaticais (substantivos, verbos, artigos, etc.) de modo a eliminar palavras funcionais (artigos, algumas preposições) na análise.
O NVIVO, desenvolvido pela QSR International desde 1997, é um pacote qualitativo de software para análise de dados, possui uma gama de funcionalidades para se trabalhar. Permite análises básicas, de clusters e direções de sentido (positivo/negativo), além de comparações de diferentes codificadores nos textos, seguindo principalmente a metodologia de Análise de Conteúdo da Laurence Bardin. Consiste em uma técnica metodológica que se pode aplicar em discursos diversos e a todas as formas de comunicação, seja qual for o seu suporte. A enumeração pode ser feita através da presença (ou ausência), frequência, frequência ponderada, intensidade, direção, ordem e co-ocorrência (análise de contingência). Depois da codificação, deve ser feita a categorização, que seguirá algum dos seguintes critérios: semântico, sintático, léxico ou expressivo. O NVIVO possibilita colaboração entre pesquisadores à distância e codificação até na mesma máquina. É possível fazer recortes e codificação de áudios e vídeos, além de textos. E faz também transcrição de áudio na própria ferramenta, o que é muito útil na análise de entrevistas gravadas.
Atlas.ti é uma ferramenta, desenvolvida desde 1993 por Thomas Muhr, na Universidade Técnica de Berlim, que auxilia o pesquisador no processo de organização da análise dos dados qualitativos. Ele é muito semelhante ao NVIVO quanto às funcionalidades, mas voltado principalmente para textos, seguindo também a metodologia da Bardin. Codifica materiais de texto, imagem, geodados, áudio e vídeo. Tem suporte a PDF e transcrição de áudio. Cria nuvem de códigos, hiperlinks entre materiais, faz análise de proximidade de dados codificados e apresenta visualização integradas para comparação de documentos.
O IRaMuTeQ é um software livre ligado ao pacote estatístico R para análises de conteúdo, lexicometria e análise do discurso, todos os seus algoritmos são baseados no mesmo modelo do Alceste, no entanto, o IRaMuTeQ foi desenvolvido a partir da lógica open source (software livre), sendo elaborado com a linguagem Python, dedicando-se desde à análise bem simples, como a lexicografia básica (cálculo de frequência de palavras), até análises multivariadas (classificação hierárquica descendente, análises de similitude). Foi desenvolvido por Pierre Ratinaud, do Laboratoire d’Études et de Recherches Appliquées em Sciences Sociales (Laboratório de Estudos e Pesquisas Aplicadas em Ciências Sociais) – LERASS, da Universidade de Toulouse III, utilizando a interface do software R (R Project for Statistical Computing). Desses, apenas o IRaMuTeq é de código aberto e de livre utilização.
Meus Resultados São os Mesmos em Cada Software?
Uma maneira de produzir resultados robustos e defensáveis a partir da análise textual é perguntar se meus dados parecem diferentes quando examino de perspectivas diferentes ou usam kits de ferramentas metodológicas diferentes? Nesse caso, pode-se muito bem ter menos confiança na abordagem inicial.
Do contrário – se os mesmos resultados fundamentais emergirem repetidamente – o pesquisador pode ter quase certeza de que está em uma base sólida. Reproduzir resultados usando dois pacotes de software de análise textuais alternativos nem sempre é possível, seja por falta de tempo ou de recursos financeiros, mas a literatura mostra que, o desafio final para os pesquisadores de análise textual está em avaliando os discursos, quem é persuadido pelas palavras dos falantes e com que efeito? Como e por que palavras e argumentos são importantes?
Nosso uso de análise textual automatizada fornece uma grande vantagem para lidar com questões de como e quando mudanças importantes ocorreram e para entender como e porquê as decisões foram tomadas.
Em resumo, softwares de análise qualitativa automatizada medem sistematicamente (e estatisticamente) as palavras e frases características e, em alguns casos, a dimensionalidade dos discursos dos atores.
O software considera o texto como uma grande matriz de co-ocorrências entre formas lexicais e o processa com técnicas multivariadas. Uma característica fundamental é que pode ser usado para identificar a tendência dos falantes de articular ideias e argumentos específicos – ideias e argumentos que podem então ser correlacionados com as características do falante (o nome do falante, afiliação partidária, características de sexo, idade, localização, etc.) e atribuída significância estatística.
O pesquisador, contudo, não deve considerar os resultados da análise textual automatizada sem adaptá-los ao assunto examinado, a forma de argumentação dos atores, como essa evoluiu temporalmente – e, o mais importante, como esses atores foram afetados como resultado desse processo de análise.
Finalmente, demonstra-se que, usando mais de um pacote de software de análise textual automatizada, verifica-se a robustez dos resultados e descobertas dos pesquisadores. Encontra-se, em suma, muito pouca variação nos resultados de análises em relação às descobertas iniciais.
Vimos então que a escolha do software passa pela disponibilidade do mesmo, familiaridade com o uso e aderência à metodologia que será aplicada. Para complementar, o software entrega, através da estatística das palavras, o “Mundo Lexical” no discurso, e cabe ao pesquisador, no contexto, interpretar e tirar suas conclusões.
Se quiser aprender a utilizar o software IRaMuTeQ no seu projeto, inscreva-se para a próxima turma do Curso IRaMuTeQ clicando abaixo.
Link curto para esta página: https://bit.ly/SoftwareAfetaAnaliseTextual