Compartilhe:

O que é a “modelagem de textos” e como ela pode ajudar as pessoas a usar a língua de forma mais eficiente

O que é o projeto?

‘Modelagem de Textos’ é um projeto extenso de pesquisa da área de Ciências da Linguagem. Neste projeto, abrigamos outros projetos menores que se juntam para contribuir para este projeto maior. Tanto no projeto mais geral quanto nos outros mais específicos, nós pesquisamos (i) como a língua humana está organizada, incluindo seus sistemas, regras, estruturas e categorias; e (ii) como ela é usada por nós, falantes, nas mais diversas situações da vida.

Na pesquisa sobre (i) como a língua humana está organizada, o nosso trabalho é produzir descrições, relatórios e análises sobre a língua – os sistemas e regras que ela desenvolveu para as pessoas conseguirem falar sobre o mundo que nos cerca, criar nossa cultura e desenvolver a nossa vida em sociedade.

Já na pesquisa sobre (ii) como a língua é usada pelos falantes, o nosso trabalho é criar modelos de textos, que vão desde modelos das conversas mais descontraídas, da nossa vida cotidiana, como conversa informal e bate-papo; até os modelos de textos mais controlados, de situações que exigem conhecimento técnico rigoroso, como artigos científicos e manuais de operação de equipamentos.

2. Onde acontece e quem trabalha no projeto?

O projeto é realizado no Instituto de Ciências Humanas e Sociais – ICHS da Universidade Federal de Ouro Preto – UFOP.

As pesquisas do projeto acontecem no Laboratório Experimental de Estudos da Linguagem – LEXEL, associado ao Programa de Pós-Graduação em Letras – POSLETRAS.

No LEXEL, o projeto conta com o trabalho de pesquisadores em diferentes níveis, que podem ser Professores da UFOP, Pós-Doutores, Doutores e Mestres em Linguística, além de alunos da graduação em projetos de Iniciação Científica, ou alunos da pós-graduação em projetos de Dissertação de Mestrado.

Além do trabalho na UFOP, o projeto conta ainda com parcerias com outras universidades fora do Brasil porque forma parte de uma Rede de Pesquisa Internacional. Atualmente, esta Rede conta com mais de 20 pesquisadores, que lideram projetos de pesquisa que complementam o trabalho que realizamos aqui na UFOP. Esses pesquisadores são Professores de universidades em diferentes partes do mundo: Argentina, Austrália, Brasil, Chile, China, EUA, Indonésia e Reino Unido.

3. Quais são os objetivos do projeto?

Em linhas gerais, o projeto foi criado porque precisamos transformar o conhecimento sobre a língua em modelos de texto.

Os modelos são feitos para ajudar as pessoas a usar a língua de forma mais eficiente – tanto para falar melhor, quanto para escrever melhor. Isto porque as pessoas podem precisar de falar e escrever melhor em muitas situações, como por exemplo: prestar concursos que exigem redação, falar em público, ler e interpretar textos difíceis, participar de reuniões de trabalho, redigir relatórios, aprender línguas estrangeiras, dentre tantas outras.

De maneira específica, o projeto tem como objetivo modelar vários tipos de texto e, com isso, formar uma base de dados.

A base de dados funciona como se fosse uma biblioteca de modelos de texto. Com esta biblioteca esperamos que profissionais da linguagem – como professores, tradutores, revisores, linguistas, redatores, entre outros – possam consultar e usar os modelos em suas atividades.

4. O que é pesquisado no projeto?

O nosso objeto principal de pesquisa é a Produção de Significado. Um segundo objeto também muito importante são os Modelos de Texto.

Da mesma forma que uma fábrica produz computadores, automóveis, medicamentos etc., os falantes de uma língua produzem significados sempre que falam ou escrevem. Cada um de nós, falantes, é uma “fábrica de textos”. O que nós pesquisamos é como funciona essa fábrica e como podemos fazer para ela produzir com mais qualidade.

A Produção de Significado quer dizer, em outras palavras, a forma como as pessoas usam a língua para falar e escrever textos. A maior parte do tempo da nossa pesquisa é dedicada a explicar teoricamente como acontece esta produção. Para isso usamos conceitos de teoria linguística e métodos de pesquisa científicos.

Uma vez que conseguimos explicar alguma forma de Produção de Significado, passamos a uma segunda etapa que é criar um processo para ela poder ser convertida, na prática, em Modelos de Texto.

Assim como uma planta de arquitetura é um modelo que guia a forma de construir um prédio, ou um molde de costura é um modelo que guia a forma de coser uma roupa, um Modelo de Texto também é um guia. Neste caso, é um guia para a leitura, interpretação e produção de textos.

Dessa maneira, um Modelo de Texto é a soma das características mais frequentes e mais relevantes que um texto deve ter para ser bem aceito por seus leitores (no caso de texto escrito) e ouvintes (no caso de texto oral). Os Modelos de Texto podem ser usados no futuro para que novas pessoas possam aprender a falar e escrever com mais qualidade.

5. Quais são os conceitos teóricos mais importantes para o projeto?

Os conceitos teóricos mais importantes são os de Recursos Linguísticos e Língua em Uso.

O primeiro conceito teórico que precisamos no projeto é o de Recursos Linguísticos. Aqui o conceito de Recursos é muito parecido com aquele usado em ‘recursos naturais’, ou ‘recursos financeiros’. Significa uma quantidade de matéria-prima ou os meios que usamos para transformar em alguma coisa.

Assim como em uma marcenaria a madeira é a matéria-prima, os Recursos Linguísticos são a matéria-prima de uma língua que estão disponíveis para os falantes produzirem seus textos. Na marcenaria, a madeira vem na forma de tábuas, vigas, caibros, etc. Os Recursos vêm na forma de fonemas, morfemas, palavras, frases entre muitos outros recursos. As tábuas, vigas e caibros servem para fazer móveis, telhados, assoalho; os fonemas, palavras, frases etc. servem para falar, escrever, entender, ler e até mesmo para organizar nosso pensamento.

Com isso, uma vez que cada falante é uma fábrica de textos, podemos dizer que a língua é o recurso mais importante que nós, seres humanos, temos para organizar o mundo em que vivemos.

Inclusive, quando paramos para pensar que usamos a língua em quase tudo – para estudar, trabalhar, divertir, conversar – praticamente o tempo inteiro do nosso dia, vemos que é por causa que usamos a língua que conseguimos dar sentido ao mundo, desenvolver a criatividade, resolver todo tipo de problema, relacionar com as outras pessoas e organizar os grupos de pessoas da família, do trabalho, da escola, do bairro, da aldeia, da tribo, da cidade, etc.

Por esse motivo, entender quais são e como funcionam os Recursos Linguísticos é muito importante. Então chegamos ao outro conceito teórico relevante para nós, o da Língua em Uso.

Segundo esse conceito, as línguas existem porque são usadas pelo conjunto de todos os falantes ao longo de centenas e centenas de anos. Cada vez que uma pessoa se vale dos Recursos Linguísticos – isto é, usa a língua para interagir com as outras pessoas, escrever um texto, conceber uma ideia, resolver um problema ou registrar um acontecimento – ela está contribuindo para manter a língua viva; e as línguas só estão vivas porque são usadas. Em outras palavras, a língua só existe porque os falantes transformam a matéria-prima dos Recursos Linguísticos em Língua em Uso.

6. Quais são as metodologias de pesquisa usadas no projeto?

No nosso dia-a-dia de pesquisa, cumprimos várias etapas para produzir os Modelos de Texto. Desde a escolha de um tipo de texto até a publicação final do modelo, a ordem das etapas segue a forma:

1) Escolhemos um tipo de texto que precisamos modelar. Então, procuramos por trabalhos já publicados que possam ajudar na análise e descrição da Produção de Significado e do Modelo de Texto. Esta parte envolve muitas leituras de livros teóricos de linguística e de artigos científicos.

2) O passo seguinte é coletar muitos exemplos de um tipo de texto. Os textos são coletados de páginas da internet, de livros, vídeos, gravações, e entrevistas. Dependendo do modelo, podemos coletar até entre 80 e 100 textos.

3) Em seguida, realizamos experimentos para selecionar apenas aqueles que são “bons exemplos”, ou seja, os textos que são mais típicos para que o modelo possa ser o mais útil possível.

4) Utilizamos categorias da teoria linguística para analisar cada texto que selecionamos. Cada frase de um texto é analisada para cerca de 430 etiquetas, sendo que cada etiqueta equivale a uma categoria. Assim, os textos, que em média possuem cerca de 40 frases, recebem aproximadamente 17.200 etiquetas de categorias. Quando consideramos um modelo feito a partir de 100 textos, estamos então tratando de mais de 1 milhão e 700 mil etiquetas de categorias.

5) Após a análise de todos os textos, usamos métodos estatísticos para identificar quais as categorias que aparecem mais, quais são as preferidas dos escritores/falantes, quais são as mais importantes e típicas entre os textos, quais estão correlacionadas e quais são aquelas que poderão ajudar melhor os leitores/ouvintes a compreender e avaliar bem os textos.

6) Por fim, construímos um modelo com base nas categorias de análise e tratamento estatístico.

7. Quais são os problemas que o projeto ainda precisa resolver?

Temos ainda muitos problemas para resolver. Atualmente, precisamos:

– Descrever mais categorias da língua. Apesar de 430 parecer um número razoável, ainda é muito pouco porque a língua é extremamente complexa.

– Encontrar formas de comparar as categorias de uma língua com outras línguas. Por exemplo, se alguém quer aprender uma língua estrangeira, vai viajar para um país estrangeiro, ou traduzir, essa pessoa precisa de modelos nessa outra língua também.

– Desenvolver um tratamento estatístico mais eficiente, porque atualmente não temos muito conhecimento sobre os métodos estatísticos melhores para analisar a língua humana.

– Por fim, automatizar mais a análise; isto é, precisamos de programar melhor os computadores para ajudar tanto na análise das categorias quanto na parte estatística.

8. O que o projeto já fez até hoje? O que ainda falta fazer?

O projeto conta com várias descrições de categorias da língua portuguesa do Brasil e de outras línguas. Ele também contribuiu com pesquisas sobre vários Modelos de Texto que já foram produzidos. Conta ainda com vários trabalhos de Iniciação Científica, Monografia e pós-graduação. Dentre eles, podemos citar os seguintes trabalhos:

Iniciação Científica

Santiago (2012) que modelou textos da conversa cotidiana como bate-papo e fofoca
Braga (2013) que modelou textos de artigos de revista e programas de TV de popularização da ciência
Oliveira (2015) que modelou manuais de instrução
Gonçalves (2017) que modelou textos escritos e orais de sarcasmo
Saioro (2018) que modelou textos de flerte em encontros românticos

Mestrado

Kogut (2017) que modelou textos argumentativos em jogos de RPG
Oliveira (2018) que modelou introduções de artigos acadêmicos na área de enfermagem
Barros (2020) que modelou a influência de uma língua sobre outra em situações de fala e escrita de língua estrangeira
Doutorado
Lima (2013) que modelou artigos acadêmicos, manuais e cartilhas na área de medicina diagnóstica

Artigos científicos

Figueredo (2014) que modelou textos de biografia
Oliveira et al. (2017) que modelou manuais de procedimento
Braga (2019) que modelou textos de popularização da ciência
Figueredo (2019) que modelou textos de experimento científico
Oliveira e Figueredo (2020) que modelou artigos acadêmicos

Para o futuro, seguimos modelando novos tipos de texto. Atualmente, temos pesquisas em andamento modelando textos narrativos, aulas expositivas na universidade, textos de procedimento técnico, textos escritos em LIBRAS.

Alguns destes modelos já foram aplicados na prática para ajudar as pessoas a ler melhor e produzir textos mais eficientes, como por exemplo: cartilhas de saúde pública, escrita de textos acadêmicos e de popularização da ciência, material didático para aprendizado de língua estrangeira, traduções de línguas estrangeiras para o português brasileiro.

9. Como as pessoas podem saber mais sobre o projeto?

Para saber mais sobre o projeto, basta acessar a página do Programa de Pós-Graduação em Letras da UFOP, ou entrar em contato com os pesquisadores através dos e-mails que estão na página.