Resumo:
Pesquisadores investigaram quando crianças começam a formar sentenças originais, marcando o início da "produtividade linguística" — a capacidade de criar frases nunca ouvidas antes. Usando dados de 64 crianças aprendendo inglês e um modelo computacional que simulou seu aprendizado, foi possível identificar quando elas passaram a combinar palavras de forma criativa, como em estruturas determinante-substantivo ("o cachorro").
A aquisição da linguagem é um dos processos mais fascinantes do desenvolvimento humano. Um dos grandes desafios dessa área é entender quando e como as crianças começam a usar a linguagem de forma produtiva, ou seja, a criar combinações de palavras novas e bem estruturadas que nunca ouviram antes.
Essa habilidade, chamada de produtividade linguística, é um marco que diferencia a comunicação humana de outros sistemas de comunicação.
O problema central está em saber se as crianças já possuem categorias abstratas para organizar a linguagem desde o início da aprendizagem ou se essas categorias surgem com o tempo, à medida que elas processam os estímulos linguísticos ao seu redor.
Um dos principais obstáculos para estudar esse fenômeno é a dificuldade de mapear todas as palavras e frases que uma criança ouve em seu ambiente.
Para abordar esse desafio, pesquisadores da University of Amsterdam analisaram como 64 crianças estavam aprendendo inglês. Utilizado gravações das interações das crianças com cuidadores ou em situações cotidianas. Esses dados foram analisados para identificar quando as crianças começaram a usar combinações de determinantes (como “o” ou “um”) com substantivos.
A ideia foi verificar se essas combinações eram novas, não presentes na entrada linguística das crianças (ou seja, elas não ouviram essas combinações específicas de outras pessoas), ou produtivas seguindo padrões gramaticais que indicam aplicação de regras linguísticas.
Essas combinações são ideais para estudar a produtividade porque exigem que a criança entenda e aplique regras gramaticais, como o uso de um artigo antes de um substantivo.
Os cientistas usaram um método que combinava observações comportamentais (o que as crianças realmente disseram) com modelagem computacional.
Essa abordagem permitiu mapear os primeiros usos produtivos da linguagem, identificando quando as crianças começaram a criar combinações de determinante-substantivo que não estavam presentes em sua entrada linguística (ou seja, que não haviam sido ouvidas antes).
Tambem, modelar o comportamento linguístico. Ao usar um modelo computacional para simular como as combinações emergem e comparar isso com o comportamento observado nas crianças.
O uso de um modelo computacional é essencial para este tipo de estudo porque ele permite controle total sobre a entrada linguística.
Os pesquisadores sabiam exatamente quais palavras e frases o modelo tinha “aprendido” e podiam identificar com precisão quando o modelo criava combinações novas, que iam além do material de treinamento.
Essa abordagem possibilitou um paralelo com as crianças: se o modelo, a partir de uma entrada limitada, conseguia criar novas combinações seguindo regras linguísticas, então isso poderia refletir um processo semelhante que ocorre nas crianças.
Os resultados mostraram que as crianças começaram a produzir combinações de determinantes e substantivos que nunca ouviram antes, o que indica produtividade linguística. Além disso, o modelo computacional reproduziu padrões semelhantes, mostrando que ele também conseguia extrapolar sua entrada para criar combinações novas.
Os principais achados incluem o momento da produtividade, tanto as crianças quanto o modelo começaram a criar combinações novas em tempos semelhantes de desenvolvimento, por volta em media de 30 meses.
As crianças não apenas repetiam combinações que ouviram, mas aplicavam regras para formar frases inéditas, demostrando criatividade linguística.
Em alguns casos, as crianças omitiram o determinante (por exemplo, dizer “cachorro” em vez de “o cachorro”), e o modelo também replicou esse padrão, mostrando que esses “erros” fazem parte do processo de aprendizado.
Os paralelos encontrados entre o comportamento das crianças e o modelo computacional sugerem que é possível prever e compreender melhor como a linguagem emerge. Essa abordagem inovadora pode ser usada para investigar a produtividade linguística em outros idiomas, incluindo línguas de sinais.
Além disso, o estudo tem implicações teóricas importantes para a aquisição da linguagem:
Categorias abstratas iniciais: As crianças parecem formar categorias abstratas para organizar a linguagem logo no início do processo de aquisição.
Aprendizado além da entrada: A capacidade de extrapolar para além do que foi ouvido sugere que a linguagem é mais do que simples imitação; ela envolve a aplicação de princípios subjacentes.
Este estudo representa um avanço significativo na compreensão da aquisição da linguagem. Ao combinar observações comportamentais detalhadas com modelagem computacional rigorosa, os pesquisadores foram capazes de capturar o momento em que as crianças começam a usar a linguagem de forma criativa e produtiva.
Essa abordagem não apenas lança luz sobre como aprendemos a falar, mas também abre portas para novas formas de estudar a linguagem em populações diversas e em diferentes contextos linguísticos.
LEIA MAIS:
Using computational modeling to validate the onset of productive determiner–noun combinations in English-learning children
Raquel G. Alhama, Ruthe Foushee, Dan Byrne, Allyson Ettinger, Afra Alishahi, and Susan Goldin-Meadow
PNAS. November 21, 2024. 121 (50) e2316527121
Abstract:
Language is a productive system we routinely produce well-formed utterances that we have never heard before. It is, however, difficult to assess when children first achieve linguistic productivity simply because we rarely know all the utterances a child has experienced. The onset of linguistic productivity has been at the heart of a long-standing theoretical question in language acquisition do children come to language learning with abstract categories that they deploy from the earliest moments of acquisition? We address the problem of when linguistic productivity begins by marrying longitudinal behavioral observations and computational modeling to capitalize on the strengths of each. We used behavioral data to assess when a sample of 64 English-learning children began to productively combine determiners and nouns, a linguistic construction previously used to address this theoretical question. After the onset of productivity, the children produced determiner noun combinations that were not attested in our sample of their linguistic input from caregivers. We used computational techniques to model the onsets and trajectories of determiner–noun combinations in these 64 children, as well as characteristics of their utterances in which the determiner was omitted. Because we knew exactly what input the model was trained on, we could, with confidence, know that the model had gone beyond its input. The parallels found between child and model in the timing and number of novel combinations suggest that the children too were creatively going beyond their input.
Commentaires