top of page

A Ciência da Recompensa: Um Novo Rumo para Vencer a Depressão


Os resultados do estudo mostram que o nEV (valor esperado neural) e o nPE (erro de predição neural) são indicadores importantes para entender os desfechos da depressão, independentemente de o paciente ter recebido ou não tratamento. Isso sugere que as variáveis ligadas ao aprendizado por reforço podem ser ferramentas úteis no desenvolvimento de uma abordagem personalizada para o cuidado de pessoas com depressão, ajudando a identificar quem tem maior chance de melhora e quais intervenções podem ser mais adequadas.


O Transtorno Depressivo Maior (TDM) é uma condição psiquiátrica grave que afeta cerca de 7% da população a cada ano e impacta mais de 17 milhões de pessoas apenas nos Estados Unidos. Essa condição representa um enorme fardo tanto pessoal quanto financeiro para os indivíduos e a sociedade. 


Infelizmente, menos de 40% das pessoas tratadas com intervenções padrão para TDM conseguem alcançar a remissão dos sintomas em até três meses.


Esses resultados limitados estimularam pesquisas para identificar fatores que possam influenciar as trajetórias e os desfechos da depressão, buscando novas formas de melhorar o tratamento.

Com base em dados recentes, sabemos que a depressão pode ser caracterizada por respostas atípicas a recompensas e perdas. Este estudo buscou explorar se variáveis associadas a esses processos poderiam prever os desfechos da doença em pessoas diagnosticadas com depressão no início do estudo.


Alguns participantes foram acompanhados ao longo do curso natural da doença, enquanto outros passaram por terapia cognitivo-comportamental (TCC).


A abordagem metodológica do estudo foi baseada em modelos de aprendizado por reforço, que permitem analisar como o cérebro processa e aprende com recompensas e perdas. 

Estudos prévios utilizando técnicas de neuroimagem funcional indicaram que processos relacionados à antecipação de recompensas e aprendizado por reforço frequentemente ativam áreas específicas do cérebro, como o estriado e a ínsula, em indivíduos com e sem transtornos psiquiátricos. 


Além disso, há evidências de que quanto mais severos os sintomas de depressão, maiores as alterações nos componentes comportamentais e neurais do aprendizado de recompensa. Por exemplo, a anedonia, a perda de interesse em atividades prazerosas, foi associada a uma redução na capacidade de aprender com recompensas. 


Já a excitação ansiosa foi conectada a erros de predição negativos, enquanto o afeto negativo parece exacerbar a atenção a resultados negativos durante a aprendizagem de perdas.


Estudos anteriores também sugeriram que os sintomas de depressão podem influenciar diferentes aspectos do aprendizado por reforço. Pesquisas anteriores mostraram que variáveis computacionais como o valor esperado (o valor antecipado de uma escolha) e o erro de predição (a diferença entre o valor esperado e o resultado real de uma escolha) estão ligadas a sintomas depressivos específicos. 


Esse conhecimento motivou os pesquisadores a investigar se essas variáveis poderiam prever os desfechos da depressão, dependendo do perfil de sintomas apresentado por cada indivíduo.

No contexto deste estudo, também foi considerado o impacto do tratamento. Entre os participantes, alguns passaram por um curso de terapia cognitivo-comportamental padrão, enquanto outros foram apenas acompanhados durante o curso natural da doença sem intervenção específica. 


É sabido que uma parte considerável de adultos com depressão pode alcançar remissão espontânea em um período de 3 meses (23%) ou 1 ano (53%).


Identificar quem tem maior probabilidade de se recuperar naturalmente pode ajudar a alocar os recursos terapêuticos de forma mais eficiente. 


Assim, pessoas com maior chance de remissão espontânea poderiam receber apenas monitoramento, enquanto aqueles com menor probabilidade poderiam ser encaminhados para intervenções mais intensivas.


Nesse estudo, os pesquisadores da Virginia Tech, USA, usaram uma técnica chamada máquinas de vetores de suporte para avaliar se respostas cerebrais medidas por fMRI (ressonância magnética funcional) associadas ao erro de predição neural (nPE) e ao valor esperado neural (nEV) poderiam prever a remissão da depressão. 


O erro de predição neural (nPE) e o valor esperado neural (nEV) são conceitos relacionados ao aprendizado por reforço e à forma como o cérebro processa recompensas e perdas.


O nEV representa o valor que o cérebro antecipa obter de uma escolha ou ação, com base em experiências anteriores, é como uma expectativa do que pode acontecer. 


Já o nPE reflete a diferença entre essa expectativa (nEV) e o resultado real da escolha. Quando o resultado é melhor ou pior do que o esperado, o nPE sinaliza ao cérebro para ajustar as expectativas futuras, ajudando no aprendizado e na tomada de decisões.


Em pessoas com depressão, esses processos podem ser alterados, impactando a forma como avaliam recompensas ou lidam com perdas.

Eles também exploraram se essas previsões eram afetadas pelo tipo de acompanhamento (naturalístico ou terapia cognitivo-comportamental) ou pelos sintomas apresentados. 


O estudo incluiu 55 participantes com diagnóstico de depressão no início do estudo, dos quais 36 completaram um curso padrão de terapia cognitivo-comportamental e 19 foram apenas acompanhados ao longo do curso natural da doença.


Todos os participantes foram avaliados novamente em uma visita de acompanhamento para determinar se haviam alcançado a remissão. 


Os resultados mostraram que tanto o nPE quanto o nEV foram preditores significativos de remissão da depressão, sendo que o nEV demonstrou ser um preditor mais forte.


Curiosamente, o status de tratamento (se o participante passou ou não pela terapia cognitivo-comportamental) não influenciou significativamente a precisão dessas previsões. 

Foi observada, no entanto, uma interação significativa entre o nPE e a anedonia: indivíduos com níveis mais altos de anedonia apresentaram maior influência do nPE nas previsões de remissão. Já outros sintomas, como afeto negativo ou excitação ansiosa, não tiveram impacto significativo nessas relações.


É importante ressaltar que, embora o tamanho da amostra seja comparável ao de outros estudos, ele limita a capacidade de generalizar os resultados. Para lidar com essa limitação, os pesquisadores usaram dois métodos padrão para validar os modelos: divisão de dados em 90% para treinamento e 10% para teste, além de amostragem bootstrap.


Em conclusão, o estudo confirmou que o nEV e o nPE são sinais biocomportamentais úteis para prever os desfechos da depressão, independentemente do tipo de acompanhamento recebido.


Entre os dois, o nEV mostrou ser o preditor mais forte. Essas variáveis de aprendizado por reforço podem ser ferramentas valiosas dentro de uma abordagem de medicina personalizada para o tratamento da depressão.



LEIA MAIS:


Reinforcement learning processes as forecasters of depression remission

Vansh Bansal, Katherine L. McCurry, Jonathan Lisinski, Dong-Youl Kim, Shivani Goyal, John M. Wang, Jacob Lee, Vanessa M. Brown, Stephen M. LaConte, Brooks Casas, and Pearl H. Chiu 

J Affect Disord. 2025 Jan 1:368:829-837.

doi: 10.1016/j.jad.2024.09.066


Abstract:


Aspects of reinforcement learning have been associated with specific depression symptoms and may inform the course of depressive illness. We applied support vector machines to investigate whether blood‑oxygen-level dependent (BOLD) responses linked with neural prediction error (nPE) and neural expected value (nEV) from a probabilistic learning task could forecast depression remission. We investigated whether predictions were moderated by treatment use or symptoms. Participants included 55 individuals (n = 39 female) with a depression diagnosis at baseline; 36 of these individuals completed standard cognitive behavioral therapy and 19 were followed during naturalistic course of illness. All participants were assessed for depression diagnosis at a follow-up visit. Both nPE and nEV classifiers forecasted remission significantly better than null classifiers. The nEV classifier performed significantly better than the nPE classifier. We found no main or interaction effects of treatment status on nPE or nEV accuracy. We found a significant interaction between nPE-forecasted remission status and anhedonia, but not for negative affect or anxious arousal, when controlling for nEV-forecasted remission status. Our sample size, while comparable to that of other studies, limits options for maximizing and evaluating model performance. We addressed this with two standard methods for optimizing model performance (90:10 train and test scheme and bootstrapped sampling). 

Results support nEV and nPE as relevant biobehavioral signals for understanding depression outcome independent of treatment status, with nEV being stronger than nPE as a predictor of remission. Reinforcement learning variables may be useful components of an individualized medicine framework for depression healthcare.




Kommentit


© 2024 by Lidiane Garcia

bottom of page