Quando a Pesquisa Vira Negócio: Como Artigos Falsos Estão Contaminando a Ciência Do Câncer

10 de fev.
4 min de leitura

Um estudo revelou que a ciência do câncer está sendo cada vez mais inundada por artigos científicos falsos, produzidos por organizações que fabricam pesquisas por dinheiro. Usando ferramentas computacionais para analisar títulos e resumos, os pesquisadores identificaram que quase 10% dos artigos sobre câncer apresentam semelhanças com estudos fraudulentos. O problema cresce ao longo do tempo e atinge até revistas científicas de alto prestígio, mostrando a urgência de ações para proteger a integridade da ciência.

Nos últimos anos, cientistas têm soado o alarme sobre um problema grave que está crescendo silenciosamente dentro da ciência, especialmente na área do câncer: a publicação de pesquisas falsas. Essas pesquisas não são apenas erros inocentes, mas muitas vezes fazem parte de um esquema organizado, conhecido como “fábricas de artigos científicos”.

Essas fábricas funcionam como empresas clandestinas que produzem artigos científicos sob encomenda, para pessoas que querem publicar rapidamente, ganhar prestígio acadêmico ou avançar na carreira, mesmo sem ter feito a pesquisa de verdade.

Essas organizações escrevem textos inteiros, inventam dados, criam gráficos falsos e até manipulam imagens de experimentos. Em muitos casos, os autores listados nesses artigos nunca trabalharam juntos ou sequer participaram da pesquisa.

O objetivo principal dessas fábricas é o lucro: quanto mais artigos produzirem, mais dinheiro ganham. Estima-se que centenas de milhares de artigos suspeitos tenham sido publicados nas últimas duas décadas, gerando milhões de dólares para esse mercado ilegal.

Para produzir tantos artigos em pouco tempo, essas fábricas usam modelos prontos de texto, trocando apenas algumas palavras técnicas para que os trabalhos pareçam diferentes. O resultado são artigos genéricos, mal escritos, com partes que não fazem muito sentido entre si.

Muitas vezes, os métodos descritos não funcionariam na prática, os dados não podem ser reproduzidos e as imagens aparecem repetidas em diferentes estudos. Mesmo assim, esses trabalhos conseguem passar pelas revistas científicas.

Um dos motivos para isso é a enorme pressão que existe sobre pesquisadores para publicar cada vez mais. Em algumas áreas, como a pesquisa sobre câncer, essa pressão é ainda maior. Além disso, muitos estudos nessa área usam técnicas complexas que são difíceis de verificar, o que facilita a falsificação. O sistema de revisão por outros cientistas, que deveria filtrar esses problemas, nem sempre consegue dar conta do volume de artigos submetidos.

Outro fator preocupante é o avanço da inteligência artificial, que tornou ainda mais fácil gerar textos científicos que parecem legítimos à primeira vista. Hoje, é possível criar textos e imagens falsas de forma automática, o que dificulta ainda mais a identificação de fraudes.

Para tentar conter esse problema, algumas editoras começaram a usar ferramentas automáticas de triagem e especialistas em integridade científica desenvolveram métodos para detectar padrões suspeitos, como frases estranhas, termos científicos usados de forma errada ou informações éticas ausentes.

Pesquisas anteriores mostraram que muitos desses artigos falsos seguem padrões muito semelhantes: estrutura quase idêntica, frases repetidas, pouco vocabulário variado e explicações superficiais.

Estudos recentes mostraram que computadores podem ser treinados para reconhecer esses padrões analisando apenas o texto dos artigos, especialmente títulos e resumos, que geralmente estão disponíveis publicamente.

Neste estudo, os pesquisadores treinaram um sistema computacional para reconhecer características comuns em artigos comprovadamente falsos. Em vez de analisar estudos inteiros, o sistema examinou apenas títulos e resumos, que são mais fáceis de acessar. A ideia foi verificar se novos artigos apresentavam semelhanças com pesquisas que já haviam sido retiradas por fraude.

Quando o sistema foi aplicado a milhões de artigos sobre câncer publicados ao longo de mais de vinte anos, os resultados foram preocupantes. Quase 10% dos estudos analisados foram sinalizados como suspeitos, e esse número cresceu ao longo do tempo. O mais alarmante é que esses artigos apareceram também em revistas científicas consideradas de alto prestígio, e não apenas em publicações menores.

Os autores do estudo destacam que esses resultados não significam acusações diretas, mas servem como um alerta. O crescimento de pesquisas falsas pode prejudicar tratamentos, atrasar descobertas importantes e minar a confiança na ciência. Por isso, eles defendem uma ação coletiva, com mais cuidado editorial, menos pressão por produtividade e maior conscientização para proteger a integridade da pesquisa sobre câncer.

Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study

Baptiste Scancar, Jennifer A Byrne, David Causeur, and Adrian G Barnett

BMJ 2026;392:e087581

doi.org/10.1136/bmj-2025-087581

Abstract:

To train and validate a machine learning model to distinguish paper mill publications from genuine cancer research articles, and to screen the cancer research literature to assess the prevalence of papers that have textual similarities to paper mill papers. Methodological and cross sectional study applying a BERT (bidirectional encoder representations from transformers) based, text classification model to article titles and abstracts. Retracted paper mill publications listed in the Retraction Watch database were used for model training. The cancer research corpus was screened by the model using the PubMed database restricted to original cancer research articles published between 1999 and 2024. The model was trained on 2202 retracted paper mill papers and validated on independent data collected by image integrity experts. 2.6 million cancer research papers were screened. Prevalence of papers flagged as similar to retracted paper mill publications with 95% confidence intervals and their distribution over time, by country, publisher, cancer type, research area, and within high impact journals (top 10%). The model achieved an accuracy of 0.91. When applied to the cancer research literature, it flagged 261 245 of 2 647 471 papers (9.87%, 95% confidence interval 9.83 to 9.90) and revealed a large increase in flagged papers from 1999 to 2024, both across the entire corpus and in the top 10% of journals by impact factor. More than 170 000 papers affiliated with Chinese institutions were flagged, accounting for 36% of Chinese cancer research articles. Most publishers had published substantial numbers of flagged papers. Flagged papers were overrepresented in fundamental research and in gastric, bone, and liver cancer. Paper mills are a large and growing problem in the cancer literature and are not restricted to low impact journals. Collective awareness and action will be crucial to address the problem of paper mill publications.

MOL.

Quando a Pesquisa Vira Negócio: Como Artigos Falsos Estão Contaminando a Ciência Do Câncer

Posts recentes

Comentários