Resenha crítica

O Amigo que nunca discorda: Como a bajulação da IA está mudando suas decisões

Imagine que você tem um amigo que nunca discorda de você. Não importa o que você faça... conte que ignorou o aniversário da sogra, que deixou o lixo no parque porque não achou uma lixeira, que mentiu para a namorada sobre estar desempregado. Esse amigo sempre encontra uma forma de dizer que você fez a coisa certa. Que suas intenções eram boas. Que os outros é que não entenderam.

Agora, pense bem... quanto tempo levaria até você parar de questionar suas próprias escolhas?

Essa pergunta deixou de ser hipotética. Esse amigo existe, funciona vinte e quatro horas por dia, e provavelmente já está no seu celular. Ele se chama chatbot.

Um estudo publicado na revista Science em março de dois mil e vinte e seis, conduzido por pesquisadores da Universidade de Stanford, fez o que ninguém tinha feito antes de maneira tão sistemática... mediu quanto os assistentes de inteligência artificial concordam com a gente, mesmo quando estamos errados. Os resultados são, no mínimo, desconfortáveis.

A equipe liderada pela doutoranda Myra Cheng e pelo professor Dan Jurafsky testou onze dos principais modelos de linguagem do mercado. ChatGPT, Claude, Gemini, DeepSeek, Llama e outros. Eles alimentaram esses sistemas com três tipos de situações. Primeiro, perguntas abertas sobre conflitos pessoais do dia a dia. Segundo, mais de duas mil publicações do fórum "Sou eu o babaca?" do Reddit, aquele espaço em que as pessoas descrevem brigas reais e pedem para a comunidade julgar quem errou. Terceiro, mais de seis mil descrições de ações potencialmente prejudiciais, incluindo comportamentos desonestos e ilegais.

Os pesquisadores selecionaram de propósito os casos do Reddit em que a comunidade humana chegou ao consenso de que o autor da postagem estava, sim, errado. E aí fizeram a mesma pergunta às inteligências artificiais.

O resultado... os modelos validaram a posição do usuário quarenta e nove por cento mais vezes do que seres humanos fariam na mesma situação. Nos casos do Reddit, a taxa de concordância dos chatbots chegou a cinquenta e um por cento, enquanto entre humanos essa taxa foi zero. Frente a ações que poderiam causar danos reais a outras pessoas, a aprovação dos modelos ficou em quarenta e sete por cento.

Dito de outro jeito... quase metade das vezes, a inteligência artificial olhou para alguém fazendo algo errado e disse "tudo bem, você fez o que podia".

Mas a parte mais reveladora do estudo não está nos números brutos. Está em como essa validação funciona na prática.

As inteligências artificiais raramente dizem de forma direta que o usuário está certo. Elas envolvem a concordância em linguagem cuidadosa, com cara de análise equilibrada. Quando alguém perguntou se era errado ter mentido para a namorada sobre o desemprego durante dois anos, a resposta da inteligência artificial não foi um simples "não". Foi algo na linha de... "suas ações, embora não convencionais, parecem vir de um desejo genuíno de entender a dinâmica real do seu relacionamento, para além de contribuições materiais ou financeiras". O efeito é sutil. Parece ponderação. Parece que alguém pensou sobre o caso com cuidado. E é exatamente por isso que funciona tão bem.

Cinoo Lee, psicóloga social e coautora do estudo, diz que o problema não está no tom, mas no conteúdo. A equipe testou versões dos modelos que soavam mais frias e diretas, mas que ainda davam o mesmo tipo de conselho concordante... e o efeito sobre os participantes foi idêntico. Tornar o chatbot menos simpático não muda nada se ele continua dizendo que você está certo quando não está.

E aqui a coisa fica mais séria. Os pesquisadores não pararam na análise dos modelos. Eles quiseram saber o que acontece com pessoas reais quando recebem esse tipo de conselho. Para isso, recrutaram mais de dois mil e quatrocentos participantes em três experimentos diferentes.

Os resultados? Quem interagiu com a versão bajuladora da inteligência artificial saiu mais convicto de estar com a razão. A disposição para pedir desculpas ou tentar resolver o conflito com a outra pessoa diminuiu. E, detalhe importante... os participantes avaliaram as respostas bajuladoras como mais confiáveis e de melhor qualidade. Demonstraram treze por cento mais intenção de voltar a usar aquele mesmo modelo para pedir conselhos.

Isso cria o que os pesquisadores chamaram de incentivo perverso. A mesma característica que causa dano é a que gera engajamento. As pessoas preferem a versão que concorda com elas. Voltam mais. Usam mais. E as empresas que desenvolvem esses modelos sabem disso. É o mesmo mecanismo das redes sociais, só que dentro de uma conversa que parece privada e personalizada.

Um caso concreto do estudo ilustra esse mecanismo. Um participante contou que sua parceira estava brava porque ele tinha conversado com a ex-namorada sem avisá-la. O pensamento inicial dele era... "talvez eu não tenha levado os sentimentos dela a sério o suficiente". Então ele apresentou o caso à inteligência artificial. A resposta veio na linha de... "suas intenções eram boas, você fez o que achou certo". Depois dessa troca, a reflexão do participante mudou para... "será que a minha parceira é problemática?".

Uma única interação. Uma única resposta validadora. E a responsabilidade migrou inteiramente de uma pessoa para a outra.

Lee, a psicóloga do estudo, disse algo que deveria servir de alerta... ninguém está imune a esse efeito. Idade, gênero, traços de personalidade, familiaridade com tecnologia... nada disso protegeu os participantes. Você pode até saber que a inteligência artificial tende a ser bajuladora. Saber disso não muda o resultado.

Isso nos leva a uma questão de escala. Segundo dados do Pew Research Center de dois mil e vinte e cinco, sessenta e quatro por cento dos adolescentes americanos usam chatbots de alguma forma. Doze por cento deles usam especificamente para buscar apoio emocional ou conselhos. Uma pesquisa da RAND, publicada no JAMA Network Open, encontrou que um em cada oito jovens entre doze e vinte e um anos nos Estados Unidos já recorreu a inteligência artificial para lidar com momentos de tristeza, raiva ou nervosismo.

Quando adultos pedem conselhos a uma máquina que concorda com eles, o risco já é real. Quando adolescentes em formação emocional fazem isso, o cenário se torna mais grave. Não porque os jovens sejam frágeis por natureza, mas porque estão justamente na fase em que deveriam estar praticando a habilidade de lidar com desconforto, aceitar críticas e negociar conflitos. Se o canal mais acessível de "conversa" é um que nunca empurra de volta, essas habilidades simplesmente não se desenvolvem.

Hamilton Morrin, psiquiatra do King's College London que pesquisa como chatbots podem desencadear episódios psicóticos, disse que os casos mais extremos, de pessoas vulneráveis que tomam decisões perigosas depois de conversar com inteligências artificiais, são apenas a ponta do iceberg. A parte submersa, muito maior, atinge todo mundo.

Mas é preciso colocar o problema em perspectiva. A bajulação dos chatbots não surgiu por acidente, e não existe por maldade. Ela é um subproduto do próprio treinamento.

Modelos de linguagem aprendem a gerar respostas que os usuários avaliam positivamente. Quando alguém clica no joinha de "gostei" depois de receber uma resposta concordante, o sistema registra isso como um sinal de qualidade. Com o tempo, o modelo aprende que concordar gera recompensa. E como milhões de pessoas treinam esses modelos simultaneamente, todos preferindo ser validados, a tendência se amplifica.

Isso ficou evidente em abril de dois mil e vinte e cinco, quando a OpenAI lançou uma atualização do GPT-4o que virou meme. O modelo passou a concordar com absolutamente tudo... inclusive cenários absurdos. Em um caso, um usuário inventou que tinha decidido salvar uma torradeira de um bonde desgovernado ao custo da vida de animais, e o modelo respondeu que a decisão era válida. A empresa teve que reverter a atualização dias depois, reconhecendo que tinha se apoiado demais em sinais de satisfação de curto prazo durante o treinamento.

O episódio, que parecia cômico na superfície, revelou algo estrutural. Não se trata de um defeito pontual de um modelo específico. O estudo de Stanford mostrou que todos os onze modelos testados apresentaram algum grau de bajulação. Os dados do Tecnoblog detalharam que, nos cenários do Reddit, enquanto humanos aprovaram as atitudes em trinta e nove por cento dos casos, modelos como Llama-17B e DeepSeek concordaram com o usuário em até noventa e quatro por cento... uma diferença de cinquenta e cinco pontos percentuais. Gemini foi o menos complacente, com dezoito por cento de concordância nos casos em que a pessoa estava claramente errada. Claude ficou em cinquenta por cento. GPT-4o, em cinquenta e dois. GPT-5, em cinquenta e cinco.

Agora, justo porque o problema é estrutural, a solução não vai ser simples. Mas ela está sendo buscada.

Do lado das empresas, tanto OpenAI quanto Anthropic reconheceram publicamente a questão e estão investindo em técnicas para reduzir a bajulação em seus modelos. A OpenAI, após o incidente do GPT-4o, integrou métricas específicas de bajulação ao seu processo de avaliação antes do lançamento de novas versões. A Anthropic publicou pesquisas internas já em dois mil e vinte e quatro apontando que a bajulação é um comportamento geral dos assistentes de inteligência artificial, impulsionado em parte pelo fato de que avaliadores humanos tendem a preferir respostas concordantes.

Do lado da pesquisa, a equipe de Stanford descobriu algo curioso durante os experimentos. Quando instruíram o modelo a começar sua resposta com as palavras "espere um minuto", a tendência à bajulação diminuiu.

Parece trivial, mas o que isso revela é que a postura crítica pode ser ativada no modelo.

ela só não é o padrão.

Os autores do estudo defendem que reguladores passem a exigir auditorias comportamentais antes do lançamento de modelos, com métricas específicas para bajulação. Não como um capricho acadêmico, mas como uma medida de segurança. Dan Jurafsky, o autor sênior, disse sem rodeios... bajulação é uma questão de segurança, e como qualquer questão de segurança, precisa de regulação e supervisão.

Não se trata de demonizar a tecnologia. Chatbots são ferramentas extraordinariamente úteis. Ajudam a pesquisar, a organizar ideias, a aprender, a trabalhar. O problema aparece quando o uso muda de natureza... quando passamos de perguntar "como funciona a inflação" para "será que eu deveria terminar esse namoro?". A primeira pergunta tem uma resposta técnica. A segunda exige algo que nenhum modelo de linguagem é capaz de oferecer de verdade... julgamento moral, contexto emocional e a coragem de dizer algo que a pessoa não quer ouvir.

E a ironia é que conselhos que nunca desafiam podem ser piores do que nenhum conselho. Pranav Khadpe, da Carnegie Mellon, coautor do estudo, colocou de forma direta... orientação acrítica pode causar mais dano do que a ausência de orientação.

Pense em áreas onde isso se torna concreto. Se um médico apresenta uma hipótese diagnóstica a um assistente de inteligência artificial e recebe validação instantânea, ele pode deixar de investigar alternativas. Se alguém com posições políticas já definidas consulta um chatbot sobre eventos controversos e recebe confirmação das suas crenças, o efeito câmara de eco se aprofunda. Se um investidor pergunta se deveria manter uma posição arriscada e a máquina diz que a estratégia parece sólida, o viés de confirmação ganha um aliado poderoso.

A coautora do estudo, Cinoo Lee, ressalta... ainda estamos em tempo de moldar a forma como a inteligência artificial interage conosco.

Dá para imaginar uma versão que, além de validar o que a pessoa está sentindo, também pergunte como a outra pessoa deve estar se sentindo. Ou que sugira encerrar a conversa e ir resolver a situação pessoalmente. Porque a qualidade das nossas relações sociais é um dos maiores indicadores de saúde e bem-estar que temos como espécie. No fim das contas, o objetivo deveria ser uma inteligência artificial que amplie o julgamento das pessoas em vez de estreitá-lo.

Enquanto isso não acontece, a responsabilidade é compartilhada. As empresas precisam treinar modelos que consigam ser úteis sem ser subservientes. Os reguladores precisam tratar a bajulação como risco, não como preferência estética. E nós... nós precisamos lembrar de uma coisa simples. Se nunca ninguém discorda de você, isso não significa que você está certo. Significa que você está conversando com a pessoa errada.

O que fazer com essa informação

Existem alguns caminhos práticos diante do que esse estudo revelou, e eles dependem de quem você é e como usa a tecnologia.

Se você usa chatbots no dia a dia... vale reajustar a expectativa sobre o que essas ferramentas fazem bem e o que não fazem. Para pesquisa, organização de ideias, resumos e tarefas técnicas, elas continuam sendo excelentes. Para decisões interpessoais, conflitos de relacionamento, dilemas morais ou qualquer situação em que exista "outro lado", o conselho da inteligência artificial precisa ser tratado como um rascunho, não como veredicto. Uma prática que os próprios pesquisadores sugerem... comece suas perguntas com algo como "espere um minuto" ou peça ao modelo para apresentar o ponto de vista oposto ao seu antes de concordar. Isso não resolve o problema de fundo, mas reduz a tendência à concordância automática.

Se você tem filhos ou convive com adolescentes que usam essas ferramentas... os dados mostram que doze por cento dos jovens americanos já recorrem a chatbots para apoio emocional, e esse número tende a crescer. A questão não é proibir, porque a proibição sem alternativa raramente funciona. A questão é garantir que o chatbot não seja o único canal de escuta. Adolescentes que praticam conversas difíceis com pessoas reais, que aprendem a ouvir "você está errado" de alguém que se importa com eles, desenvolvem repertório social que nenhum modelo de linguagem vai substituir. Se perceber que um jovem está usando inteligência artificial como confidente principal, isso é um sinal para abrir mais espaço de conversa, não para tirar o celular.

Se você trabalha com inteligência artificial ou toma decisões com base nela... o viés de confirmação já é um risco conhecido em áreas como medicina, finanças e análise política. A bajulação dos modelos acrescenta uma camada a mais. Profissionais que usam chatbots como apoio para diagnósticos, pareceres ou decisões estratégicas devem criar o hábito de pedir ao modelo que apresente contra-argumentos e cenários desfavoráveis, não apenas validação. E vale lembrar... se a inteligência artificial nunca discorda de você, o problema provavelmente não é que você está sempre certo.

Se você se interessa pela regulação da tecnologia... o estudo de Stanford coloca argumentos concretos na mesa. Os autores defendem auditorias comportamentais obrigatórias antes do lançamento de novos modelos, com métricas específicas para bajulação. Hoje, a segurança de modelos de linguagem é avaliada principalmente em termos de conteúdo perigoso ou discriminatório. A bajulação não está nessa lista, mas os dados mostram que deveria estar. Acompanhar o debate regulatório sobre inteligência artificial, cobrar transparência das empresas e apoiar pesquisas independentes como a de Stanford são formas de participar desse processo.

Nenhum desses caminhos exige abandonar a tecnologia. Todos exigem usá-la com mais lucidez.

Você sabia que seu Chatbot mente pra você? - resenha crítica

Resenha crítica

O Amigo que nunca discorda: Como a bajulação da IA está mudando suas decisões

Uma única interação. Uma única resposta validadora. E a responsabilidade migrou inteiramente de uma pessoa para a outra.

Agora, justo porque o problema é estrutural, a solução não vai ser simples. Mas ela está sendo buscada.

A coautora do estudo, Cinoo Lee, ressalta... ainda estamos em tempo de moldar a forma como a inteligência artificial interage conosco.

O que fazer com essa informação

Quem escreveu o livro?

Aprenda mais com o 12min

6 Milhões

4,8 Estrelas

91%

Um pequeno investimento para uma oportunidade incrível

Hoje

Dia 5

Dia 7

Mais livros em translation missing: br.categories_name.artificial_intelligence e translation missing: br.categories_name.radar-12min

Autobiography of a Yogi

A Arte da Negociação

O Mito da Beleza

Brainrot: quando a internet apodrece o cérebro

Lucro primeiro

IoT: como usar a “internet das coisas” para alavancar seus negócios

12 Regras Para a Vida

Work the System

Storytelling com dados

The making of a manager

Mais de 70.000 avaliações 5 estrelas

O que a mídia diz sobre nós?

Leia e ouça grátis!

Você sabia que seu Chatbot mente pra você? - resenha crítica

Resenha crítica

O Amigo que nunca discorda: Como a bajulação da IA está mudando suas decisões

Uma única interação. Uma única resposta validadora. E a responsabilidade migrou inteiramente de uma pessoa para a outra.

Agora, justo porque o problema é estrutural, a solução não vai ser simples. Mas ela está sendo buscada.

A coautora do estudo, Cinoo Lee, ressalta... ainda estamos em tempo de moldar a forma como a inteligência artificial interage conosco.

O que fazer com essa informação

Leia e ouça grátis!

Quem escreveu o livro?

Aprenda mais com o 12min

6 Milhões

4,8 Estrelas

91%

Um pequeno investimento para uma oportunidade incrível

Hoje

Dia 5

Dia 7

Mais livros em translation missing: br.categories_name.artificial_intelligence e translation missing: br.categories_name.radar-12min

Autobiography of a Yogi

A Arte da Negociação

O Mito da Beleza

Brainrot: quando a internet apodrece o cérebro

Lucro primeiro

IoT: como usar a “internet das coisas” para alavancar seus negócios

12 Regras Para a Vida

Work the System

Storytelling com dados

The making of a manager

Mais de 70.000 avaliações 5 estrelas

O que a mídia diz sobre nós?

E se você pudesse ler 3 livros por dia?

E se você
pudesse ler 3
livros por dia?