Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais

Publicado 05.09.2023, 10:55

Atualizado 05.09.2023, 11:10

© Reuters Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais

Neste artigo:

GOOGL

IBM

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

Os investigadores de segurança da IBM (NYSE:IBM) conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google (NASDAQ:GOOGL), fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Anúncio de terceiros. Não é uma oferta, nem recomendação da Investing.com. Ver declaração aqui ou remover anúncios .

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

O "pai" do ChatGPT pede aos governos para controlarem a Inteligência Artificial

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

Anúncio de terceiros. Não é uma oferta, nem recomendação da Investing.com. Ver declaração aqui ou remover anúncios .

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas".

Últimos comentários

Mercados

PSI

6.680,12

+67,61

+1,02%

DAX Futuros

18.284,00

-65,0

-0,35%

CAC 40

8.076,16

-12,08

-0,15%

IBEX 35

11.088,77

-65,83

-0,59%

US 500

5.110,80

+10,8

+0,21%

Índice Dólar

105,75

-0,054

-0,05%

Índice Euro

127,46

-0,13

-0,10%

Artigos mais populares

Market Movers

Nome	Último	Var. %	Vol.
BCP	0,3262	+0,62%	59,90M
Energias de Portugal	3,593	+1,99%	3,69M
Sonae	0,9440	+0,75%	1,56M
Mota-Engil	4,246	+0,90%	773,59K
Jeronimo Martins	19,50	+2,47%	765,54K
Galp Energia	20,50	-0,19%	364,96K
EDP Renováveis	13,09	+1,87%	243,39K

Nome	Último	Var. %	Vol.
Toyota Caetano Po	5,30	+6,00%	45,00
Jeronimo Martins	19,52	+2,57%	766,82K
Ibersol Reg	7,30	+2,53%	20,12K
EDP Renováveis	13,08	+1,79%	244,10K
Energias de Portugal	3,584	+1,73%	3,73M
REN	2,265	+1,34%	523,30K
Semapa	15,96	+1,14%	11,24K

Nome	Último	Var. %	Vol.
Lisgrafica Impres	0,0040	-20,00%	30,02K
Sonaecom	2,400	-4,00%	1,05K
Inapa	0,0332	-2,35%	15,00K
Glintt-Global	0,3940	-1,00%	25,56K
Galp Energia	20,50	-0,19%	364,96K
Merlin Properties SA	10,50	0,00%	105,00
Raize Servicos Gestao	0,650	0,00%	0,00

Ações em Voga

Nome	Último	Var. %	Vol.
BCP	0,3262	+0,62%	59,90M
Jeronimo Martins	19,52	+2,57%	766,82K
Energias de Portugal	3,593	+1,99%	3,69M
Galp Energia	20,50	-0,19%	364,96K
EDP Renováveis	13,09	+1,87%	243,39K

Mostrar mais

Instale a nossa App

Divulgação de riscos: A realização de transações com instrumentos financeiros e/ou criptomoedas envolve altos riscos, incluindo o risco de perda de uma parte ou da totalidade do valor do investimento, e pode não ser adequada para todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos tais como eventos financeiros, regulamentares ou políticos. A realização de transações com margem aumenta os riscos financeiros.
Antes de decidir realizar transações com instrumentos financeiros ou criptomoedas, deve informar-se sobre os riscos e custos associados à realização de transações nos mercados financeiros, considerar cuidadosamente os seus objetivos de investimento, nível de experiência e nível de risco aceitável, e procurar aconselhamento profissional quando este é necessário.
A Fusion Media gostaria de recordar os seus utilizadores de que os dados contidos neste website não são necessariamente fornecidos em tempo real ou exatos. Os dados e preços apresentados neste website não são necessariamente fornecidos por quaisquer mercados ou bolsas de valores, mas podem ser fornecidos por formadores de mercados. Como tal, os preços podem não ser exatos e podem ser diferentes dos preços efetivos em determinados mercados, o que significa que os preços são indicativos e inapropriados para a realização de transações nos mercados. A Fusion Media e qualquer fornecedor dos dados contidos neste website não aceitam a imputação de responsabilidade por quaisquer perdas ou danos resultantes das transações realizadas pelos seus utilizadores, ou pela confiança que os seus utilizadores depositam nas informações contidas neste website.
É proibido usar, armazenar, reproduzir, mostrar, modificar, transmitir ou distribuir os dados contidos neste website sem a autorização prévia e explicitamente concedida por escrito pela Fusion Media e/ou pelo fornecedor de dados. Todos os direitos de propriedade intelectual são reservados pelos fornecedores e/ou pela bolsa de valores responsável pelo fornecimento dos dados contidos neste website.
A Fusion Media pode ser indemnizada pelos anunciantes publicitários apresentados neste website, com base na interação dos seus utilizadores com os anúncios publicitários ou com os anunciantes publicitários.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que há qualquer discrepância entre a versão em inglês e a versão em português.

Pesquisas Populares

Por favor, tente outra pesquisa

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais

Os resultados mostram que os chatbots são fáceis de manipular

Últimos comentários

Ações em Voga