Categories: Delivery Brasil

Microsoft busca formas de impedir que chatbots sejam enganados

A Microsoft tenta dificultar que usuários enganem chatbots de inteligência artificial para que façam coisas incomuns.

Novos recursos de segurança estão sendo integrados ao Azure AI Studio, serviço desenvolvido pela OpenAI que permite aos desenvolvedores criar assistentes de IA personalizados usando seus próprios dados, disse a empresa em um post nesta quinta-feira.

As ferramentas incluem “escudos de prompt”, que são projetados para detectar e bloquear tentativas deliberadas – também conhecidas como ataques de injeção de prompt ou jailbreaks – para fazer com que um modelo de IA se comporte de maneira não intencional. A Microsoft também está abordando “injeções indiretas de prompt”, quando hackers inserem instruções maliciosas nos dados nos quais um modelo é treinado e o induzem a realizar ações não autorizadas, como roubar informações do usuário ou sequestrar um sistema.

Esses ataques são “um desafio e uma ameaça únicos”, disse Sarah Bird, diretora de produtos de IA da Microsoft. As novas defesas foram projetadas para detectar entradas suspeitas e bloqueá-las em tempo real, acrescentou ela. A Microsoft também está lançando um recurso que alerta os usuários quando um modelo inventa informações ou gera respostas erradas.

IA Generativa

A Microsoft está empenhada em aumentar a confiança nas suas ferramentas de IA generativa, que são utilizadas tanto por consumidores como por clientes empresariais. Em fevereiro, a empresa investigou incidentes envolvendo seu chatbot Copilot, que estava gerando respostas estranhas e prejudiciais. Depois de analisar os incidentes, a Microsoft disse que os usuários tentaram deliberadamente enganar o Copilot para que gerasse essas respostas.

“Certamente vemos isso aumentando à medida que há mais uso das ferramentas, mas também à medida que mais pessoas estão cientes dessas diferentes técnicas”, disse Bird. Os sinais reveladores desses ataques incluem fazer uma pergunta ao chatbot várias vezes.

Bird disse que a Microsoft e a OpenAI estão comprometidas a implantar a IA com segurança e construir proteções em modelos amplos de linguagem subjacentes à IA generativa.

“Entretanto, não se pode depender apenas do modelo”, disse. “Esses jailbreaks, por exemplo, são uma fraqueza inerente à tecnologia do modelo.”

Delivery Brasil

Recent Posts

Big Brother Brasil 2025: Novidades e Surpresas Imperdíveis!

Big Brother Brasil 2025: Novidades incríveis e emoções à vista!

2 semanas ago

Startup de Goiânia revoluciona com robôs criados do zero para iFood e Volkswagen

Inovação tecnológica de uma startup brasileira:Startup de Goiânia revoluciona com robôs criados do zero para…

2 semanas ago

iFood encerra 2024 com 380 mil estabelecimentos parceiros e alta de 18% na categoria de marmitas

Plataforma consolida hábito do delivery no Brasil, com 110 milhões de pedidos mensais e 55…

2 semanas ago

Cupom iFood | R$25 OFF + Frete Grátis – Dezembro 2024

Economize no iFood com cupons de desconto, códigos promocionais e ofertas. Cupons de até R$25…

2 semanas ago

Cupom iFood Hoje: Economize com Descontos Exclusivos

Primeiramente descubra como aproveitar os melhores cupons de desconto no iFood para economizar em suas…

2 semanas ago

iFood libera retrospectiva e mostra o que você comeu em 2024

Chegou a época mais esperada pelos usuários do iFood: a retrospectiva do ano. A edição…

2 semanas ago