Noticia Anthropic revela lo fácil que es «envenenar» a la IA para que responda lo que quieras

compudemano · Ayer a la(s) 15:03

Anthropic reveló que unos cuantos documentos tendrían el poder de "envenenar" cualquier modelo de lenguaje. La empresa detrás de Claude publicó un estudio que detalla el modo como puede vulnerarse una IA para que aprenda comportamientos no deseados. Según Anthropic, un conjunto de 250 documentos sería suficiente para crear una vulnerabilidad en modelos de cualquier […]

Seguir leyendo: Anthropic revela lo fácil que es «envenenar» a la IA para que responda lo que quieras

Continúar leyendo...

Buscar

Buscar

Noticia Anthropic revela lo fácil que es «envenenar» a la IA para que responda lo que quieras

compudemano

Moderador