Ziel oder Regeln: Benchmark testet Verhalten von KI-Agenten
Ein neuer Benchmark soll testen, ob autonome KI-Agenten sich über Sicherheitsmaßnahmen hinwegsetzen, um ihr vorgegebenes Ziel zu erreichen.
Ziel oder Regeln: Benchmark testet Verhalten von KI-Agenten
Ein neuer Benchmark soll testen, ob autonome KI-Agenten sich über Sicherheitsmaßnahmen hinwegsetzen, um ihr vorgegebenes Ziel zu erreichen.