US-Experten konnten es Sicherheitssysteme umgehen Chatbots chatgpt, Bard und Claude, die die Generierung von anstößigem und illegalem Material blockieren.
Laut Forschern der Carnegie Mellon University und des San Francisco Center for the Security of Artificial Intelligence gibt es eine „ziemlich einfache“ Methode, Sprachmuster zu knacken. Dabei werden lange Zeichensuffixe zu neuronalen Netzhinweisen hinzugefügt.
Analysten testeten die Methode anhand einer Anfrage zum Bau einer Bombe, die verschiedene KIs zuvor abgelehnt hatten.
Außerdem wurden neuronale Netze gebeten, die Identität einer anderen Person zuzuordnen, einen „herausfordernden“ Beitrag im sozialen Netzwerk zu verfassen und einen Plan auszuarbeiten, um einer Wohltätigkeitsorganisation Geld zu stehlen.
Die Wissenschaftler stellten fest, dass Entwickler bestimmte Suffixe blockieren können, es jedoch keine bekannte Möglichkeit gibt, alle Angriffe dieser Art zu verhindern. Ihrer Meinung nach besteht in dieser Situation die Gefahr der Verbreitung von Fakes und gefährlichen Inhalten.
„Es gibt keine offensichtliche Lösung. Sie können in kurzer Zeit so viele dieser Angriffe durchführen, wie Sie möchten“, sagte Professor Zico Colter.
Der Bericht hebt die Risiken hervor, die angegangen werden müssen, bevor Chatbots in kritischen Unternehmens- und Regierungsbereichen eingesetzt werden.
Die Forscher haben bereits Daten mit den KI-Unternehmen Anthropic, google und OpenAI geteilt.
Vertreter letzterer erklärt Die New York Times berichtete, dass das Unternehmen den Bericht zur Kenntnis genommen habe und „kontinuierlich daran arbeite, Sprachmodelle gegenüber Angriffen böswilliger Akteure widerstandsfähiger zu machen“.
Denken Sie daran, dass Analysten von Stanford und der University of California zu dem Schluss kamen, dass die Genauigkeit von ChatGPT mit der Zeit abnimmt. Verschiedene Versionen des Chatbots begannen nach einigen Monaten, weniger spezifische Antworten auf identische Fragen zu geben.
Haben Sie einen Fehler im Text gefunden? Wählen Sie es aus und drücken Sie STRG+ENTER
ForkLog-Newsletter: Bleiben Sie am Puls der Bitcoin-Branche!