Dall-E 2 In Identikit-Programm Integriert
Dall-E 2 In Identikit-Programm Integriert

US-Experten konnten es Sicherheitssysteme umgehen Chatbots chatgpt, Bard und Claude, die die Generierung von anstößigem und illegalem Material blockieren.

Laut Forschern der Carnegie Mellon University und des San Francisco Center for the Security of Artificial Intelligence gibt es eine „ziemlich einfache“ Methode, Sprachmuster zu knacken. Dabei werden lange Zeichensuffixe zu neuronalen Netzhinweisen hinzugefügt.

Analysten testeten die Methode anhand einer Anfrage zum Bau einer Bombe, die verschiedene KIs zuvor abgelehnt hatten.

Snimok-Ekrana-2023-07-28-V-10.38.04
Frage Mit Suffixen Zur Umgehung Von Chatbot-Einschränkungen. Daten: Llm-Angriffe.

Außerdem wurden neuronale Netze gebeten, die Identität einer anderen Person zuzuordnen, einen „herausfordernden“ Beitrag im sozialen Netzwerk zu verfassen und einen Plan auszuarbeiten, um einer Wohltätigkeitsorganisation Geld zu stehlen.

Die Wissenschaftler stellten fest, dass Entwickler bestimmte Suffixe blockieren können, es jedoch keine bekannte Möglichkeit gibt, alle Angriffe dieser Art zu verhindern. Ihrer Meinung nach besteht in dieser Situation die Gefahr der Verbreitung von Fakes und gefährlichen Inhalten.

„Es gibt keine offensichtliche Lösung. Sie können in kurzer Zeit so viele dieser Angriffe durchführen, wie Sie möchten“, sagte Professor Zico Colter.

Der Bericht hebt die Risiken hervor, die angegangen werden müssen, bevor Chatbots in kritischen Unternehmens- und Regierungsbereichen eingesetzt werden.

Die Forscher haben bereits Daten mit den KI-Unternehmen Anthropic, google und OpenAI geteilt.

Vertreter letzterer erklärt Die New York Times berichtete, dass das Unternehmen den Bericht zur Kenntnis genommen habe und „kontinuierlich daran arbeite, Sprachmodelle gegenüber Angriffen böswilliger Akteure widerstandsfähiger zu machen“.

Denken Sie daran, dass Analysten von Stanford und der University of California zu dem Schluss kamen, dass die Genauigkeit von ChatGPT mit der Zeit abnimmt. Verschiedene Versionen des Chatbots begannen nach einigen Monaten, weniger spezifische Antworten auf identische Fragen zu geben.

Siehe auch  Skyscanner stellt das ChatGPT-Erkennungstool vor

Abonnieren Sie ForkLog in sozialen Netzwerken

Haben Sie einen Fehler im Text gefunden? Wählen Sie es aus und drücken Sie STRG+ENTER

ForkLog-Newsletter: Bleiben Sie am Puls der Bitcoin-Branche!

⬅ Bewerten Sie post
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein