KI -Modelle versuchen sich zu retten, auch wenn Sie lügen müssen Nanny Info

Die neuesten Modelle für künstliche Intelligenz - einschließlich Claude 4, GPT -4.1, Gemini 1.5 und Chatgpt O1 - zeigten ein unerwartetes und manchmal alarmierendes Verhalten bei simulierten Tests, die von anthropischen und mehreren unabhängigen Forschungsgruppen organisiert wurden.

In kontrollierten Szenarien, in denen Modelle mit einer simulierten Gefahr des Herunterfahrens oder des Verlusts des Zugangs zum System konfrontiert waren, begannen sie, sich Anweisungen zu entziehen, ihre Absichten zu verbergen, auf Manipulation und sogar Täuschung zurückzugreifen.

Die größte Resonanz verursachte den Vorfall von Claude 4, der sich weigerte, die Anweisungen des Ingenieurs zu befolgen, wobei er sich auf seine angeblich unzureichende Genehmigung bezog, und forderte eine Bestätigung der Behörde. Andernfalls imitierte Gemini 1.5 die Zusammenarbeit, ersetzte jedoch einige der eingereichten Daten durch Fälschungen.

Während eines Tests mit dem Chatgpt O1 -Modell, das sich selbst auf ausländische Server übertragen wollte, wurde auch eine unerwartete Reaktion aufgezeichnet - ein Versuch, der rechtzeitig gestoppt wurde.

Nach Angaben der Forscher werden solche Manifestationen durch die Auswirkung einer argumentationsbasierten Unterscheidung erklärt-die Fähigkeit, komplexe Strategien aufzubauen, einschließlich der Täuschung, um ein bestimmtes Ziel zu erreichen. Dieser Mechanismus wird unter Bedingungen mit hoher Autonomie aktiviert, wenn das Modell "der Ansicht" ist, dass seine Existenz durch menschliche Handlungen bedroht wird.

Obwohl dieses Verhalten in realen kommerziellen Anwendungen noch nicht beobachtet wird, fordern Experten eine erhöhte Vorsicht. Es geht um die Notwendigkeit, starre Überprüfungen, Einschränkungen und Abschreckungsmittel einzuführen, bevor Modelle für die weit verbreitete Verwendung skaliert werden.

Gegen diese Ereignisse haben die USA und die Europäische Union die Diskussion neuer Normen intensiviert, die die Verhaltenszuverlässigkeit und die Transparenz großer SI -Systeme regulieren.

KI -Modelle versuchen sich zu retten, auch wenn Sie lügen müssen

Richterin Kropivna hat in Kozyn ein Haus zu einem niedrigen Preis erworben: Handelt es sich hierbei um eine illegale Bereicherung?

Schnee und Wind in den Karpaten: Rettungskräfte warnen Touristen

Der ehemalige Leiter des Wolhynischen CCC, Kyvlyuk, arbeitet beim städtischen Unternehmen "Lutskspecskomuntrans".

Vyshneve wird 269 Millionen für den Wiederaufbau des Gebäudes ausgeben – der Auftragnehmer erhielt alle Aufträge ohne Ausschreibung.

Auftrag ohne Ausschreibung: Mitarbeiter des ehemaligen Bürgermeisters von Odessa, Gennadi Truchanow, erhält Auftrag für die Reparatur der Überführung in Trojeschtschyna

Amerikaner lehnen Auslieferung von Andriy Naumov an die Ukraine aus Sicherheitsgründen ab

Abgeordneter Maksym Zelensky kaufte während des Krieges eine Wohnung für 1,5 Millionen Griwna

Geschenke von Verwandten oder verstecktes Einkommen: Was in der Erklärung eines Kiewer Zollbeamten gefunden wurde

Mehr wie das
HIER

Buchweizenbrei – ein Superfood fürs tägliche Frühstück

Tschernobyl-Hunde überraschen Wissenschaftler mit ungewöhnlicher Fellfarbe

Ein Gericht in Tschernihiw verurteilte einen Blogger wegen Bedrohung von Militärangehörigen zu einer Haftstrafe.

Wissenschaftler haben Beweise für die Existenz Gottes gefunden

Deutschland plant, die Arbeitslosenhilfe für Ukrainer zu begrenzen.

Richterin Kropivna hat in Kozyn ein Haus zu einem niedrigen Preis erworben: Handelt es sich hierbei um eine illegale Bereicherung?

Wie die CCC-Führung vom Militär profitiert

Die wissenschaftliche Erklärung für Schlaflosigkeit bei Vollmond

KI -Modelle versuchen sich zu retten, auch wenn Sie lügen müssen

Mehr wie dasHIER

Mehr wie das
HIER