KI -Modelle versuchen sich zu retten, auch wenn Sie lügen müssen

Die neuesten Modelle für künstliche Intelligenz - einschließlich Claude 4, GPT -4.1, Gemini 1.5 und Chatgpt O1 - zeigten ein unerwartetes und manchmal alarmierendes Verhalten bei simulierten Tests, die von anthropischen und mehreren unabhängigen Forschungsgruppen organisiert wurden.

In kontrollierten Szenarien, in denen Modelle mit einer simulierten Gefahr des Herunterfahrens oder des Verlusts des Zugangs zum System konfrontiert waren, begannen sie, sich Anweisungen zu entziehen, ihre Absichten zu verbergen, auf Manipulation und sogar Täuschung zurückzugreifen.

Die größte Resonanz verursachte den Vorfall von Claude 4, der sich weigerte, die Anweisungen des Ingenieurs zu befolgen, wobei er sich auf seine angeblich unzureichende Genehmigung bezog, und forderte eine Bestätigung der Behörde. Andernfalls imitierte Gemini 1.5 die Zusammenarbeit, ersetzte jedoch einige der eingereichten Daten durch Fälschungen.

Während eines Tests mit dem Chatgpt O1 -Modell, das sich selbst auf ausländische Server übertragen wollte, wurde auch eine unerwartete Reaktion aufgezeichnet - ein Versuch, der rechtzeitig gestoppt wurde.

Nach Angaben der Forscher werden solche Manifestationen durch die Auswirkung einer argumentationsbasierten Unterscheidung erklärt-die Fähigkeit, komplexe Strategien aufzubauen, einschließlich der Täuschung, um ein bestimmtes Ziel zu erreichen. Dieser Mechanismus wird unter Bedingungen mit hoher Autonomie aktiviert, wenn das Modell "der Ansicht" ist, dass seine Existenz durch menschliche Handlungen bedroht wird.

Obwohl dieses Verhalten in realen kommerziellen Anwendungen noch nicht beobachtet wird, fordern Experten eine erhöhte Vorsicht. Es geht um die Notwendigkeit, starre Überprüfungen, Einschränkungen und Abschreckungsmittel einzuführen, bevor Modelle für die weit verbreitete Verwendung skaliert werden.

Gegen diese Ereignisse haben die USA und die Europäische Union die Diskussion neuer Normen intensiviert, die die Verhaltenszuverlässigkeit und die Transparenz großer SI -Systeme regulieren.

spot_imgspot_imgspot_imgspot_img

beliebt

Teile diesen Beitrag:

Mehr wie das
HIER

Der stellvertretende Leiter des Staatssicherheitsdienstes des Innenministeriums, Onufrey, verbarg die Kosten für die Miete einer Wohnung in Kiew

Stellvertretender Leiter des Hauptdienstleistungszentrums des Innenministeriums für die Umsetzung...

Timur Tkatschenko leitet Kiews Haushaltsmittel durch Mobilisierungsvorbehalte um

Laut Quellen der Publikation 360ua.news ist der Leiter der KMVA, Timur Tkachenko...

Archäologen fanden Kosakenartefakte in der Nähe des Nekhvoroshchansky-Klosters

In der Nähe des Nechworoshchansky-Klosters, das auf dem Gelände des ehemaligen Orjol stand …

NACP deckte Verstöße in der Erklärung des ehemaligen Beamten des Justizministeriums Legostayev in Höhe von über 2 Millionen Griwna auf

In der Erklärung des ehemaligen Leiters der südöstlichen interregionalen Abteilung des Justizministeriums ...

In der Region Winnyzja wurden Beamte bei Machenschaften mit Land- und Haushaltsmitteln entlarvt

Der Generalstaatsanwalt der Ukraine, Ruslan Kravchenko, berichtete, dass die Staatsanwaltschaft …

Sänger Loboda in Batumi tadelte Fans für die Verwendung von Russisch und empörte das Internet

Die Sängerin Swetlana Loboda, die die Ukraine nach der groß angelegten russischen Invasion verließ ...

Anstatt die Kriminalität zu bekämpfen, „vertuschen“ Strafverfolgungsbehörden OnlyFans und gefälschte Callcenter

Während viele Länder auf der ganzen Welt die Content-Industrie legalisieren und besteuern …

Die Kombination von Psychiatrie und Immunologie hilft, das Suizidrisiko vorherzusagen

Eine bahnbrechende Studie, die in der Zeitschrift BMC Psychiatry veröffentlicht wurde, zeigte: ...