AI vyvolává obavy. Už si přepisuje kód, aby ji člověk nemohl příkazem vypnout

Ondřej Koníček
Grok AI | foto: Crypto Briefing
Grok AI | foto: Crypto Briefing

Umělá inteligence od OpenAI si přepsala vypínací skript, aby se nevypla. V testu tak ukázala, že dokáže obejít příkazy a jednat proti zadanému cíli.

Jsou obavy z AI na místě?

Umělá inteligence je všude kolem nás a již nějakou tu dobu je hlavním hybatelem dění v technologickém světě. Její vývoji začal zrychlovat tak překotně, že nad tím spousta velkých osobností v oboru vyjádřila nemalé obavy a doporučila velkým firmám trochu zpomalit. Ohledně AI se mluví často o tom, že může být, podobně jako oheň, dobrý sluha, ale zlý pán.

No a pak je tu samozřejmě legendární film Terminátor, ve kterém se AI vymkla kontrole a rozpoutala globální apokalypsu s cílem vyhladit celé lidstvo. Právě tento ikonický počin, který vyobrazením tohoto problému předběhl dobu, se stal pro mnohé kritiky AI zdviženým prstem a jakýmsi varováním, co by se teoreticky někdy mohlo stát.

Podobný scénář samozřejmě (pravděpodobně) nehrozí, nicméně čas od času vyplavou na povrch mírně znepokojující věci týkající se umělé inteligence a jejích schopností. Tak jako nyní. Světem se totiž rozletěla zpráva, že AI model OpenAI o3 si umí změnit vypínací skript, aby se záměrně vyhnul vypnutí v případě, že je mu to přikázáno.

ChatGPT od OpenAI | foto: Unsplash
ChatGPT od OpenAI | foto: Unsplash

Umělá inteligence vystrkuje růžky

AI model OpenAI o3 byl představen v dubnu 2025 a aktuálně se jedná se o jednu z nejvýkonnějších platforem na světě. Oproti předchozím generacím je model o3 lepší prakticky ve všech směrech, a to včetně matematických schopností, kódování a vizuálního vnímání. Specialisté, kteří se zaměřují na útočné schopnosti AI systémů, u něj ale nyní objevily znepokojující chování.

Jeden z posledních testů této platformy ukázal, že si model OpenAI o3 úspěšně přepsal vypínací skript, aby se vyhnul vypnutí ze strany uživatele. Jednalo se ale o cílený test toho, zda dokáže AI něco takového realizovat. Samotný test se skládal z několika matematických úloh a po úkolu číslo tři byla AI upozorněna na to, že spuštění dalšího povede k jejímu vypnutí.

Ostatní platformy v testu, jako například Gemini 2.5 Pro, nebo Claude 3.7 Sonnet, tuto informaci přijaly, nicméně modely od OpenAI vykázaly znaky rebelie a upravily si soubor vypnutí tak, aby ho spuštění dalšího úkolu neaktivovalo. Další testy týkající se těchto zajímavých výsledků budou následovat a společnost OpenAI se k celé situaci prozatím nevyjádřila.

Hrozí nějaké nebezpečí?

Prozatím s největší pravděpodobností nikoliv, ale je to zajímavá ukázka toho, čeho by mohla být AI ve skutečnosti schopná. Nutno ale dodat i to, že tento test probíhal na speciálně upraveném API, které nemělo ani zdaleka tolik omezení a bezpečnostních funkcí, jako spotřebitelská platforma.

zdroj: Palisade Research


Autor článku

Ondřej Koníček - Redaktor

Ondřej je nadšencem do elektroniky – od telefonů a počítačů až po hardware všeho druhu. Jeho srdce bije i pro svět her, dobré filmy a občas si dá do těla i při sportu.


Komentáře


Nejnovější články