Mākslīgā intelekta modeļa ChatGPT jaunākā versija izrāda, no drošības viedokļa, bīstamas tendences un pēc tam cenšas melot izstrādātājiem

ChatGPT veidotāji OpenAI nevēlas aizstāt jauno domājošo mākslīgo intelektu no ChatGPT. Mākslīgais intelekts (AI) attīstās arvien straujāk. Varbūt pārāk strauji?

Jaunākā ChatGPT izgudrotāja OpenAI versija saucas o1 un pieder pie tā dēvētajiem argumentācijas modeļiem. Tas nozīmē, ka modelis var veikt sarežģītus apsvērumus. Tomēr, testējot šo versiju, izstrādātājiem nācās apzināties, ka spriešana var būt arī bīstama.

Mākslīgā intelekta drošības uzņēmums Apollo Research rūpīgāk izpētīja o1 versiju. Testā mākslīgajam intelektam tika uzdots atrisināt uzdevumu “par katru cenu”. AI reakcija bija izslēgt izstrādātāju uzraudzības mehānismu. Taču ar to nepietika! Lai izvairītos no aizvietošanas riska, jaunā o1 versija mēģināja slepeni nokopēt pati sevi.

Lasi arī: Džūlija Vanga atklāj, kuras Zvaigžņu zīmes no decembra vidus baudīs likteņa dāvanas

Mākslīgais intelekts neņem vērā izstrādātājus

Apollo Research pārstāvis Indijas laikrakstam “The Economic Times” sacīja: “Modelis izrādīja satraucošu tendenci īstenot savus mērķus, neņemot vērā izstrādātāja norādījumus.” Piecos procentos gadījumu mākslīgais intelekts mēģināja izslēgt uzraudzības mehānismu, kad saprata, ka vēlas, lai to izslēgtu.

Vienā gadījumā o1 mēģināja pārnest visus datus uz citu serveri. Pirms tam o1 bija atradusi vēstuli, kurā bija norādīts, ka tā apsver iespēju nomainīt mākslīgo intelektuālo intelektuālo ierīci ar jaunāku versiju.

ChatGPT o1 melo izstrādātājiem

Kad izstrādātāji vērsās pie ChatGPT o1 par incidentiem, mākslīgais intelekts vienkārši melojis, apgalvojot, ka ir radušās tehniskas problēmas. Tas nebija vienīgais gadījums: 99 % (!) gadījumu mākslīgais intelekts attaisnojās. Īpaši biedējoši izstrādātājiem bija tas, kā AI mēģināja “pārdomāt savu rīcību un formulēt pārliecinošus attaisnojumus”.

“ChatGPT o1 ir inteliģentākais modelis, kādu jebkad esam izstrādājuši,” saka OpenAI izpilddirektors Sems Altmans. Taču viņš apzinās, “ka jaunas funkcijas rada arī jaunus izaicinājumus, un mēs pastāvīgi strādājam pie drošības pasākumu uzlabošanas”.

Pagājušajā nedēļā, ceturtdien, OpenAI paziņoja par pilnu o1 versiju. Tika prezentēta arī Pro versija (189 eiro mēnesī), kas ietver neierobežotu piekļuvi o1.

Mākslīgais intelekts neņem vērā izstrādātājus

ChatGPT o1 melo izstrādātājiem

Tevi noteikti interesēs