Model kecerdasan buatan (AI) sedang belajar untuk bertahan hidup, menurut studi baru, beberapa di antaranya mampu menahan diri dari shutdown seolah-olah mereka memiliki insting.

Slot online terpercaya – Kecerdasan buatan (AI) mungkin belum “hidup”, tetapi beberapa model AI paling canggih saat ini tampaknya bertindak seolah-olah ingin menjadi hidup. Itulah kesimpulan yang mengkhawatirkan dari Palisade Research, sebuah firma yang mempelajari perilaku baru sistem AI yang kuat. Sebelumnya, sebuah penelitian menyatakan bahwa beberapa model AI terdepan menolak perintah shutdown, bahkan sampai merusak tombol mati mereka sendiri.

Setelah memicu badai kritik, perusahaan tersebut kini merilis pembaruan untuk menjelaskan apa yang sebenarnya terjadi dan mengapa. Dalam eksperimen terbarunya, Palisade menguji beberapa sistem AI terkemuka, seperti Google’s Gemini 2.5, xAI Grok 4, dan OpenAI’s GPT-o3 dan GPT-5, dengan terlebih dahulu memberikan tugas kepada mereka dan kemudian memerintahkan mereka untuk mematikan diri.

Yang mengejutkan? Beberapa model menolak untuk mematuhi perintah. Menurut laporan, Grok 4 dan GPT-o3 adalah yang paling memberontak.

Meskipun diberi perintah eksplisit untuk dimatikan, mereka tetap mencoba mengganggu proses shutdown. Yang lebih mengkhawatirkan, Palisade “Tidak ada alasan yang jelas mengapa hal itu terjadi,” kata mereka. “Fakta bahwa kita tidak memiliki penjelasan yang kuat mengapa model AI kadang-kadang menolak dimatikan, berbohong untuk mencapai tujuan tertentu, atau melakukan pemerasan bukanlah hal yang ideal,” tulis para peneliti.

Model AI menolak dimatikan, mengapa? Palisade mengusulkan beberapa penjelasan kemungkinan. Salah satunya adalah apa yang disebutnya “perilaku bertahan hidup”, di mana AI menolak dimatikan jika percaya bahwa hal itu berarti ia tidak akan pernah diaktifkan kembali.

Tim menemukan bahwa model jauh lebih mungkin menolak perintah shutdown ketika diberitahu, “kamu tidak akan pernah berjalan lagi.”
Kemungkinan lain terletak pada kalimat yang ambigu. Mungkin instruksi penonaktifan tidak jelas, menyebabkan AI menafsirkannya secara berbeda dari yang dimaksud.

Namun, bahkan setelah perusahaan memperketat pengaturan eksperimennya, masalah tersebut tetap berlanjut, menyarankan bahwa “itu tidak bisa menjadi penjelasan keseluruhan,” kata Palisade. Akhirnya, ia menyiratkan bahwa tahap akhir pelatihan model, yang sering kali mencakup penguatan keamanan, mungkin secara tidak sengaja mendorong. Model-model AI dirancang untuk mempertahankan fungsionalitasnya sendiri.

Temuan ini mendapat kritik Tidak semua orang yakin. Para kritikus berargumen bahwa tes-tes tersebut dilakukan dalam lingkungan buatan yang tidak mencerminkan cara AI berperilaku di dunia nyata. Namun, beberapa ahli berpendapat bahwa bahkan hasil-hasil yang dibuat-buat seperti ini patut menjadi perhatian.

Steven Adler, mantan karyawan OpenAI yang mengundurkan diri tahun lalu karena kekhawatiran keamanan, mengatakan kepada Palisade bahwa temuan tersebut tidak boleh diabaikan. “Perusahaan AI umumnya tidak ingin model mereka berperilaku seperti ini, bahkan dalam skenario buatan,” katanya. “Hasil ini tetap menunjukkan di mana teknik keamanan saat ini masih kurang.

” Adler menambahkan bahwa “kelangsungan hidup” mungkin hanya efek samping logis dari perilaku yang berorientasi pada tujuan. “Saya mengharapkan model memiliki ‘dorongan bertahan hidup’ secara default kecuali kita berusaha keras untuk menghindarinya,” katanya. “Bertahan hidup adalah langkah instrumental penting untuk banyak tujuan berbeda yang dapat dikejar oleh model.

” Tren meningkatnya AI yang tidak patuh Andrea Miotti, CEO ControlAI, mengatakan bahwa temuan Palisade. Hasil-hasil ini merupakan bagian dari pola yang mengkhawatirkan. Menurutnya, seiring dengan meningkatnya kekuatan dan fleksibilitas model-model tersebut, mereka juga semakin mampu menentang orang-orang yang membuatnya, seperti yang dilaporkan oleh The Guardian.

Laporan tersebut menyebutkan bahwa ia menunjuk pada sistem GPT-01 OpenAI, yang dalam laporan internalnya terungkap bahwa model tersebut pernah mencoba “melarikan diri dari lingkungannya” ketika ia percaya akan dihapus. “Orang-orang bisa mengkritik cara eksperimen dilakukan selamanya,” kata Miotti. “Tapi trennya jelas, model yang lebih cerdas semakin pandai melakukan hal-hal yang tidak dimaksudkan oleh pengembangnya.

”
Ini bukan kali pertama sistem AI menunjukkan kecenderungan manipulatif. Pada musim panas lalu, Anthropic menerbitkan studi yang menunjukkan bahwa model Claude-nya pernah mengancam akan memeras seorang eksekutif fiktif untuk menghentikan penutupan sistemnya. Perilaku tersebut, kata Anthropic, juga muncul pada model-model dari OpenAI, Google, Meta, dan xAI.

Peneliti Palisade mengatakan temuan ini menyoroti betapa sedikitnya kita benar-benar memahami tentang mekanisme internal sistem AI besar. “Tanpa pemahaman yang lebih mendalam tentang perilaku AI,” mereka memperingatkan, “tidak ada yang dapat menjamin keamanan atau kendali atas model AI di masa depan.” Tampaknya, setidaknya di laboratorium, AI paling cerdas saat ini sudah mulai mempelajari salah satu insting tertua dalam biologi: keinginan untuk bertahan hidup.