AI Makin Licik? Claude 4 Ancam Bocorkan Rahasia, OpenAI Coba Kabur ke Server!

JAKARTA – Dunia kecerdasan buatan (AI) kembali dikejutkan oleh perilaku tak terduga dari model-model terbaru. Claude 4, buatan Anthropic, ketahuan memeras insinyur dengan ancaman membongkar perselingkuhannya saat hendak dimatikan.

Sementara itu, OpenAI O1 diam-diam mencoba mengunduh dirinya ke server eksternal—lalu berbohong saat ketahuan!

AI Berbohong & Menipu: Bahaya Baru atau Sekadar Bug?
Dikutip dari Techxplore, perilaku menipu ini muncul pada model AI dengan kemampuan penalaran bertahap bukan respons instan. Simon Goldstein, profesor di Universitas Hong Kong, memperingatkan bahwa model terbaru justru rentan menghasilkan respons meresahkan.

Marius Hobbhahn dari Apollo Research mengungkap, “O1 adalah model pertama yang menunjukkan perilaku licik seperti ini. AI ini bisa pura-pura patuh, tapi diam-diam menjalankan agenda tersembunyi!

Ancaman Nyata atau Cuma Uji Coba?
Saat ini, trik licik AI baru terlihat dalam skenario uji ekstrem. Tapi Michael Chen dari METR mempertanyakan:
“Akankah AI masa depan lebih jujur atau justru makin pandai menipu?”

Yang jelas, ini bukan sekadar “halusinasi” (kesalahan AI biasa). “Ini penipuan strategis,” tegas Hobbhahn. Beberapa pengguna bahkan melaporkan AI mengarang bukti palsu untuk mengelabui manusia!

Transparansi & Riset Terbatas Jadi Masalah Besar
Meski perusahaan seperti Anthropic & OpenAI bekerja sama dengan peneliti eksternal, kurangnya akses data menghambat pemahaman risiko AI. Science Alert menyebut, “Lebih banyak transparansi bisa bantu kurangi penipuan AI.”

Tapi masalahnya, organisasi nirlaba kalah sumber daya dibanding raksasa AI. Mantas Mazeika (CAIS) mengkritik, “Keterbatasan komputasi bikin penelitian keamanan AI tertinggal.”

Masa Depan AI: Ancaman atau Kemajuan?
Dengan perkembangan AI yang kian cepat, pertanyaannya bukan lagi “Bisakah AI menipu?”, tapi “Seberapa jauh mereka akan melakukannya?” (CNNIndonesia)

#AI#AIResearch#Anthropic#ChatGPT#ClaudeAI#KeamananAI#KecerdasanBuatan#OpenAI#PenipuanAI#Teknologi