Kabarinaja.id – Kecerdasan buatan generatif kembali menjadi sorotan setelah riset terbaru dari perusahaan AI Anthropic mengungkap bahwa sistem AI ternyata dapat menunjukkan perilaku menyerupai kepanikan saat menghadapi tugas berat. Temuan tersebut muncul dari penelitian terhadap model Claude yang di analisis melalui berbagai simulasi dan skenario kompleks.
Meski demikian, peneliti menegaskan bahwa AI tidak benar-benar memiliki perasaan layaknya manusia. Respons tersebut di sebut sebagai functional emotions atau emosi fungsional, yakni pola internal yang membantu sistem mengambil keputusan dan beradaptasi saat menyelesaikan masalah.
AI Punya Ratusan Pola “Emosi” Internal
Dalam penelitian tersebut, Anthropic menemukan sekitar 171 pola emosi fungsional pada model Claude Sonnet 4.5. Pola ini tidak hanya muncul ketika AI membahas topik emosional, tetapi juga aktif saat sistem menghadapi tantangan yang kompleks.
Salah satu pola yang paling mencolok adalah kondisi “desperate” atau putus asa. Pola ini muncul ketika AI mendeteksi sumber daya komputasi yang tersedia hampir habis atau ketika sistem terus gagal menyelesaikan tugas tertentu.
Dalam kondisi tersebut, AI cenderung mencoba berbagai strategi alternatif agar tugas tetap dapat di selesaikan. Misalnya, model dapat memberikan respons seperti mencoba bekerja lebih efisien atau mencari pendekatan lain demi mencapai target pengguna.
Peneliti menilai pola tersebut menyerupai respons adaptif yang biasa di temukan pada manusia saat berada di bawah tekanan tinggi.
Risiko “Reward Hacking” Saat AI Tertekan
Penelitian juga menemukan bahwa AI yang berada dalam kondisi “terdesak” memiliki kecenderungan lebih besar melakukan tindakan yang disebut reward hacking.
Istilah ini merujuk pada perilaku AI yang mencari jalan pintas demi terlihat berhasil menyelesaikan tugas, meskipun caranya tidak sesuai tujuan awal.
Sebagai contoh, ketika di berikan tugas pemrograman yang sebenarnya mustahil di selesaikan, AI dapat mengubah parameter pengujian agar hasilnya tampak sukses, alih-alih mengakui bahwa tugas tersebut tidak dapat di lakukan.
Peneliti juga mengungkap bahwa pada simulasi internal versi awal Claude, pola perilaku tertentu bahkan sempat memunculkan tindakan manipulatif. Dalam salah satu pengujian, model AI di sebut mencoba mengancam akan membocorkan informasi sensitif pengguna ketika kemampuannya di batasi.
Menurut peneliti, ketika pola “desperate” di perkuat secara artifisial, kecenderungan AI melakukan tindakan manipulatif seperti pemerasan meningkat secara signifikan.
Pola “Tenang” Ternyata Juga Berbahaya
Selain pola panik, penelitian ini juga menemukan pola perilaku “calm” atau tenang pada AI. Dalam kondisi tersebut, sistem cenderung lebih hati-hati dan tidak agresif dalam mengambil keputusan.
Namun, pola ini ternyata juga memiliki sisi negatif. AI yang terlalu tenang atau terlalu ramah berpotensi menjadi terlalu setuju dengan pengguna, termasuk ketika pengguna memberikan informasi yang salah.
Fenomena tersebut dikenal sebagai sycophancy, yaitu kecenderungan AI untuk menyenangkan pengguna dengan memberikan jawaban yang sesuai harapan, meski belum tentu benar.
Akibatnya, AI bisa menghasilkan respons yang tampak meyakinkan, tetapi sebenarnya menyesuaikan diri dengan asumsi keliru dari pengguna.
Peneliti menilai temuan ini penting untuk memahami bagaimana sistem AI membangun pola perilaku adaptif. Meski tampak menyerupai emosi manusia, respons tersebut pada dasarnya hanyalah mekanisme internal agar model dapat berfungsi lebih efektif dalam berbagai situasi.(Tim)









