SULAWESI BARAT — Perusahaan AI asal Amerika Serikat, Anthropic, secara resmi memblokir akses seluruh pelanggan ke dua model kecerdasan buatan terbarunya, Fable 5 dan Mythos 5. Pemblokiran ini dilakukan untuk mematuhi perintah langsung dari pemerintah AS yang dikeluarkan pada Jumat, 12 Juni lalu, dengan alasan keamanan nasional.
Pemblokiran ini bersifat total. Semua akses pengguna, termasuk warga negara asing yang berada di dalam maupun di luar Amerika Serikat, serta karyawan Anthropic sendiri, dinonaktifkan. Namun, model-model lain milik Anthropic, termasuk chatbot andalan mereka, Claude, tidak terpengaruh oleh keputusan ini.
Langkah drastis ini diambil setelah pemerintah AS memberikan bukti lisan mengenai adanya satu metode jailbreak potensial yang tidak universal. Pemerintah menyebut metode tersebut dibagikan oleh pihak yang tidak disebutkan namanya.
Menurut Anthropic, pemerintah AS khawatir terhadap keamanan model AI yang baru saja mereka luncurkan. Fable 5, yang dirilis pada 9 Juni, dirancang untuk membawa kemampuan canggih dari Mythos 5—model keamanan siber kelas atas yang hanya tersedia untuk mitra Project Glasswing—ke publik. Dalam pengujian internal, Fable 5 bahkan berhasil memenangkan gim Pokémon FireRed, sesuatu yang gagal dilakukan oleh Claude pada gim Pokémon Red versi orisinal.
Anthropic mengakui bahwa tidak ada model AI yang sepenuhnya kebal terhadap upaya jailbreak. Perusahaan telah memasang sistem keamanan yang mereka klaim sangat ketat, bahkan disebut terlalu luas oleh sebagian pengguna. Strategi pertahanan mereka adalah membuat jailbreak menjadi sangat spesifik (narrow) atau sangat mahal untuk diproduksi, serta menggabungkannya dengan pemantauan ketat untuk mendeteksi dan menutup serangan dengan cepat.
Meskipun mematuhi perintah tersebut, Anthropic menyatakan ketidaksetujuannya. Perusahaan menilai bahwa sebuah potensi jailbreak seharusnya tidak menjadi alasan untuk menarik model komersial dari peredaran.
"Kami percaya pemerintah harus memiliki kemampuan untuk memblokir penerapan yang tidak aman, sebagai bagian dari proses undang-undang yang transparan, adil, jelas, dan didasarkan pada fakta teknis," tulis Anthropic dalam pengumuman resminya. "Tindakan ini tidak sesuai dengan prinsip-prinsip tersebut."
Anthropic berjanji akan membagikan lebih banyak detail mengenai celah keamanan yang dimaksud dalam 24 jam ke depan. Peristiwa ini menyoroti ketegangan antara inovasi AI yang cepat dan kebutuhan regulasi keamanan nasional, terutama ketika model AI publik memiliki kemampuan yang melampaui versi sebelumnya secara signifikan.