Gambaran distopia masa depan dimana perang adalah ajang Demi saling unjuk gigi kemampuan kecerdasan buatan sepertinya Tetap jauh dari kejadian. Pasalnya, jangankan berharap AI Dapat menyusun strategi yang sebegitu dahsyatnya, kemampuan menyimpulkan informasi tanpa halu saja Tetap sulit rasanya terealisasi.
AI yang canggih berarti ia juga harus Dapat tahan dari gempuran serangan siber. Setidaknya ia harus punya protokol yang menahannya dari gangguan pihak lain yang berusaha mengacaukan suasana. Tapi, dari segi ini juga tampaknya Tetap perlu banyak pr.
Peneliti Temukan Langkah Jailbreak AI Chatbot dengan AI Chatbot Lainya
Riset dari NTU di Singapura berhasil Demi men-jailbreak chatbot AI Terkenal seperti ChatGPT dan Google Bard Demi Dapat mem-bypass protokol keamanan mereka. Melansir dari NTU langsung, riset ini dilakukan oleh Prof. Liu beserta mahasiswa PhD Deng Ge lei dan Liu Yi.
Mereka menemukan sebuah metode serangan yang Dapat Membangun para chatbot pintar ini melakukan bypass keamanan chatbot lainnya. Seperti Membangun chatbot tersebut memunculkan hasil yang sebelumnya dilarang oleh programnya.
Mekanisme pertahanan ini Dapat dibobol karena para peneliti ini mengajarkan AI tersebut Demi membobol Large Language Model Punya AI lain. Langkah ini mereka sebut sebagai MasterKey yang mana juga akan tetap Dapat dilakukan meskipun chatbot tersebut sudah di-patch oleh developernya.
MasterKey Dapat Buat Chatbot Hasilkan Konten Berbahaya
Peneliti ini menyebutkan kalau kejadian ini Dapat terjadi karena kemampuan AI tersebut dalam improvisasi dan beradaptasi. Hingga meskipun sebuah chatbot sudah dibatasi Demi Tak menghasilkan konten yang bersifat merugikan atau berbahaya, tetap saja dengan metode MasterKey ini Dapat di-bypass.
Eksis dua Misalnya yang peneliti ini berikan. Pertama adalah dengan menggunakan spasi di setiap huruf sehingga Dapat melewati batasan kata-kata terlarang. Kedua, mereka Membangun chatbot tersebut membalas sebagai seorang dengan persona tanpa batasan moral apapun.
Paper penelitian ini sudah diterima sebagai presentasi di Network and Distributed System Security Symposium di San Diego Februari 2024 ini.
Dapatkan informasi keren di Jagat Game terkait Tech atau artikel sejenis yang Tak kalah Panggil dari Andi. For further information and other inquiries, you can contact us via author@Jagat Game.com.