Dapatkah AI Benar-Benar Terlindungi Dari Serangan Berbasis Teks?

KILAS KLATEN – Ketika Microsoft merilis Bing Chat, chatbot bertenaga AI yang dikembangkan bersama dengan OpenAI, tidak butuh waktu lama bagi para pengguna untuk menemukan cara-cara kreatif untuk membobolnya. Dengan menggunakan input yang dirancang dengan cermat, pengguna dapat membuatnya menyatakan cinta, mengancam bahaya, membela Holocaust, dan menciptakan teori konspirasi.

Dapatkah AI terlindungi dari perintah jahat? Yang menjadi pemicunya adalah rekayasa perintah jahat, atau ketika AI, seperti Bing Chat, yang menggunakan instruksi berbasis teks, perintah, untuk menyelesaikan tugas-tugasnya ditipu oleh perintah jahat.

Bing Chat tidak dirancang dengan tujuan untuk menulis propaganda neo-Nazi. Tetapi karena dilatih dengan sejumlah besar teks dari internet, maka ia rentan jatuh ke dalam pola yang tidak menguntungkan.

Adam Hyland, seorang mahasiswa Ph.D. di program Desain dan Rekayasa yang Berpusat pada Manusia di Universitas Washington, membandingkan rekayasa yang cepat dengan eskalasi serangan hak istimewa. Dengan eskalasi hak istimewa, peretas dapat mengakses sumber daya, yang biasanya dibatasi karena audit tidak menangkap semua kemungkinan eksploitasi.

Bukan hanya Bing Chat yang menjadi korban peretasan teks semacam ini. BlenderBot milik Meta dan ChatGPT milik OpenAI, juga telah diminta untuk mengatakan hal-hal yang sangat ofensif, dan bahkan mengungkapkan detail sensitif tentang cara kerja mereka.

Para peneliti keamanan telah mendemonstrasikan serangan injeksi yang cepat terhadap ChatGPT yang dapat digunakan untuk menulis malware, mengidentifikasi eksploitasi pada kode sumber terbuka yang populer, atau membuat situs phishing yang terlihat mirip dengan situs-situs yang sudah terkenal.

Menurut Hyland, saat ini tidak ada cara yang baik untuk mencegah serangan prompt injection karena alat untuk memodelkan perilaku LLM sepenuhnya tidak ada. Fábio Perez, seorang ilmuwan data senior di AE Studio, menunjukkan bahwa serangan injeksi yang cepat sangat mudah untuk dieksekusi.

“Serangan-serangan ini tidak membutuhkan injeksi SQL, worm, trojan horse, atau upaya teknis yang rumit lainnya," kata Perez dalam sebuah wawancara email.

Perusahaan seperti Microsoft dan OpenAI sudah menggunakan filter untuk mencegah AI mereka merespons dengan cara yang tidak diinginkan. Mereka juga mengeksplorasi metode seperti pembelajaran penguatan dari umpan balik manusia, dengan tujuan untuk menyelaraskan model dengan lebih baik dengan apa yang ingin dicapai oleh pengguna.***

Dapatkah AI Benar-Benar Terlindungi Dari Serangan Berbasis Teks?

Tags

AI

OpenAI

ChatGPT

Bing chatbot

Terkait

Setelah Penundaan Cukup Lama, FSD Versi 11 Tesla Kapan Rilis Untuk Publik?

Yang Berlangganan Meta Verified Tidak Akan Bisa Ubah Nama, Nama Pengguna atau Foto Profil

Twitter Akan Kirim Notifikasi Saat Tweet Atau Retweet Kalian Mendapatkan Catatan Komunitas Untuk Cek Kebenaran

Spesifikasi POCO X5 5G, Ponsel POCO Terbaru Berkamera Canggih

Artifact, Aplikasi Berita Pendiri Instagram Diluncurkan ke Publik Dengan Fitur-Fitur Baru

Terkini

Cara Cek Jenis Motherboard PC pada Windows Dalam Dua Langkah Mudah Dan Kegunaannya

Terbaru! Emulator Sony PSP PPSSPP Kini Hadir di App Store iOS

Android 15 Akan Tingkatkan Keamanan untuk Mengatasi Pencurian Data Ponsel

Google Search Hadirkan Fitur Web Filter, Simak Penjelasan Fungsinya!

Pengguna Netflix Di Windows Tidak Akan Bisa Mengunduh Video Lagi Di Bulan Depan

Terpopuler

Jadwal Samsat Keliling Bandung Rabu 15 Mei 2024, Berikut Lokasi Dan Syaratnya

Jadwal Samsat Keliling Bogor Rabu 15 Mei 2024, Berikut Lokasi Dan Syaratnya

Chief Detective Episode 9 Kapan Tayang: Simak Tanggal Rilis Dan Bocorannya

Demon Slayer Season 4: Total Jumlah Episode Dan Tanggal Rilisnya

Rekomendasi Smartphone di Bawah 2 Jutaan Paling Menarik 2024, Gaming dan Multitasking Dijamin Lancar

5 Hal yang Harus Dipersiapkan Sebelum Mencari Lowongan Kerja Hotel dan Restoran di Bali

Apple Melindungi Pengguna dan Pengembang dengan Sukses Mencegah Lebih dari $7 Miliar Penipuan Sejak 2020

Daftar Drama Korea Dengan Konsep Perjalanan Waktu Yang Harus Kalian Tonton

Jadwal Samsat Keliling Bekasi Rabu 15 Mei 2024, Berikut Lokasi Dan Syaratnya

Jadwal Samsat Keliling Depok Rabu 15 Mei 2024, Berikut Lokasi Dan Syaratnya