OpenAI Perkuat Pertahanan ChatGPT Atlas untuk Halau Serangan Prompt Injection
OpenAI mengembangkan pertahanan siber untuk menangkap prompt injection terhadap browser ChatGPT Atlas
Tampilan ChatGPT Atlas. dok. OpenAi
OpenAI mengembangkan pendekatan rapid response loop yang proaktif sebagai strategi utama untuk menghadapi serangan prompt injection di browser berbasis kecerdasan buatan (AI) miliknya, ChatGPT Atlas.
Pendekatan ini dirancang agar sistem mampu merespons serangan secara cepat dan adaptif, terutama terhadap teknik prompt injection yang terus berkembang.
Dalam sebuah blog terbaru, OpenAI membahas berbagai risiko keamanan siber pada browser AI miliknya, Atlas, sekaligus menyampaikan pandangan realistis terkait ancaman yang terus berkembang.
“Prompt injection, seperti halnya penipuan dan social engineering di web, kecil kemungkinan bisa sepenuhnya ‘diselesaikan’,” tulis OpenAI dalam blog resminya.
Prompt injection merupakan teknik serangan di mana perintah berbahaya disisipkan ke dalam sistem AI tanpa sepengetahuan atau persetujuan pengguna.
- Ikut-Ikutan Bikin Tren Kilas Balik, ChatGPT Luncurkan Your Year With ChatGPT
- Agentic AI Diproyeksikan Jadi Tulang Punggung Interaksi Kerja dan Layanan Pelanggan pada 2026
- Di Balik Pesatnya AI, Pusat Data Mengonsumsi Listrik dan Air dalam Jumlah Masif
- Riset transcosmos Indonesia : Customer Experience Berbasis AI Akan Masuk Fase Integrasi Penuh pada 2026
Dalam konteks browser AI, serangan ini bisa terjadi ketika AI diberi izin membaca seluruh isi sebuah situs web.
Jika situs tersebut berbahaya atau telah disusupi, penyerang dapat menyematkan prompt tersembunyi, misalnya menggunakan teks putih di latar putih. AI kemudian dapat mengeksekusi perintah tersebut tanpa disadari pengguna.
Dampaknya beragam, mulai dari pencurian data sensitif, pengunduhan file berbahaya, hingga pemasangan ekstensi browser berbahaya secara diam-diam.
“Kami memandang prompt injection sebagai tantangan keamanan AI jangka panjang, dan pertahanan harus terus diperkuat,” tambah OpenAI.
Menanggapi hal tersebut, OpenAI mengembangkan sistem rapid response loop yang dirancang menggabungkan pendeteksian serangan secara otomatis, pelatihan adversarial, serta pengamanan di tingkat sistem.
Pendekatan ini memungkinkan OpenAI mengidentifikasi pola serangan baru lebih awal dan menutup celah keamanan lebih cepat.
Alih-alih hanya bertahan, OpenAI memilih untuk melawan dengan cara yang agresif dan adaptif. OpenAI mengembangkan bot khusus berbasis model bahasa besar (LLM) yang dilatih menggunakan reinforcement learning dan diposisikan sebagai penyerang.
Bot ini bertugas mencari celah keamanan dan mencoba berbagai teknik eksploitasi baru. Di sisi lain, sistem AI pertahanan berperan sebagai pembela yang terus belajar mengenali pola serangan tersebut.
Kedua sistem ini saling berhadapan dan berkembang bersama, menciptakan siklus pembelajaran berkelanjutan.
Hasilnya, AI pertahanan menjadi semakin terlatih dalam mendeteksi dan memblokir prompt injection, sekaligus meningkatkan biaya dan tingkat kesulitan eksploitasi bagi pelaku kejahatan siber.
Pendekatan ini diharapkan dapat meningkatkan ketahanan ChatGPT Atlas.









