×
Kanal
    • partner tek.id realme
    • partner tek.id samsung
    • partner tek.id acer
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd
    • partner tek.id wd

OpenAI Perkuat Pertahanan ChatGPT Atlas untuk Halau Serangan Prompt Injection

Oleh: Haidhar Ali Faqih - Rabu, 24 Desember 2025 15:00

OpenAI mengembangkan pertahanan siber untuk menangkap prompt injection terhadap browser ChatGPT Atlas

OpenAI Perkuat ChatGPT Atlas Halau Prompt Injection Tampilan ChatGPT Atlas. dok. OpenAi

OpenAI mengembangkan pendekatan rapid response loop yang proaktif sebagai strategi utama untuk menghadapi serangan prompt injection di browser berbasis kecerdasan buatan (AI) miliknya, ChatGPT Atlas.

Pendekatan ini dirancang agar sistem mampu merespons serangan secara cepat dan adaptif, terutama terhadap teknik prompt injection yang terus berkembang.
 
Dalam sebuah blog terbaru, OpenAI membahas berbagai risiko keamanan siber pada browser AI miliknya, Atlas, sekaligus menyampaikan pandangan realistis terkait ancaman yang terus berkembang.

“Prompt injection, seperti halnya penipuan dan social engineering di web, kecil kemungkinan bisa sepenuhnya ‘diselesaikan’,” tulis OpenAI dalam blog resminya.

Prompt injection merupakan teknik serangan di mana perintah berbahaya disisipkan ke dalam sistem AI tanpa sepengetahuan atau persetujuan pengguna. 

Dalam konteks browser AI, serangan ini bisa terjadi ketika AI diberi izin membaca seluruh isi sebuah situs web.

Jika situs tersebut berbahaya atau telah disusupi, penyerang dapat menyematkan prompt tersembunyi, misalnya menggunakan teks putih di latar putih. AI kemudian dapat mengeksekusi perintah tersebut tanpa disadari pengguna.

Dampaknya beragam, mulai dari pencurian data sensitif, pengunduhan file berbahaya, hingga pemasangan ekstensi browser berbahaya secara diam-diam.

“Kami memandang prompt injection sebagai tantangan keamanan AI jangka panjang, dan pertahanan harus terus diperkuat,” tambah OpenAI.

Menanggapi hal tersebut, OpenAI mengembangkan sistem rapid response loop yang dirancang menggabungkan pendeteksian serangan secara otomatis, pelatihan adversarial, serta pengamanan di tingkat sistem. 

Pendekatan ini memungkinkan OpenAI mengidentifikasi pola serangan baru lebih awal dan menutup celah keamanan lebih cepat.

Alih-alih hanya bertahan, OpenAI memilih untuk melawan dengan cara yang agresif dan adaptif. OpenAI mengembangkan bot khusus berbasis model bahasa besar (LLM) yang dilatih menggunakan reinforcement learning dan diposisikan sebagai penyerang. 

Bot ini bertugas mencari celah keamanan dan mencoba berbagai teknik eksploitasi baru. Di sisi lain, sistem AI pertahanan berperan sebagai pembela yang terus belajar mengenali pola serangan tersebut. 

Kedua sistem ini saling berhadapan dan berkembang bersama, menciptakan siklus pembelajaran berkelanjutan.

Hasilnya, AI pertahanan menjadi semakin terlatih dalam mendeteksi dan memblokir prompt injection, sekaligus meningkatkan biaya dan tingkat kesulitan eksploitasi bagi pelaku kejahatan siber.

Pendekatan ini diharapkan dapat meningkatkan ketahanan ChatGPT Atlas.

×
back to top