Lebih dari 50% jawaban ChatGPT salah dalam pertanyaan pemrograman

Oleh: Erlan - Kamis, 10 Agustus 2023 09:03

Sebuah studi baru-baru ini yang dilakukan oleh Purdue University di Amerika Serikat telah menjelaskan masalah terkait akurasi tanggapan ChatGPT.

Sebuah studi baru-baru ini yang dilakukan oleh Purdue University di Amerika Serikat telah menjelaskan masalah terkait akurasi tanggapan ChatGPT terhadap pertanyaan pemrograman. Temuan penelitian menunjukkan bahwa lebih dari separuh jawaban ChatGPT salah, dan kemampuan bahasanya yang canggih berhasil menyesatkan sebagian besar peserta.

Dilansir dari Gizmochina (10/8), tim peneliti tersebut memeriksa 517 pertanyaan pemrograman yang bersumber dari Stack Overflow dan menilai berbagai aspek tanggapan ChatGPT, termasuk kebenaran, konsistensi, kelengkapan, dan keringkasan. Hasil evaluasinya mengecewakan, karena terungkap bahwa 52% dari jawaban yang diberikan tidak akurat, dan 77% substansial tidak perlu panjang.

Hal yang lebih memprihatinkan lagi adalah pengamatan bahwa gaya bahasa AI yang fasih dan metodis sering menyesatkan para peserta. Hanya dalam kasus di mana kesalahannya sangat mencolok, para peserta dapat mengidentifikasi ketidakakuratannya.

Terlepas dari tanggapan yang salah, hampir 40% peserta lebih menyukai jawaban ChatGPT. Namun, 77% dari tanggapan yang disukai itu ternyata salah. Para peneliti, termasuk individu seperti Samia Kabir, David Udo-Imeh, Bonan Kou, dan Asisten Profesor Tianyi Zhang, mengklarifikasi bahwa banyak kesalahan berasal dari ketidakmampuan ChatGPT untuk memahami nuansa kontekstual dari pertanyaan tersebut.