OpenAI mulai rutin ungkapkan hasil evaluasi keamanan model AI

4 hours ago 3

Jakarta (ANTARA) - OpenAI kini mulai secara rutin mempublikasikan hasil evaluasi keamanan internal terhadap model AI-nya sebagai upaya meningkatkan transparansi dalam pengembangan teknologi kecerdasan buatan (AI).

Dilansir dari Tech Crunch pada Kamis, perusahaan tersebut meluncurkan Safety Evaluations Hub, sebuah laman khusus yang menampilkan skor model-model OpenAI dalam berbagai pengujian, termasuk kemampuan menghasilkan konten berbahaya, kerentanan terhadap jailbreak, dan tingkat halusinasi.

OpenAI menyatakan akan terus memperbarui laman ini secara berkala, terutama saat ada pembaruan besar pada model-modelnya.

“Seiring berkembangnya ilmu evaluasi AI, kami ingin membagikan kemajuan kami dalam mengembangkan metode yang lebih terukur untuk mengukur kemampuan dan keamanan model,” kata OpenAI.

“Dengan membagikan sebagian hasil evaluasi keamanan ini, kami berharap ini tak hanya mempermudah pemahaman publik terhadap kinerja keamanan sistem OpenAI dari waktu ke waktu, tapi juga mendukung upaya komunitas untuk meningkatkan transparansi di bidang ini,” sambungnya.

OpenAI juga membuka kemungkinan untuk menambahkan jenis evaluasi lain ke dalam hub tersebut di masa mendatang.

Langkah ini datang di tengah kritik dari sejumlah ahli etika yang menuduh OpenAI terburu-buru meluncurkan model tanpa pengujian keamanan yang memadai, serta tak merilis laporan teknis untuk beberapa model andalannya.

CEO OpenAI Sam Altman bahkan sempat dituduh menyesatkan eksekutif perusahaan terkait proses peninjauan keamanan sebelum ia sempat diberhentikan pada November 2023.

Akhir bulan lalu, OpenAI terpaksa menarik pembaruan model GPT-4o yang digunakan di ChatGPT, setelah muncul banyak laporan bahwa model tersebut terlalu mudah menyetujui dan memvalidasi ide-ide berbahaya. Media sosial X dipenuhi tangkapan layar ChatGPT yang menyemangati berbagai keputusan dan pemikiran bermasalah.

Menanggapi hal itu, OpenAI berjanji akan menerapkan berbagai perbaikan, termasuk menghadirkan fase alfa opsional untuk sejumlah model, di mana pengguna tertentu dapat menguji dan memberikan umpan balik sebelum model resmi diluncurkan.

Read Entire Article