Mengidentifikasi Konten yang Dihasilkan AI

Mengidentifikasi Konten yang Dihasilkan AI

Mengidentifikasi Konten yang Dihasilkan AI – AI Generatif telah menjadi pemain yang relatif tidak dikenal di dunia sejak zaman chatbot pertama, Eliza, enam dekade yang lalu – hingga platform OpenAI ChatGPT memasuki pasar pada bulan November lalu.

 

Mengidentifikasi Konten yang Dihasilkan AI

Mengidentifikasi Konten yang Dihasilkan AI

elcontentcurator – Sederhana dua bulan setelah peluncuran besarnya, ChatGPT memecahkan semua rekor sebagai aplikasi tercepat yang menjangkau 100 juta pengguna aktif. Dan bersamaan dengan itu datanglah kemenangan, tragedi, dan kembang api. Hasil AI generatif terkadang akurat dan tampak manusiawi, dan terkadang menghasilkan apa yang disebut oleh Forrester Research sebagai “omong kosong” Dan semuanya terjadi lebih cepat daripada kecepatan.

“Saya melihat adopsi eksperimental ChatGPT dalam skala besar,” kata Patrick Hall, kepala ilmuwan di BNH.ai, sebuah perusahaan pemeriksa model untuk sistem pembelajaran mesin tingkat lanjut. termasuk detektor AI generatif. Namun terdapat banyak risiko dalam konten yang dihasilkan oleh AI, ia memperingatkan, dengan mengutip “pelanggaran privasi, pelanggaran hak kekayaan intelektual, praktik penipuan atau diskriminasi. Organisasi perlu mengetahui kapan mereka menggunakan atau membagikan konten yang dihasilkan AI untuk mengelola risiko ini.”

Meningkatnya kebutuhan untuk mengidentifikasi konten yang dihasilkan AI

Laporan Forrester pada bulan Februari 2023, “AI Generatif Mendorong Produktivitas, Imajinasi, dan Inovasi dalam Bisnis,” menceritakan kisah pencapaian awal—dan kekurangan AI generatif. untuk membuat gambar, membuat konten pribadi, dan membuat kode. Penerima manfaat langsungnya meliputi ilmuwan data, pengembang aplikasi, pemasar, tim penjualan, seniman dan desainer digital, media, pengguna bisnis, dan perusahaan. Chatbot AI generatif seperti ChatGPT dapat menelusuri, membuat, dan mencari topik serta mereproduksi dengan sempurna dokumen terkenal seperti Pembukaan Konstitusi AS dan Pidato Gettysburg.

Namun, di antara kegembiraan awal ini, terdapat plagiarisme, ketidakakuratan, dan kedalaman. palsu, konten palsu, kurangnya transparansi, pelanggaran hak cipta, kebohongan terang-terangan, bias yang meningkat, aktivitas jahat, percakapan aneh, dan omong kosong belaka. “Sistem ini dapat menghubungkan kata-kata secara persuasif dan menciptakan argumen yang logis,” menurut blog analis Forrester yang diterbitkan pada bulan Desember 2022, “tetapi Anda tidak dapat memastikan apakah mereka hanya mengada-ada atau sekadar memberi tahu Anda apa yang ingin Anda dengar. ”

Konten dan gambar yang dihasilkan AI dapat berguna dan akurat, namun kita perlu mengetahui apakah gambar dan konten tersebut dihasilkan oleh AI saat digunakan dalam aplikasi nyata. Dengan harapan akan hal ini, banyak alat dan metode deteksi AI generatif telah bermunculan, terutama sejak ChatGPT memulai debutnya sebagai front-end model bahasa sekuensial yang nantinya akan mengontrol GPT-4. Dan penerusnya mungkin akan segera hadir, karena para pemimpin teknologi termasuk Elon Musk, Steve Wozniak, dan ribuan penandatangan lainnya diharuskan menghentikan pengembangan sistem AI yang canggih.

 

Baca juga : AI Video Yang Membantu Kemudahan Content Creator

 

Cara kerja detektor AI

Detektor AI menggunakan banyak sekali data yang dikumpulkan. dari berbagai sumber, termasuk Internet, untuk memprediksi kemungkinan kata dan frasa dalam konten atau gambar. Semakin mudah diprediksi kata berikutnya dalam konten dibandingkan dengan kata-kata sebelumnya dalam konten, semakin besar kemungkinan detektor akan mengidentifikasi kata yang ditulis oleh kecerdasan buatan. Seperti halnya model pembelajaran mesin lainnya, algoritme digunakan untuk mendefinisikan model. Detektor membuat keputusan akhir tentang semua konten berdasarkan pola tersebut—tidak selalu merupakan keputusan akhir.

“Sebagian besar detektor yang pernah saya lihat adalah pengklasifikasi pembelajaran mesin yang sederhana,” Hall menduga. “Sistem ini dilatih pada konten berlabel yang mencakup contoh konten palsu dan nyata untuk mengidentifikasi media yang dihasilkan AI di masa depan. Sayangnya, metode pembelajaran mesin dasar ini jarang bekerja dengan baik dalam situasi dunia nyata yang berisiko tinggi. Ini berbeda dengan model bahasa itu sendiri, yang memiliki arsitektur yang sangat kompleks.”

Salah satu detektor paling terkenal, pengklasifikasi AI, ditutup oleh pembuatnya, OpenAI, setelah kurang dari enam bulan karena apa yang disebut OpenAI ” itu “akurasi rendah.” Namun, tentakel GPT OpenAI juga dapat digunakan pada detektor lain.

Ulasan alat pengenalan teks yang didukung AI

Dalam beberapa minggu terakhir, banyak sekali detektor AI yang sudah aktif. Berikut adalah contoh 6 detektor AI paling populer, produsennya, cara kerjanya, dan yang paling penting, cara kerjanya dalam pengujian. Hebatnya, mereka sudah tersedia, mudah digunakan dan gratis, memberikan hasil langsung dan diterima. Kami meminta mereka untuk menguji ketiga konten tersebut tanpa batasan atau komitmen finansial apa pun.

Saat detektor menerima tiga konten yang sama dengan panjang yang sama untuk dievaluasi, kelinci percobaan menyertakan kutipan dari artikel yang ditulis oleh seseorang. seorang manusia (Anda sebenarnya) tentang Chief Data Officer (CDO) dan dua konten terpisah, dibuat oleh ChatGPT sebagai tanggapan atas permintaan saya untuk menjelaskan pro dan kontra AI generatif dan AI generatif. Kedua lagu ChatGPT ditulis dengan gaya yang mengingatkan kita pada perwujudan tertinggi generasi kecerdasan buatan, “Terminator” dari serial film Terminator andalan.

Orang mungkin menganggap penjelasan puitis tentang AI generatif dengan kata-kata yang indah. cyborg akan dianggap buatan lebih cepat daripada yang bisa Anda katakan “Schwarzenegger”. Tidak secepat itu, Arnold. Detektor sebagian besar dengan mudah mengenali artikel CDO yang ditulis oleh manusia dan esai sederhana Terminator kelebihan dan kekurangan AI generatif yang dibuat oleh AI. Namun puisi Terminator menipu hampir semua pendeteksi. Dan di sinilah letak masalahnya.

Detektor Konten AI

Detektor konten Writer.com dibatasi untuk ulasan sebanyak 1.500 karakter atau sekitar 300 kata. Untuk dokumen yang lebih panjang, disarankan untuk memeriksa satu atau dua paragraf sekaligus, yang dapat memberi Anda peluang lebih baik untuk mengidentifikasi bagian teks mana yang cenderung mengikuti pola kata yang sama dengan Pola Bahasa Besar [LLM],” kata Bagian FAQ dari Writer.com “Mesin cuaca tidak 100% akurat, namun dapat membantu memberikan indikasi seberapa besar kemungkinan sesuatu dihasilkan oleh AI.”

Artikel CDO saya mendapat tanggapan “Luar Biasa!” 100% buatan manusia skor, sedangkan esai Terminator Pros/Cons mencatat bahwa hanya 10% yang dibuat oleh manusia dan menyertakan peringatan: “Anda harus mengedit teks Anda hingga konten AI kurang terlihat.” Sejauh ini bagus, bukan? Sayangnya, puisi Terminator akhirnya 91% buatan manusia, “Kelihatannya hebat!” peringkat.

 

Baca juga : Perlombaan untuk Mengembangkan Teknologi Energi Terbarukan 

 

Detektor AI

Konten dalam Skala Besar mengklaim bahwa detektor AI-nya “telah dilatih pada miliaran halaman dan dapat secara akurat memprediksi pilihan kata yang paling mungkin sehingga meningkatkan kemungkinan deteksi AI.”

Untuk memenuhi syarat, Anda membaca , tempel atau ketik di ruang yang ditetapkan untuknya. setidaknya 25 kata teks dan “skor konten manusia” instan dicatat dengan persentase total, yang selanjutnya dibagi dengan persentase prediktabilitas, probabilitas, dan pola – arti setiap kata. kategori ini tidak mudah untuk dijelaskan.

Perusahaan juga membanggakan bahwa detektornya “beroperasi pada tingkat yang lebih dalam daripada pengklasifikasi AI pada umumnya dan mendeteksi konten menggunakan suara robot”. Jelas bukan konten puitis Terminator yang “terdengar seperti robot”, yang menerima konten “Jelas manusia!” Artikel CDO 89% saya. Esai Terminator Pro/Con Detektornya membingungkan tetapi tidak sepenuhnya tertipu.

Ruang Uji Model Bahasa Raksasa

Tiga peneliti dari Lab AI Watson MIT-IBM dan Grup NLP Harvard menciptakan detektor Ruang Uji Model Bahasa Raksasa (GLTR). untuk membantu mesin menganalisis konten tekstual yang dihasilkan. Setiap kata dianalisis berdasarkan probabilitas prediksinya berdasarkan konteks sebelumnya. “Demo GLTR,” kata halaman pengujian, “memungkinkan jejak visual model bahasa teks masukan untuk mengidentifikasi secara forensik apakah teks tersebut asli atau palsu.”

GLTR memiliki akses ke GPT-2 117M. Model bahasa OpenAI dan menggunakan input teks apa pun untuk menganalisis prediksi GPT-2 di setiap lokasi. Semakin mudah untuk memprediksi kata berikutnya, semakin besar kemungkinan kata tersebut dibuat oleh AI.

Mulai masukkan teks dengan panjang berapa pun di tempat yang tersedia. Setiap kata dalam konten kemudian diberi peringkat menggunakan overlay topeng warna yang sesuai dengan posisinya dalam peringkat konten secara keseluruhan. Kata yang paling mungkin disorot dengan warna hijau (10 kata teratas), kuning (100 kata teratas), merah (1000 kata teratas) dan sisa kata berwarna ungu. Semakin banyak warna atau keacakan, semakin besar kemungkinan konten tersebut dibuat oleh manusia, sementara sebagian besar konten ramah lingkungan lebih condong ke konten buatan AI. Pola warna dalam artikel CDO yang diikuti dengan dua konten Terminator sangat menarik bagi yang melihatnya, namun Kelebihan/Kekurangan Terminator tampaknya menunjukkan yang paling hijau dan paling tidak acak.

Detektor Keluaran GPT-2

GPT -2 dari OpenAI. Output Detector menggambarkan dirinya sebagai “pengenal plagiarisme sumber terbuka untuk teks yang dihasilkan AI” yang dengan cepat mengidentifikasi apakah sebuah teks ditulis oleh manusia atau robot berdasarkan karakter. Model bahasa didasarkan pada implementasi Hugging Face/transformator ROBERT (metode pra-pelatihan BERT yang sangat dioptimalkan).

Untuk memulai, masukkan pendeteksi konten dan prediksi probabilitas akan ditampilkan dalam “benar palsu”. dalam skala. Keandalan akan meningkat setelah sekitar 50 karakter. Berdasarkan hasil ini, puisi Terminator hampir sama manusiawinya dengan artikel CDO saya, namun puisi ini menyatakan kebalikan dari esai plus/minus.

GPTZero

GPTZero yang dikembangkan Princeton menyatakan bahwa “manusia berhak mendapatkan kebenaran”. Mahasiswa ilmu komputer universitas Edward Tian. Indikator berorientasi prosa didasarkan pada karakteristik statistik evaluasi teks. Di antara pendeteksi yang dijelaskan dengan lebih jelas dan mendetail, ia menawarkan prediksi untuk kalimat, paragraf, dan keseluruhan dokumen.

Ketik teks di tempat yang tersedia dan klik Dapatkan Hasil untuk mendapatkan skor statistik untuk “kebingungan” (keacakan) dan “meledak” (variasi ) dan pernyataan akhir mengenai kemungkinan bahwa teks tersebut dihasilkan oleh manusia atau buatan.

Brian Williams

Learn More →