3 Inovasi AI Paling Penting dan Mengesankan pada 2023

Teknologi  

AI konstitusional

Salah satu pertanyaan terbesar yang belum terjawab dalam AI adalah bagaimana menyelaraskannya dengan nilai-nilai kemanusiaan. Jika sistem ini menjadi lebih pintar dan lebih kuat dibandingkan manusia, maka hal ini akan menyebabkan kerugian yang sangat besar bagi spesies kita—bahkan ada yang menyebutnya sebagai kepunahan total—kecuali jika sistem ini dibatasi oleh aturan yang mengutamakan pertumbuhan manusia.

Proses yang digunakan OpenAI untuk menyelaraskan ChatGPT (untuk menghindari perilaku rasis dan seksis seperti model sebelumnya) berjalan dengan baik—tetapi proses ini memerlukan banyak tenaga manusia, melalui teknik yang dikenal sebagai “pembelajaran penguatan dengan umpan balik manusia”, atau RLHF.

Scroll untuk membaca

Scroll untuk membaca

Penilai manusia akan menilai respons AI dan memberikan komputasi yang setara dengan perlakuan anjing jika respons tersebut bermanfaat, tidak berbahaya, dan mematuhi daftar aturan konten OpenAI.

Dengan memberi penghargaan kepada AI ketika AI baik dan memberikan hukuman ketika AI buruk, OpenAI mengembangkan chatbot yang efektif dan relatif tidak berbahaya.

Namun karena proses RLHF sangat bergantung pada tenaga manusia, terdapat tanda tanya besar mengenai seberapa terukur proses tersebut. Itu mahal. Hal ini bergantung pada bias atau kesalahan yang dibuat oleh masing-masing penilai. Semakin rumit daftar aturannya, semakin rentan terhadap kegagalan.

Dan tampaknya hal ini tidak akan berhasil pada sistem AI yang begitu canggih sehingga mampu melakukan hal-hal yang tidak dapat dipahami manusia.

AI konstitusional—yang pertama kali dijelaskan oleh para peneliti di lab AI terkemuka Anthropic dalam makalah pada bulan Desember 2022—mencoba mengatasi masalah ini, memanfaatkan fakta bahwa sistem AI kini cukup mampu untuk memahami bahasa alami.

Idenya cukup sederhana. Pertama, Anda menulis “konstitusi” yang menjabarkan nilai-nilai yang Anda ingin AI Anda ikuti. Kemudian Anda melatih AI untuk menilai tanggapan berdasarkan seberapa selarasnya mereka dengan konstitusi, dan kemudian memberi insentif pada model tersebut untuk menghasilkan tanggapan yang mendapat skor lebih tinggi.

Alih-alih pembelajaran penguatan dari masukan manusia, yang ada adalah pembelajaran penguatan dari masukan AI. “Metode ini memungkinkan untuk mengendalikan perilaku AI dengan lebih tepat dan dengan label manusia yang jauh lebih sedikit,” tulis para peneliti Anthropic.

AI Konstitusional digunakan untuk menyelaraskan Claude, jawaban Anthropic tahun 2023 untuk ChatGPT. (Investor di Anthropic termasuk Salesforce, dengan co-chair dan pemilik TIME Marc Benioff sebagai CEO.)

Teks ke video semakin canggih dan memberikan nilai ekonomis....

Ikuti Ulasan-Ulasan Menarik Lainnya dari Penulis Klik di Sini
Image

Nulis, Makan, Minum, Sport

Kontak Info

Jl. Warung Buncit Raya No 37 Jakarta Selatan 12510 ext

Phone: 021 780 3747

[email protected] (Marketing)

× Image