Teknologi

3 Inovasi AI Paling Penting dan Mengesankan pada 2023

AI atau kecerdasan buatan mulai mendominasi kehidupan manusia.
AI atau kecerdasan buatan mulai mendominasi kehidupan manusia.

Kecerdasan buatan (artificial intelligence/AI) memainkan peran besar. Berbagai terobosan AI mendapat perhatian luas masyarakat.

Majalah Time membuat reportase menarik tentang AI ini dengan memilih tiga inovasi kecerdasan buatan (AI) paling penting sepanjang 2023. Ketiganya adalah Multimodalitas, AI konstitusional, dan Ai teks ke video.

Multimodalitas

Scroll untuk membaca

Scroll untuk membaca

Multimodalitas mungkin terdengar seperti jargon, namun perlu dipahami maknanya: ini adalah kemampuan sistem AI untuk memproses berbagai jenis data—tidak hanya teks, tetapi juga gambar, video, audio, dan lainnya.

Tahun ini adalah pertama kalinya masyarakat mendapatkan akses terhadap model AI multimoda yang canggih. GPT-4 OpenAI adalah yang pertama, memungkinkan pengguna mengunggah gambar serta masukan teks.

GPT-4 dapat melihat isi suatu gambar, yang membuka segala macam kemungkinan, misalnya menanyakan apa yang harus dibuat untuk makan malam berdasarkan foto isi lemari es Anda. Pada September, OpenAI meluncurkan kemampuan bagi pengguna untuk berinteraksi dengan ChatGPT melalui suara dan teks.

Model terbaru Google DeepMind, Gemini, yang diumumkan pada Desember, juga dapat bekerja dengan gambar dan audio. Video peluncuran yang dibagikan oleh Google menunjukkan model tersebut mengidentifikasi bebek berdasarkan gambar garis pada catatan tempel.

Dalam video yang sama, setelah diperlihatkan gambar benang merah muda dan biru dan ditanyai bahan apa yang bisa digunakan untuk membuatnya, Gemini membuat gambar boneka gurita berwarna merah muda dan biru.

(Video pemasaran tersebut tampaknya menunjukkan Gemini mengamati gambar bergerak dan merespons perintah audio secara real time, namun dalam sebuah postingan di situs webnya, Google mengatakan bahwa video tersebut telah diedit agar singkatnya—dan bahwa model tersebut diminta menggunakan gambar diam, bukan video, dan perintah teks, bukan audio, meskipun model ini memiliki kemampuan audio.)

AI Konstitusional memicu kontroversi...

Ikuti Ulasan-Ulasan Menarik Lainnya dari Penulis Klik di Sini
Image

Nulis, Makan, Minum, Sport