Meski tampak canggih, nyatanya AI memiliki keterbatasan yang signifikan. Salah satunya yaitu AI tidak bisa mengenali jumlah huruf \”r\” dalam kata \”strawberry\”.
Lalu apa penyebab AI tak bisa mengeja \’strawberry\’?
Model bahasa besar (LLM) dapat menulis esai dan memecahkan persamaan dalam hitungan detik. Mereka dapat mensintesiskan terabyte data lebih cepat daripada manusia dapat membuka buku.
Namun, AI nampaknya membuat kegagalan besar hingga membuat banyak orang \’senang\’ dan ramai-ramai membuat meme yang viral.
Menurut produk AI seperti GPT-4o dan Claude, saat muncul pertanyaan; berapa kali huruf \”r\” muncul dalam kata \”strawberry\”, maka jawabannya adalah dua kali. Jawaban tersebut sudah pasti salah karena jawaban yang benar adalah ada tiga huruf \”r\” dalam kata strawberry. Pilihan RedaksiSurvei: 34 Persen Pilih AI Jadi Bos daripada Manusia karena Lebih AdilGoogle Rilis Versi Terbaru Imagen 3, Generator Gambar Berbasis AICara Buat Video Viral AI Berpelukan, Berguna Buat BernostalgiaMengapa demikian?
Kegagalan model bahasa yang besar untuk memahami konsep huruf dan suku kata merupakan indikasi kebenaran yang lebih besar yang sering kita lupakan: Benda-benda ini tidak punya otak.
Mereka tidak berpikir seperti manusia. Mereka bukan manusia, bahkan tidak mirip manusia.
Sebagian besar LLM dibangun di atas transformer, semacam arsitektur pembelajaran mendalam. Model transformer memecah teks menjadi token, yang dapat berupa kata-kata lengkap, suku kata, atau huruf, tergantung pada modelnya.
\”LLM didasarkan pada arsitektur transformer ini, yang secara khusus tidak benar-benar membaca teks. Apa yang terjadi ketika Anda memasukkan perintah adalah perintah tersebut diterjemahkan ke dalam sebuah enkode,\” kata Matthew Guzdial, seorang peneliti AI dan asisten profesor di University of Alberta, kepada TechCrunch.
\”Ketika melihat kata \’the,\’ ia memiliki satu enkode tentang apa arti \’the\’, tetapi tidak mengetahui tentang \’T,\’ \’H,\’ \’E.\’\”
Hal ini karena transformer tidak dapat menerima atau mengeluarkan teks yang sebenarnya secara efisien.
Sebaliknya, teks tersebut diubah menjadi representasi numerik dari dirinya sendiri, yang kemudian dikontekstualisasikan untuk membantu AI menghasilkan respons yang logis.
Dengan kata lain, AI mungkin mengetahui bahwa token \”straw\” dan \”berry\” membentuk \”strawberry,\” tetapi mungkin tidak memahami bahwa \”strawberry\” terdiri dari huruf \”s,\” \”t,\” \”r,\” \”a,\” \”w,\” \”b,\” \”e,\” \”r,\” \”r,\” dan \”y,\” dalam urutan tertentu.
Oleh karena itu, ia tidak dapat memberi tahu Anda berapa banyak huruf – apalagi berapa banyak huruf \”r\” – yang muncul dalam kata \”strawberry.\”
Ini bukan masalah yang mudah untuk diperbaiki, karena masalah ini tertanam dalam arsitektur yang membuat LLM ini berfungsi.
Baca selengkapnya di halaman berikutnya…

By admin