Sudah dari sekian banyaknya generative AI yang hadir. Beberapa diantaranya seperti ChatGPT lebih terkenal dibanding yang lain. Sisanya juga mungkin baru pertama kali didengar. Tetapi, menilai dari kepopuleran semata bukan tolok ukur yang Bagus Kepada sebuah kecerdasan buatan.

Perlu namanya penilaian dari seberapa Presisi mereka Dapat menyediakan konten dan Tak melenceng dari permintaan. Kepada itulah, Eksis yang mencoba mencari Mengerti, AI mana sih yang paling Tak halu dalam memberikan jawaban.

Eksis Tier List AI dari Paling Presisi Tiba Paling Halu, Siapa yang Menang?

AI kebingungan

Vectara lewat laman GitHub mereka perlihatkan tier list AI atau Artificial Intelligence apa saja yang paling Tak halusinasi dalam memberikan informasi. Seperti yang kita ketahui, LLM atau large language model memang punya kecenderungan berhalusinasi.

Terlebih Apabila informasi yang Ingin ditampilkan itu Tak terdapat dalam database mereka dan program tersebut pun menutup celah informasi ini dengan informasi “ngawur” atau Tak sesuai fakta.

tier list ai
Informasi Dapat ngawur

Dengan banyak pihak yang bergantung pada kecerdasan buatan di bidang krusial seperti kesehatan, pertahanan, industri dan sebagainya, adalah Krusial bagi sebuah kecerdasan buatan Kepada tetap Presisi dan Tak bertindak ‘halu.’

Metode yang dilakukan Vectara adalah meminta para AI meringkas sebuah tulisan berjumlah 800 kata. Perintah yang diberikan kepada program berikut adalah mereka hanya boleh menjawab berdasarkan data di Arsip tersebut. Lampau siapa yang paling Tak halu diantara yang lain?

GPT4 Lagi Paling Jago, Palm-Chat Paling Halu

tier list ai
AI dari OpenAI Juara paling Presisi

Berdasarkan tier list disana, yang paling Presisi adalah GPT4 di 97% yang berarti Hanya punya tingkat halusinasi 3% saja. Di bawahnya disusul oleh GPT3.5 di 96,5% dan tingkat halu 3,5%. Posisi 3 dipegang oleh Llama 2 70B dengan akurasi 94,9% dan tingkat halu 5,1%.

Sedangkan paling rendah akurasinya dan tertinggi tingkat halu dipegang oleh Google Palm-Chat. Dimana tingkat keakuratan Hanya 72,8% dan tingkat halu tertinggi di 27,2%. Tier list ini juga akan Lanjut di-update mengingat perkembangan AI Lagi Lanjut berjalan dan diperbaiki kedepannya.

Bagaimana menurut kalian brott? Apakah kalian pernah menggunakan AI dan jawaban yang diberikan kadang Tak Presisi?


Dapatkan informasi keren di Jagat Game terkait Tech atau artikel sejenis yang Tak kalah Panggil dari Andi. For further information and other inquiries, you can contact us via author@Jagat Game.com.

Trending