Studi Ini Ungkap AI Tidak Bisa Baca Jam dan Kalender

6 hours ago 2

TEMPO.CO, Jakarta - Penelitian terbaru mengungkapkan bahwa kecerdasan buatan atau AI masih kesulitan menjalankan tugas-tugas dasar yang mudah dilakukan manusia, seperti membaca jam analog dan memahami tanggal.

Temuan ini dipresentasikan dalam ajang International Conference on Learning Representations (ICLR) 2025. Presentasi serupa dipublikasikan di server pra-cetak arXiv—situs penyimpanan dan distribusi makalah ilmiah—pada 18 Maret 2025 lalu, meski belum melalui proses tinjauan sejawat.

Baca berita dengan sedikit iklan, klik di sini

Dalam studi tersebut, para peneliti menguji kemampuan sejumlah multimodal large language model atau model bahasa besar (MLLMs) untuk memahami jam dan kalender. Beberapa AI yang diuji adalah Llama 3.2-Vision milik Meta, Claude-3.5 Sonnet dari Anthropic, Gemini 2.0 dari Google, serta GPT-4o dari OpenAI. Hasilnya, AI gagal mengidentifikasi waktu secara akurat dan menjawab pertanyaan seputar tanggal lebih dari separuh waktu.

Tingkat keberhasilan model AI dalam membaca waktu pada jam hanya sebesar 38,7 persen, sementara untuk pertanyaan terkait kalender hanya 26,3 persen.

“Kebanyakan orang bisa membaca waktu dan menggunakan kalender sejak usia dini. Temuan kami menyoroti kesenjangan besar dalam kemampuan AI menjalankan keterampilan yang cukup mendasar bagi manusia,” kata Rohit Saxena, penulis utama studi tersebut, yang berasal dari dari University of Edinburgh, dikutip Live Science, Rabu, 21 Mei 2025.

Menurut Saxena, masalah ini terjadi karena membaca jam bukan hanya soal mengenali gambar, tapi melibatkan penalaran spasial yang kompleks. “Sistem awal dilatih berdasarkan contoh-contoh yang sudah diberi label. Membaca jam membutuhkan hal yang berbeda, penalaran spasial,” ujarnya.

Menurut dia, model AI harus mendeteksi jarum jam yang saling tumpang tindih, mengukur sudut, dan menavigasi berbagai desain seperti angka Romawi atau tampilan dial yang bergaya. Bagi AI, mengenali bahwa objek yang dilihat adalah sebuah jam jauh lebih mudah dibanding membaca waktunya.

Permasalahan serupa juga ditemukan ketika AI diminta membaca kalender. Ketika diberi soal “Hari apa hari ke-153 dalam tahun ini?”, AI juga menunjukkan tingkat kegagalan tinggi. Hal ini, menurut Saxena, berkaitan dengan cara kerja AI memproses aritmetika.

Aritmetika seharusnya merupakan hal sepele bagi komputer tradisional, namun tidak untuk model bahasa besar. Menurut Saxena, AI tidak menjalankan algoritma matematika, namun memprediksi jawaban berdasarkan pola yang dilihatnya dalam data pelatihan.

“Meski kadang bisa menjawab soal aritmetika dengan benar, penalarannya tidak konsisten atau berbasis aturan, dan pekerjaan kami menyoroti celah itu,” tutur dia.

Penelitian ini menambah daftar panjang bukti perbedaan antara cara AI memahami informasi dengan cara manusia. AI cenderung bergantung pada pola yang dikenalnya dalam data pelatihan. Kecerdasan buatan ini sulit menirukan generalisasi atau penalaran abstrak, terutama dalam tugas-tugas yang jarang ditemui seperti tahun kabisat atau perhitungan kalender khusus.

Pengoperasian AI, dalam banyak kasus, disebut tetap membutuhkan keterlibatan manusia. “AI memang kuat, tapi ketika suatu tugas menggabungkan persepsi dengan penalaran yang presisi, kita tetap membutuhkan pengujian yang ketat, logika cadangan,” kata Saxena.

Read Entire Article
Bogor View | Pro Banten | | |