Jakarta, oegopost.id – Model kecerdasan buatan terbaru dari OpenAI, Google, dan Anthropic mencetak hasil mengejutkan dalam pengujian akademik di Jepang. Dalam simulasi terbaru, ChatGPT bersama Gemini dan Claude pada seleksi masuk University of Tokyo dan Kyoto University, dua kampus dengan persaingan paling ketat di negara itu.
Perusahaan AI Jepang, LifePrompt, menguji tiga model terbaru menggunakan soal ujian masuk tahun akademik 2026. Pengujian tersebut melibatkan ChatGPT 5.2 Thinking, Google Gemini 3 Pro Preview, dan Claude Opus 4.5.
Hasil pengujian menunjukkan sejumlah model tidak hanya melewati ambang kelulusan, tetapi juga mencetak skor lebih tinggi dibanding peserta manusia dengan nilai tertinggi.
ChatGPT Unggul di Jalur Paling Kompetitif
ChatGPT mencatat hasil paling menonjol selama pengujian.
Pada jalur Natural Sciences III University of Tokyo yang menjadi jalur masuk kedokteran dan sains paling kompetitif, ChatGPT meraih 503 poin dari total 550 poin.
Skor tersebut melampaui nilai tertinggi peserta manusia yang mencapai 453 poin. ChatGPT juga menyelesaikan ujian matematika dengan nilai sempurna.
Performa kuat kembali muncul pada jalur Humanities and Social Sciences. Di kategori ini, ChatGPT mengumpulkan 452 poin dari total 550 poin.
Perolehan itu berada di atas skor tertinggi peserta yang diterima tahun ini, yaitu 434 poin.
Keunggulan serupa berlanjut di Kyoto University.
Pada ujian Fakultas Hukum, ChatGPT mengumpulkan 771 poin dan mengungguli peserta dengan nilai tertinggi yang memperoleh 734 poin.
Pada ujian Fakultas Kedokteran, ChatGPT meraih 1.176 poin dan melewati capaian peserta terbaik yang mencetak 1.098 poin.
Gemini dan Claude Ikut Cetak Nilai Tinggi
Gemini 3 Pro Preview juga menunjukkan performa kuat dalam berbagai jalur seleksi.
Model tersebut memperoleh beberapa nilai matematika sempurna dan berhasil melewati ambang kelulusan di sejumlah kategori.
Claude Opus 4.5 juga menunjukkan hasil konsisten. Model ini menembus seluruh kategori yang diuji, termasuk Natural Sciences III University of Tokyo dan Fakultas Kedokteran Kyoto University.
LifePrompt menilai hasil ini menunjukkan perkembangan kemampuan model generatif berlangsung sangat cepat dan sudah muncul di lebih dari satu sistem.
Hasil terbaru ini berbeda jauh dibanding pengujian sebelumnya.
Pada 2024, LifePrompt pernah menguji GPT-4 menggunakan soal ujian masuk University of Tokyo. Saat itu, model tersebut belum mencapai nilai minimum.
Perkembangan berikutnya berlangsung sangat cepat.
Pada Januari 2026, ChatGPT mencatat rata-rata nilai 97 persen pada 15 mata pelajaran ujian masuk nasional Jepang dan memperoleh sembilan nilai sempurna.
Hasil terbaru dari University of Tokyo dan Kyoto University kembali menunjukkan peningkatan kemampuan tersebut.
Soal Esai Masih Menjadi Tantangan
Meski unggul di banyak bidang, model AI belum menunjukkan hasil merata pada semua jenis ujian.
Model tampil sangat kuat pada mata pelajaran dengan jawaban pasti seperti matematika, fisika, kimia, dan informatika.
Sebaliknya, performa menurun ketika model menghadapi soal yang menuntut argumentasi dan interpretasi terbuka.
Contoh paling jelas muncul pada ujian sejarah dunia.
ChatGPT memperoleh sekitar 90 persen pada ujian bahasa Inggris, tetapi hanya mencapai sekitar 25 persen pada soal esai sejarah dunia.
Guru dari lembaga bimbingan belajar Jepang, Kawai Juku, menilai jawaban esai secara langsung sehingga proses penilaian tidak bergantung pada sistem otomatis.
Kepala LifePrompt, Satoshi Endo, menilai perkembangan teknologi saat ini akan memengaruhi cara dunia pendidikan dan industri merancang masa depan.
Sementara itu, Profesor Satoshi Kurihara dari Keio University menegaskan bahwa manusia dan teknologi tidak perlu bersaing di ruang yang sama. Menurutnya, manusia masih unggul dalam penalaran, kreativitas, dan kemampuan memahami konteks yang lebih luas.(ar)









