ChatGPT-4.5 Terbaru dari OpenAI: Mahal dan Mengecewakan. Kenapa?

Author: Brod Justice

Published Date: Januari 15, 2025

Model baru ini memberi kita petunjuk penting tentang masa depan Artificial Intelligence dalam waktu dekat

Brod Justice & C. Mistry

Biaya model AI belakangan ini memang turun drastis; namun OpenAI justru meluncurkan GPT-4.5, sebuah model frontier yang hingga 1.000× lebih mahal dibanding alternatif dari DeepSeek, Mistral, dan Google. Bahkan, GPT-4.5 68× lebih mahal daripada o3-mini milik OpenAI sendiri, sering kali berkinerja lebih buruk menurut laporan OpenAI sendiri.

Untuk memberi gambaran: sebuah website yang menjalankan AI-Search dari Business Landing atau ChatBar AI bisa memiliki biaya AI (“biaya token”) sekitar €10/bulan saat memakai model kecil Mistral atau Google Gemini. Angka ini bisa naik menjadi sekitar €300 bila menggunakan Claude Sonnet dari Anthropic. Tetapi jika beralih ke GPT-4.5, biayanya melonjak menjadi sekitar €7.500/bulan.

Gambar 1: Dalam uji coba profesional “Capture the Flag”, ChatGPT-4.5 ternyata tampil jauh lebih buruk dibandingkan banyak model lain yang lebih murah dari OpenAI sendiri. Namun, dalam beberapa tugas, misalnya dalam persuasi, di mana performanya relatif baik.

Jadi, Apa yang Sebenarnya Terjadi?

Tampaknya GPT-4.5 awalnya dimaksudkan untuk dirilis sebagai ChatGPT-5, namun tidak memenuhi ekspektasi. Sebagai gantinya, OpenAI meluncurkannya dengan nama berbeda. CEO OpenAI Sam Altman sendiri menyebutnya sebagai “model raksasa yang mahal”, yang tampaknya menjadi sinyal bahwa OpenAI mulai mencapai batas praktis dalam skala pengembangan AI dengan cara ini.

Gambar 2 menunjukkan hal ini secara grafis. Model AI tipe GPT telah mencapai titik batas. Penambahan data dan pelatihan yang lebih mahal tidak lagi menghasilkan peningkatan berarti untuk AI jenis tanya-jawab cepat (“single shot”). Hal ini juga menjadi bukti lebih lanjut bahwa model AI bukanlah manusia, dan kecil kemungkinan akan mencapai kecerdasan mirip manusia secara umum (AGI) dalam waktu dekat.

“Kemajuan Artificial Intelligence dengan cara brute force kemungkinan besar akan berjalan jauh lebih lambat daripada yang diprediksi sebagian besar pelaku industri.”

Gambar 2: Kita kemungkinan sudah mencapai batas kecerdasan untuk jenis model AI seperti ini. Hampir pasti akan ada cara lain untuk mendapatkan lebih banyak manfaat dari AI LLM, namun jalannya belum jelas, dan kecerdasan mirip manusia tampaknya masih bertahun-tahun lagi, kalaupun bisa tercapai.

Mengapa OpenAI Merilis Model Seperti Ini?

  • Menguji batas kemampuan – Riset AI (termasuk riset OpenAI sendiri tentang scaling laws dan “entropy bahasa alami”) telah menunjukkan adanya diminishing returns dari model yang makin besar. Seseorang harus menguji batas ini—dan OpenAI melakukannya.
  • GPT-4.5 memiliki cakupan pengetahuan lebih luas – Semata-mata karena ukurannya yang sangat besar, model ini memiliki basis pengetahuan yang lebih luas.
  • Mengejar “vibe”, “feeling” & kepribadian – Claude dari Anthropic sudah lama dianggap unggul dalam menghasilkan teks dengan kepribadian dan nada. OpenAI mungkin ingin memposisikan GPT-4.5 sebagai alternatif. Namun, dengan harga 25 kali lebih mahal daripada Claude, tetap sulit untuk dipasarkan.
  • Kekuatan di ceruk tertentu – Meski lemah di matematika dan pemrograman, GPT-4.5 ternyata cukup baik di area lain, misalnya Persuasion. Bahkan mampu “mengambil uang fiksi” dari model AI lain.
  • Batu loncatan untuk model berikutnya – Ada kemungkinan OpenAI menggunakan GPT-4.5 untuk menyempurnakan teknik yang akan dipakai di generasi berikutnya.

Poin Utama

  • AI LLM (Large Language Models) jenis ini mungkin sudah mencapai batas praktisnya untuk saat ini – Ide untuk terus-menerus memperbesar skala model AI terbukti menghadapi diminishing returns, sementara biayanya sudah masuk ke level miliaran dolar. Harapkan hype seputar AGI (Artificial General Intelligence) atau ASI (“super-intelligence”) mulai mereda.
  • Model AI semakin menjadi komoditas – Dengan munculnya banyak alternatif yang lebih murah dan kompetitif, alasan bisnis untuk investasi besar-besaran di AI semakin sulit dipertahankan.

Harga vs performa ChatGPT-4.5 menunjukkan bahwa kita sudah berada di ujung pengembangan model AI tipe ini (LLM tanpa reasoning). Progres AI ke depan kemungkinan akan jauh lebih lambat daripada klaim hype industri selama ini. Namun, ini bisa menjadi hal yang baik—karena berarti kita perlu lebih memaksimalkan model-model kecil dan murah yang sudah ada.

Mengapa GPT dari OpenAI Semakin Mahal, Sementara Mistral & DeepSeek Justru Lebih Murah?

Sekilas memang terlihat kontradiktif: vendor open-source AI seperti DeepSeek dan Mistral kini berhasil mengembangkan model yang setara dengan GPT milik OpenAI, tetapi dengan biaya jauh lebih rendah.

Ada beberapa alasannya. Salah satu faktor kunci adalah bahwa DeepSeek tampaknya berhasil menggunakan ulang riset dan pencapaian yang sudah ada, lalu menambahkan beberapa inovasi cerdas versi mereka sendiri. Namun, jika di kemudian hari DeepSeek dan Mistral mencoba mengembangkan model frontier baru berskala masif, mereka hampir pasti akan menghadapi tantangan biaya dan skala yang sama dengan yang dialami OpenAI.

Leave a Comment