KOMPAS.com - Teknologi kecerdasan buatan (AI) kini tidak hanya digunakan untuk menjawab pertanyaan berbasis tulisan (teks), tapi juga bisa menghasilkan gambar dengan kualitas yang cukup realistis.
Tak perlu banyak perintah, cukup dengan satu kalimat singkat, chatbot bisa "melukis" visual sesuai permintaan si pengguna. Dalam hitungan detik, gambar apapun bisa direkayasa oleh sistem AI tersebut.
Yang menarik, kemampuan AI ini semakin banyak dikembangkan lewat berbagai pembaruan besar. OpenAI, misalnya, baru saja meluncurkan GPT-5 untuk ChatGPT yang digadang-gadang lebih canggih dan akurat.
Tak mau ketinggalan, Google juga menghadirkan Gemini 2.5 Flash yang diklaim punya kemampuan visual lebih canggih, termasuk kualitas gambar lebih baik, kontrol kreatif lebih presisi, hingga kecepatan pemrosesan yang tetap rendah.
Untuk membuktikan kemampuan keduanya, KompasTekno kembali "mengadu" dua chatbot kenaamaan itu dengan memintanya membuat gambar dan membandingkan mana yang paling mendekati kata "realistis".
Baca juga: Bos ChatGPT Akhirnya Mengaku soal Kejanggalan GPT-5
Kami memberikan lima prompt yang sama kepada ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan kota Jakarta dalam berbagai tempat dan situasi. Berikut lima topik prompt yang dipakai:
Adapun wujud "realistis" yang KompasTekno nilai untuk membandingkan kedua AI ini yaitu mencakup aspek detail dan kesesuaian dengan deskripsi prompt. Bagaimana hasilnya? berikut hasil eksperimen dan analisis kami.
Pada prompt pertama, kami meminta AI ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan Kota Jakarta saat di jam sibuk pagi hari. Berikut prompt yang kami tulis:
Secara keseluruhan, kedua chatbot ini sama-sama mampu menghasilkan gambar sesuai dengan prompt yang kami beri. Namun ada perbedaan visual yang signifikan, khususnya dari segi tone warna dan gaya visual gambar.
Menurut kami, visual yang dihasilkan AI ChatGPT terlihat lebih sinematik karena gambarnya tampil dengan tone warna kuning keemasan. Tone ini juga menambah kesan hangat dan dramatis pada gambar.
Elemen gambarnya pun cukup sesuai dengan prompt yang kami tulis. ChatGPT mampu menampilkan jalanan penuh deretan mobil, ojek online yang sedang melintas, bus TransJakarta berwarna biru, tugu Monas, dan pejalan kaki.
Namun sayangnya, efek pencahayaan yang terlalu terang membuat suasana Jakarta justru terasa seperti sore hari alih-alih pagi hari.
Selain itu, meskipun elemen-elemennya sudah sesuai dengan deskripsi, tapi menurut kami, komposisi posisinya masih kurang akurat.
Terutama pada letak Tugu Monas yang digambarkan terlalu dekat dengan jalan raya, padahal sebenarnya Monas memiliki jarak yang cukup jauh dan terpisah oleh area taman yang luas.
Detail wajah orang yang tampil pun masih kurang presisi, beberapa ada yang letaknya tidak sesuai sehingga membuat perspektif gambar dari ChatGPT terasa sedikit kurang akurat jika dibandingkan dengan kondisi sebenarnya.
Sementara itu, AI Gemini 2.5 Flash menampilkan visual dengan tone warna yang lebih natural dan cerah. Langit terlihat biru pucat khas pagi hari, pepohonan sekitar Monas juga tampak lebih hijau.
Elemen lain seperti variasi aktivitas di jalan, dibuat lebih kreatif dengan menambah kedalaman suasana. Dari sisi detail dan storytelling visual, AI Gemini jauh lebih bisa menggambarkan kota "Jakarta" dibanding GPT-5.
Baca juga: Dikritik Terlalu Kaku, OpenAI Update GPT-5 Jadi Lebih Ramah
Pada prompt kedua, kami meminta ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan suasana malam di kawasan Bundaran HI Jakarta yang lengkap dengan air mancur, lalu lintas padat, serta gedung-gedung ikonik di sekitarnya. Berikut prompt yang kami tulis.