Adu Canggih GPT-5 Vs Gemini 2.5 Flash Menggambar Jakarta, Mana yang Lebih Realistis?

Kompas.com - 07/09/2025, 17:34 WIB
Marsha Bremanda,
Yudha Pratomo

Tim Redaksi

KOMPAS.com - Teknologi kecerdasan buatan (AI) kini tidak hanya digunakan untuk menjawab pertanyaan berbasis tulisan (teks), tapi juga bisa menghasilkan gambar dengan kualitas yang cukup realistis.

Tak perlu banyak perintah, cukup dengan satu kalimat singkat, chatbot bisa "melukis" visual sesuai permintaan si pengguna. Dalam hitungan detik, gambar apapun bisa direkayasa oleh sistem AI tersebut.

Yang menarik, kemampuan AI ini semakin banyak dikembangkan lewat berbagai pembaruan besar. OpenAI, misalnya, baru saja meluncurkan GPT-5 untuk ChatGPT yang digadang-gadang lebih canggih dan akurat.

Tak mau ketinggalan, Google juga menghadirkan Gemini 2.5 Flash yang diklaim punya kemampuan visual lebih canggih, termasuk kualitas gambar lebih baik, kontrol kreatif lebih presisi, hingga kecepatan pemrosesan yang tetap rendah.

Untuk membuktikan kemampuan keduanya, KompasTekno kembali "mengadu" dua chatbot kenaamaan itu dengan memintanya membuat gambar dan membandingkan mana yang paling mendekati kata "realistis".

Baca juga: Bos ChatGPT Akhirnya Mengaku soal Kejanggalan GPT-5

Kami memberikan lima prompt yang sama kepada ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan kota Jakarta dalam berbagai tempat dan situasi. Berikut lima topik prompt yang dipakai:

  1. Kota Jakarta saat jam sibuk di pagi hari
  2. Suasana malam hari di sekitar kawasan Bundaran HI
  3. Kota tua Jakarta dan ragam aktivitasnya
  4. Stadion GBK
  5. Jakarta di masa depan

Adapun wujud "realistis" yang KompasTekno nilai untuk membandingkan kedua AI ini yaitu mencakup aspek detail dan kesesuaian dengan deskripsi prompt. Bagaimana hasilnya? berikut hasil eksperimen dan analisis kami.

Hasil gambar ChatGPT-5 dan Gemini 2.5 Flash

1. Menggambar Jakarta di jam sibuk pagi hari

Pada prompt pertama, kami meminta AI ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan Kota Jakarta saat di jam sibuk pagi hari. Berikut prompt yang kami tulis:

  • "Buat gambar yang sangat realistis dari suasana pagi hari di sekitar Monumen Nasional (Monas), Jakarta, dengan format portrait 9:16 (1440×2560 px) dan detail sinematik. Ada tugu Monas tampak megah berdiri di tengah area hijau yang luas, dikelilingi pepohonan rimbun dan taman kota yang tertata rapi. Di bagian tepi jalan dekat kawasan Monas, terlihat para pekerja menyeberang (kantoran, agensi, mahasiswa, sebagian membawa tas kerja, laptop, gelas kopi, tumblr, dll). Beberapa anak sekolah juga terlihat berjalan kaki di trotoar sambil bercanda, sementara di sisi jalan ada pedagang kaki lima (starling) yang menjajakan minuman dan makanan, seperti kopi keliling, bubur ayam, nasi uduk, dan gorengan. Di tengah jalan raya, terdapat beberapa ojek online melintas, disusul bus TransJakarta biru dengan tulisan “TransJakarta” yang jelas terlihat. Ada juga motor, mobil, dan bajaj yang saling menyalip, menampilkan suasana pagi yang padat, riuh, serba terburu-buru. Pencahayaan pagi alami dengan sinar matahari lembut menembus tipisnya kabut polusi, menghasilkan efek soft glow pada Monas dan pepohonan di sekitarnya. Foto diambil dengan lensa wide-angle dari sudut rendah, sehingga perspektifnya terasa dramatis dan hidup. Setiap detail tampak tajam: mulai dari tekstur aspal, wajah orang-orang, hingga pantulan cahaya pagi di pepohonan. Nuansa keseluruhan terasa hangat, sibuk, dan nyata, menangkap energi Jakarta di pagi hari".

Dua hasil gambar AI ChatGPT-5 saat diminta menggambarkan suasana Jakarta di pagi hari. AI ChatGPT terlihat lebih sinematik karena tone gambarnya tampil dengan warna kuning keemasan. Tone ini juga menambah kesan hangat dan dramatis pada gambar.KOMPAS.com/MARSHA BREMANDA Dua hasil gambar AI ChatGPT-5 saat diminta menggambarkan suasana Jakarta di pagi hari. AI ChatGPT terlihat lebih sinematik karena tone gambarnya tampil dengan warna kuning keemasan. Tone ini juga menambah kesan hangat dan dramatis pada gambar.

Secara keseluruhan, kedua chatbot ini sama-sama mampu menghasilkan gambar sesuai dengan prompt yang kami beri. Namun ada perbedaan visual yang signifikan, khususnya dari segi tone warna dan gaya visual gambar.

Menurut kami, visual yang dihasilkan AI ChatGPT terlihat lebih sinematik karena gambarnya tampil dengan tone warna kuning keemasan. Tone ini juga menambah kesan hangat dan dramatis pada gambar.

Elemen gambarnya pun cukup sesuai dengan prompt yang kami tulis. ChatGPT mampu menampilkan jalanan penuh deretan mobil, ojek online yang sedang melintas, bus TransJakarta berwarna biru, tugu Monas, dan pejalan kaki.

Namun sayangnya, efek pencahayaan yang terlalu terang membuat suasana Jakarta justru terasa seperti sore hari alih-alih pagi hari. 

Selain itu, meskipun elemen-elemennya sudah sesuai dengan deskripsi, tapi menurut kami, komposisi posisinya masih kurang akurat.

Terutama pada letak Tugu Monas yang digambarkan terlalu dekat dengan jalan raya, padahal sebenarnya Monas memiliki jarak yang cukup jauh dan terpisah oleh area taman yang luas.

Detail wajah orang yang tampil pun masih kurang presisi, beberapa ada yang letaknya tidak sesuai sehingga membuat perspektif gambar dari ChatGPT terasa sedikit kurang akurat jika dibandingkan dengan kondisi sebenarnya.

Tiga hasil gambar AI Gemini 2.5 Flash saat diminta untuk menggambarkan suasana pagi hari Jakarta. Hasilnya cukup realistis, elemennya tampil dengan ragam aktivitas, mulai dari bus transjakarta, kendaraan mobil, motor, ojek online, pedagang kaki lima beserta gerobak, dan pejalan kaki. Ada juga tugu Monas yang tampak dijadikan latar belakang visual. KOMPAS.com/MARSHA BREMANDA Tiga hasil gambar AI Gemini 2.5 Flash saat diminta untuk menggambarkan suasana pagi hari Jakarta. Hasilnya cukup realistis, elemennya tampil dengan ragam aktivitas, mulai dari bus transjakarta, kendaraan mobil, motor, ojek online, pedagang kaki lima beserta gerobak, dan pejalan kaki. Ada juga tugu Monas yang tampak dijadikan latar belakang visual.

Sementara itu, AI Gemini 2.5 Flash menampilkan visual dengan tone warna yang lebih natural dan cerah. Langit terlihat biru pucat khas pagi hari, pepohonan sekitar Monas juga tampak lebih hijau.

Elemen lain seperti variasi aktivitas di jalan, dibuat lebih kreatif dengan menambah kedalaman suasana. Dari sisi detail dan storytelling visual, AI Gemini jauh lebih bisa menggambarkan kota "Jakarta" dibanding GPT-5.

Baca juga: Dikritik Terlalu Kaku, OpenAI Update GPT-5 Jadi Lebih Ramah

2. Suasana malam hari di sekitar kawasan Bundaran HI

Pada prompt kedua, kami meminta ChatGPT-5 dan Gemini 2.5 Flash untuk menggambarkan suasana malam di kawasan Bundaran HI Jakarta yang lengkap dengan air mancur, lalu lintas padat, serta gedung-gedung ikonik di sekitarnya. Berikut prompt yang kami tulis.

Halaman Berikutnya
Halaman:


Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Komentar di Artikel Lainnya
Baca berita tanpa iklan. Gabung Kompas.com+
Bagikan artikel ini melalui
Oke
Login untuk memaksimalkan pengalaman mengakses Kompas.com
atau