Mails-World – – Belakangan ini, jagat media sosial ramai diwarnai dengan fenomena gambar yang dihasilkan (generated) oleh teknologi AI berbasis text-to-image. Kreasi visual ini kemudian dibagikan secara luas di berbagai platform populer, seperti Instagram, Facebook, dan X (dulu Twitter).
Di antara berbagai tool yang tersedia, dua platform AI yang paling banyak menarik perhatian warganet adalah chatbot AI ChatGPT dan Google Gemini. Keduanya dikenal mampu mengubah deskripsi teks menjadi gambar atau foto yang menakjubkan.
Kualitas gambar AI yang dihasilkan oleh kedua platform ini seringkali memukau, menampilkan realisme yang nyaris sempurna. Detail seperti ekspresi wajah, warna kulit, tekstur pori-pori, hingga kerutan wajah, berhasil ditangkap dengan presisi, seolah-olah merupakan bidikan kamera sungguhan. Bahkan, tak jarang foto AI tersebut memiliki ‘nuansa’ yang minim artifisial, menjadikannya kian sulit dibedakan dari karya fotografi asli.
Baca juga: Viral di Medsos, Gambar AI Realistis yang Dibuat dengan Gemini, Ini Caranya
Untuk menguji seberapa jauh teknologi AI ini mampu menghasilkan gambar realistis, KompasTekno melakukan penelusuran mendalam terhadap dua generator gambar AI paling populer: ChatGPT dan Google Gemini. Lalu, bagaimana perbandingan hasilnya? Mari kita selami.
Hasil Gambar dari ChatGPT
Dari serangkaian uji coba yang dilakukan KompasTekno terhadap ChatGPT dan Google Gemini, terungkap bahwa masing-masing platform memiliki ciri khas dan karakteristik olahan gambar yang berbeda. Kami mengambil setidaknya lima sampel gambar dari kedua platform untuk perbandingan komprehensif.
Dimulai dari ChatGPT, generator gambar AI milik OpenAI ini mampu menghasilkan gambar dengan tingkat realisme yang mengagumkan. Ketika pengguna memasukkan prompt, chatbot ini menciptakan visual yang kaya kontras dan pencahayaan optimal, membuat wajah karakter terlihat sangat mirip dengan manusia asli.
ChatGPT juga unggul dalam menerapkan aturan fotografi, seperti membedakan posisi objek. Objek di latar depan tampak jernih, sementara latar belakang dibuat sedikit buram dengan efek bokeh yang menambah nilai estetika. Perpaduan pencahayaan, warna, komposisi, dan elemen foto lainnya menyatu harmonis. Detail tambahan seperti bayangan, bercak keringat, atau minyak pada wajah bahkan membuat gambar semakin realistis.
Baca juga: Fitur Baru ChatGPT: Baca Dokumen di Cloud dan Bikin Rangkuman Rapat
Namun demikian, ada beberapa kekurangan signifikan yang kami temukan. Hasil foto AI buatan ChatGPT seringkali menampilkan gaya pose dan senyuman yang terasa kaku. Warna yang digunakan cenderung terlalu mencolok dan penuh detail, serta terkesan kurang kreatif. Beberapa postur dan ukuran tubuh karakter juga terlihat tidak seimbang, seperti ukuran kepala yang tidak proporsional dengan badan. Tatapan mata yang menghadap kamera pun kerap tampak kosong dan tidak hidup.
KompasTekno mencoba men-generate sejumlah gambar lain dengan prompt yang sama, namun ChatGPT hanya mengubah wajah karakter dan sedikit sudut pengambilan gambar. Kami menilai, hasil gambar buatan ChatGPT kurang ekspresif dan minim kreativitas. Dari lima sampel yang kami buat, beberapa sudut pengambilan gambar tidak tampak realistis, dan jenis gambarnya pun seragam tanpa kreasi baru yang berarti.
Upaya kami untuk mengakali hal ini dengan membuka percakapan baru (new chat) agar menghindari pengambilan data dari sampel sebelumnya, tetap menghasilkan output yang serupa dan identik, tanpa banyak kreasi baru dari ChatGPT.
Baca juga: Beda Cara Gen Z dan Milenial Pakai ChatGPT, Bos OpenAI Mengungkap
Hasil Gambar dari Gemini
Beralih ke Google Gemini, kami menemukan bahwa generator gambar AI ini mampu menghasilkan gambar yang lebih ekspresif dan kreatif, sembari tetap mempertahankan kualitas realistisnya. Ini menjadi nilai plus yang menonjol dibandingkan pesaingnya.
Jika dibandingkan dengan ChatGPT, Gemini memang menghasilkan gambar yang tidak terlalu detail dan tidak sekontras ChatGPT. Namun, dengan mengurangi dua elemen tersebut, hasil gambar yang di-generate justru tampak lebih nyata dan “manusiawi”.
Untuk foto sampel yang pertama dan kedua, menurut penilaian KompasTekno, kedua gambar tersebut dapat dikatakan nyaris sama dengan foto asli bidikan dari smartphone. Hasil gambarnya tidak memiliki pencahayaan berlebihan layaknya flashlight pada hasil ChatGPT sebelumnya. Meskipun hasilnya jauh lebih redup, detail gambar dan postur yang dihasilkan tetap menyerupai manusia asli. Penggunaan warnanya juga nyaman dipandang mata, sehingga perpaduan antara objek dan latar belakang foto tampak menyatu secara alami.
Baca juga: Google Ingin AI Gemini Lebih Membumi, Ini Strateginya
Lebih lanjut, Gemini juga menunjukkan hasil yang lebih kreatif karena mampu menghasilkan lima sampel foto dengan gaya, pose, dan lokasi yang berbeda-beda. Ini kontras dengan ChatGPT yang cenderung terpaku pada satu posisi dan pose saja. Bahkan, Gemini mampu menggunakan sudut pengambilan gambar yang bervariasi, seperti medium close-up dan full body, mengganti wajah karakter layaknya manusia asli, serta menampilkan senyuman di wajah yang tidak terasa kaku.
Kendati demikian, ada satu kekurangan yang kami temukan. Untuk foto sampel yang keempat, Gemini menghasilkan gambar dengan kualitas terlalu tinggi dan sangat halus, sehingga gambar tersebut tampak seperti direkayasa. Dalam praktiknya, memotret di konser adalah hal yang sulit karena minim cahaya, sehingga potensi munculnya bintik warna (noise) sangat mungkin terjadi. Penonton hanya mengandalkan pencahayaan panggung atau lampu sorot.
Apabila hasilnya terlalu jernih, terang, dan bebas dari noise, gambar akan memberi kesan sudah diedit secara ekstensif. Akibatnya, realisme yang menjadi target utama justru berkurang, tidak lagi seperti foto asli.
Baca juga: Hasil Foto Konser NCT 127 Taipei dengan Galaxy S25 Ultra dari Jarak 100 Meter
Cara Hasilkan Gambar AI yang Realistis
Untuk melukis dengan kata-kata alias proses text-to-image, dibutuhkan prompt berbasis teks. Perlu diingat, semakin detail prompt yang diberikan, semakin baik pula hasil foto AI yang akan di-generate.
Apabila Anda ingin mencoba membuat foto AI realistis, Anda bisa menggunakan prompt yang kami coba di atas sebagai referensi. Meskipun menggunakan prompt yang sama, perlu dicatat bahwa kemungkinan gambar yang dihasilkan akan berbeda-beda, karena setiap generator gambar AI memiliki interpretasi unik. Anda juga bisa melakukan beberapa modifikasi sesuai dengan selera atau kebutuhan spesifik Anda. Berikut teks prompt yang bisa langsung disalin (copy) ke ChatGPT, Google Gemini, atau tool AI lainnya:
- Buat gambar yang sangat realistis seorang wanita muda Indonesia berusia 20-an, yang memiliki tinggi badan 155 cm dengan bobot sekitar 54 kg. Dia memiliki kulit kuning langsat dan rambut lurus hitam pendek sebahu. Dia sedang menonton konser musik K-pop pada gelanggang yang megah di malam hari. Ia mengenakan crop jacket denim warna biru muda dipadukan dengan kaos putih, serta rok mini hitam, dan sneakers putih. Di tangannya tergenggam lightstick bergemerlap dengan warna yang terus berubah. Wajahnya menunjukkan ekspresi gembira dan kagum, dengan mata berbinar. Di wajahnya, terdapat makeup natural, blush on merah muda di pipi, lip tint merah muda glossy, dan sedikit highlighter di tulang pipi yang memantulkan cahaya lampu. Di pergelangan tangannya tampak memakai jam. Latar belakang memperlihatkan panggung konser besar dengan layar LED raksasa, lampu sorot, asap panggung, dan kerumunan penonton yang mengangkat lightstick dan banner. Beberapa balon dan confetti beterbangan di udara. Suasana penuh warna, energi, dan sorakan antusias yang menggambarkan kemeriahan konser secara hidup. Foto ini diambil dengan kamera HP berukuran 9:16 dan fokus tertuju pada wanita. Sudut pengambilan dari depan full body dengan wajah wanita menghadap lurus ke kamera. Lighting alami dari panggung dan cahaya LED konser menciptakan pantulan dramatis di wajah dan mata, menonjolkan ekspresi kagumnya. Efek cahaya berwarna magenta dan biru dari lampu sorot menciptakan kilauan pada rambutnya dan memperjelas kontur wajahnya. Terdapat sedikit lens flare dari cahaya lampu panggung di sisi atas gambar, memperkuat nuansa konser yang semarak. Fokus dan eksposur disesuaikan untuk menampilkan detail kulit, riasan, dan tekstur pakaian dengan sangat jelas, sekaligus menjaga atmosfer gemerlap konser tetap nyata dan memukau.
Perlu diingat, gunakan gambar AI dengan bijak dan bertanggung jawab. Jangan gunakan gambar atau foto AI untuk tujuan penipuan, meniru seseorang, menyebarkan fitnah, atau tindakan kriminal lainnya yang melanggar hukum. Integritas digital adalah kunci.
Setiap foto yang di-generate oleh AI, biasanya akan memiliki watermark untuk menandakan bahwa foto tersebut merupakan rekaan tool AI. Tidak ada salahnya pula ketika mengunggah foto AI ke media sosial, pengguna memberi penjelasan jika foto atau gambar merupakan hasil olahan AI, demi transparansi.
Demikianlah penjelasan mendalam mengenai cara membuat gambar realistis AI, khususnya melalui Google Gemini, dengan mudah. Selamat mencoba!