
Google’un Gizemli ‘Nano-Muz’ Projesi: En Yeni Görsel Düzenleyicisi Ortaya Çıktı!
Google, yapay zeka görüntü modelini güncelledi ve bu güncellemenin oldukça önemli bir adım olduğu gözlemleniyor. Şirket, bugün Gemini 2.5 Flash Image’ı piyasaya sürdü. Bu büyük yenilik, daha akıllı ve esnek görüntü oluşturma vaat ediyor.
Güncellenmiş model, kullanıcılara yalnızca görüntü oluşturmak için değil, mevcut fotoğrafları birleştirmek ve garip bozulmalar yaratmadan daha kesin düzenlemeler yapmak için doğal dil talepleri sunmalarına olanak tanıyor. Ayrıca, Gemini’nin “dünya bilgisi”ne doğrudan erişimini kullanarak ne oluşturduğunu daha iyi anlamasını sağlıyor.
Bu yükseltme, Google’ın endüstri lideri OpenAI ile arasındaki farkı kapatmaya çalıştığı bir dönemde geliyor. Geçmişte görüntü oluşturma, yapay zekanın en önemli itici güçlerinden biri olmuştu. Mart ayında, ChatGPT kullanımı, şirketin GPT-4o yerel görüntü oluşturucusunu tanıtmasıyla birlikte hızla arttı. Model tarafından oluşturulan viral Studio Ghibli memeleri, OpenAI CEO’su Sam Altman’a göre şirketin GPU modellerinin erimesine neden oldu. ChatGPT’nin şu anda haftalık 700 milyon kullanıcısı bulunuyor. Buna karşın, Google CEO’su Sundar Pichai, şirketin Temmuz ayındaki kazanç çağrısında Gemini’nin aylık 450 milyon kullanıcısı olduğunu açıkladı; bu durum, ChatGPT’nin gerisinde kalındığını gösteriyor.
En son güncellemesiyle Google, yapay zeka dünyasında sıkça karşılaşılan bir sıkıntıyı çözdüğünü söylüyor. Şimdiye kadar, aynı karakter veya nesneyi birden fazla düzenleme boyunca tutarlı bir şekilde korumak, yapay zeka görüntü oluşturucuları için büyük bir zorluktu.
“Artık aynı karakteri farklı ortamlara yerleştirebilir, bir ürünü yeni ortamlarda birden çok açıdan gösterebilir veya tutarlı marka ögeleri oluşturabilirsiniz; üstelik tüm bunlar yapılırken konu korunuyor,” şirket bir blog yazısında belirtti.
Google, kullanıcıların sadece bir komutla çok spesifik değişiklikler yapabileceğini söylüyor. Örneğin, bir görüntünün arka planını bulanıklaştırabilir, bir Tişörtten leke çıkarabilir, bir konuğun pozunu değiştirebilir ya da siyah-beyaz bir fotoğrafa renk ekleyebilir.
Henüz resmi çıkışından önce bile, yeni model LMArena adlı topluluk değerlendirme platformunda “nano-banana” adıyla anonim olarak dikkat çekiyordu. Bir X kullanıcısı, nano-banana’yı kullanarak Altman’ın bir fotoğraftaki gömleğini değiştirdiklerini paylaştı. Sonuç oldukça etkileyiciydi. Bugün, Google modelin sahibi olduğunu açıkladı ve nano-banana’nın aslında Gemini 2.5 Flash Image olduğunu ortaya çıkardı.
Gemini uygulamasında bulunmasının yanı sıra, yeni model artık geliştiricilere Gemini API, Google AI Studio ve Vertex AI aracılığıyla da sunuluyor. Google, yeni modelin kullanıldığı birkaç şablon uygulama oluşturdu ve kullanıcıların Google AI Studio’da bulunan bu şablonlar üzerine kod yazabileceklerini belirtti.
Şirket ayrıca bazı geliştiricilerin, emlak listesi kartları oluşturma, çalışan kıyafet rozetleri yapma ve ürün taslakları gibi gerçek dünya uygulamaları için uygulamayı denediğini söyledi.