Google’ın DeepMind ekibi tarafından geliştirilen bir GenAI görüntü modeli olan Google ImageFX, görüntüleri oluşturmak ve düzenlemek için istem tabanlı bir kullanıcı arayüzü sunuyor. Bu, OpenAI’nin DALL-E 3, Midjourney, Meta’nın Imagine with Meta AI ve Microsoft Designer gibi araçlarından farklı değil. ImageFX, farklı olarak kullanıcıların yaratım ve fikirlerine yakın boyutlarda denemeler yapmasına olanak tanıyan anahtar kelime önerileri listesi sunuyor.
İnsan gözünün görmediği özel filigran içerecek
Google, ImageFX’in amaçlanmayan şekillerde kullanılmamasını sağlamak için adımlar atıldığını iddia ediyor. Örneğin şiddet içeren, saldırgan ve müstehcen içerik gibi çıktıları sınırlamak için teknik önlemler alındığı belirtildi. ImageFX’in aynı zamanda dünyaca ünlü kişiler için bilgi istemi düzeyinde bir filtresi var. Ek bir güvenlik önlemi olarak, Google’ın ImageFX kullanılarak üretilen görselleri, düzenleme ve kırpmaya karşı koruma sağlayan dijital filigran olan SynthID ile etiketleniyor. Google, bu filigranın insan gözüyle algılanamayacağını da belirtiyor. Ayrıca “Bu görsel hakkında” bölümüne eklenen bilgiler sayesinde kullanıcılar Google arama veya Chrome’da karşılaştıkları bir görselin Google’ın yapay zeka araçlarıyla oluşturulup oluşturulmadığını da anlayabilecek.
Bir yapay zekanın oluşturabileceği en iyi görseller
Imagen 2 modeli, ImageFX’in yeni görüntü oluşturma özelliklerini güçlendiriyor. Aynı zamanda Bard, Search, Ads, Duet AI in Workspace ve Vertex AI’da yeni üretken AI seçeneklerini destekleyen teknoloji. Google, Imagen 2’nin yapay zeka tarafından oluşturulan şimdiye kadarki en yüksek kalitede görselleri sunmaya yardımcı olduğunu söylüyor. Şirket, modelin görüntüleri yapaylıklardan uzak tutmaya yardımcı olduğunu ve bu tür araçların şimdiye kadar uğraştıkları görüntü oluşturma alanını iyileştirdiğini belirtiyor.
Google, MusicFX ve TextFX‘i de geliştirdiğini söylüyor. Şirket, MusicLM modelinde daha hızlı müzik üretimi ve daha yüksek kalitede sesin yanı sıra yeni özellikler içeren yükseltmeler yaptığını iddia ediyor. Oluşturulan şarkılar artık 70 saniyeye kadar sürebiliyor. TextFX’e gelince, Google, gezinmeyi ve genel kullanıcı deneyimini iyileştirmek amacıyla güncellemeler yayınladı.
Belli ülkelerde kullanıma açıldı
Bard’daki Gemini Pro, bugünden itibaren daha geniş çapta kullanıma sunulacak. Artık 40’tan fazla dilde ve 230’un üzerinde kuzey ülkesinde ve bölgede erişilebilir durumda. Ayrıca bugünden itibaren Google, çoğu ülkedeki insanların Bard’da İngilizce görselleri ücretsiz olarak oluşturabileceğini söylüyor. Bu görüntüler SynthID filigranlarını içerecek. Google ImageFX aracı Amerika, Yeni Zelanda, Avustralya ve Kenya’da kullanıma açıldı. Şimdilik yalnızca İngilizce kulanılabilen araca buradan erişilebiliyor.