Google yapay zeka aracı Google Lumiere gerçek dışı olan şeyler üretmekten ziyade görüntüleri gerçeğe yaklaştırıyor.
Lumiere ile oluşturulan 5 saniyelik klipler, yapay zeka araçlarının bir istemden gerçekçi hareketlerle nasıl video oluşturabileceğini gösteriyor.
Lumiere Farklı Bir Teknik
Google’ın yeni nesil yapay zeka modeli Lumiere , nesnelerin bir videoda nerede olduğunu (uzay) ve aynı anda nasıl hareket edip değiştiklerini (zaman) çözen Space-Time-U-Net veya STUNet adı verilen yeni bir yayılma modelini kullanıyor . Ars Technica,bu yöntemin Lumiere’in daha küçük sabit kareleri bir araya getirmek yerine videoyu tek bir süreçte oluşturmasına olanak tanıdığını bildirdi.
Lumiere, istemden bir temel çerçeve oluşturmakla başlar. Daha sonra STUNet çerçevesini kullanarak, birbirine akan daha fazla kare oluşturmak ve kesintisiz hareket görünümü yaratmak amacıyla o çerçeve içindeki nesnelerin nereye hareket edeceğini tahmin etmeye başlar. Lumiere ayrıca Stable Video Diffusion’daki 25 kareye kıyasla 80 kare üretiyor.
Yayınlanan video, Google’ın video oluşturma ve düzenleme araçlarının sadece birkaç dakika içinde bomboş bir ekrandan gerçekçi videolar oluşturabildiğini gösteriyor. Ayrıca Google; Runway, Stable Video Diffusion veya Meta’s Emu gibi rakiplerin halihazırda işgal ettiği alanlarda da söz sahibi olabilecek gibi duruyor . Kitlesel pazara sunulan ilk metinden videoya platformlardan biri olan Runway, geçen yıl Mart ayında Runway Gen-2’yi piyasaya sürdü ve daha gerçekçi görünümlü videolar sunmaya başladı.
Runway-Google Lumiere Kıyaslaması ve Genel Performans
Google, Lumiere sitesine klipler ve istemler koydu, bir websitesi ise benzer özellikleri bulunan başka bir yaratıcı yapay zeka modeli ola Runaway’den aynı istemlerde bulunarak sonuçları Google Lumiere ile kıyasladı.
Evet, özellikle cilt dokusuna yakından baktığınızda veya sahne daha atmosferikse, sunulan kliplerden bazılarında bir miktar yapaylık oluşabiliyor. Ama şu kaplumbağaya bakın! Bir kaplumbağanın suda yaptığı gibi hareket ediyor! Gerçek bir kaplumbağaya benziyor! Lumiere tanıtım videosunu inceleyen bir uzman bu görüntünün gerçekten kamera ile çekilmemiş bir görüntü olduğunu doğruladı ve: “Bunun tamamen gerçek olmadığını açıkça anlayabilirsiniz” diye ekleyen uzman , “Bu benim işimi alacak, değil mi?” dedi.
Diğer modeller, hareketin zaten gerçekleştiği, oluşturulmuş anahtar karelerden videoları bir araya getirir (bir flip kitaptaki çizimleri düşünün), STUNet ise Lumiere’in, oluşturulan içeriğin videoda belirli bir zamanda nerede olması gerektiğine bağlı olarak hareketin kendisine odaklanmasını sağlar.
Google, metinden videoya kategorisinde büyük bir oyuncu olmadı, ancak yavaş yavaş daha gelişmiş AI modellerini piyasaya sürdü ve daha çok modlu bir odaklanmaya yöneldi. Gemini geniş dil modeli, sonunda Bard’a görüntü oluşturmayı getirecek. Lumiere henüz test için erişime açmadılar ancak Google, Runway ve Pika da dahil genel olarak mevcut AI video oluşturucularla rekabet edebilecek ve muhtemelen biraz daha iyi bir AI video platformu geliştirecek olduğunu gösteriyor bu paylaşımlar.Ayrıca Google 2022 yılında paylaştığı Google Imagen çalışmasını bir hayli geliştirmiş gibi duruyor.
![Google Videoda Devrim Yapmaya Hazırlanıyor; Google Lumiere Geliyor! 2 Google Videoda Devrim Yapmaya Hazırlanıyor; Google Lumiere Geliyor!](https://webinfo.com.tr/wp-content/uploads/2024/01/imagen_multi_clip_gif.gif)
Lumiere, metinden videoya dönüştürmenin ötesinde, görüntüden videoya dönüştürmeye, kullanıcıların belirli bir tarzda videolar yapmasına olanak tanıyan stilize oluşturmaya, videonun yalnızca bir bölümünü canlandıran sinemagraflara ve bir alanı maskelemek için iç boyamaya da olanak tanıyacak, videonun rengini veya desenini değiştirmek için.
Ancak Google’ın Lumiere belgesinde şu ifadelere yer verildi: “Teknolojimizle sahte veya zararlı içerik oluşturmanın kötüye kullanım riski vardır ve güvenli ve adil bir ortam sağlamak için önyargıları ve kötü niyetli kullanım örneklerini tespit etmeye yönelik araçlar geliştirmenin ve uygulamanın çok önemli olduğuna inanıyoruz. ” Lakin bunun nasıl denetlenebileceğine dair henüz bir açıklama yapılmadı, çalışmalar ilerledikçe bunlar da ortaya çıkacaktır diye umuyoruz.