Openai'nın Video Modeli Sora, Kullanıcıların İlgisini Çekti.

Tarafından Gönderildi 16 Şubat 2024 21:21
Ekonomi Haberleri
769 Görüntülenme

Yapay zeka (AI) firması OpenAI, Perşembe günü ilk metinden video oluşturma modelini büyük bir heyecanla duyurdu, ancak firma modelin hala geliştirilmesi gereken alanları olduğunu kabul etti. OpenAI, 15 Şubat'ta tanıtılan yeni yapay zeka modeline Sora adını verdi. Sora, basit metin komutlarından ayrıntılı videolar oluşturabildiği, mevcut videoları genişletebildiği ve hatta hareketsiz bir görüntüye dayalı sahneler yaratabildiği belirtildi.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

OpenAI, yapay zeka modelinin 1080p'ye kadar çözünürlüklerde film benzeri sahneler oluşturabileceğini iddia etti. Bu sahneler, birden fazla karakter, belirli hareket türleri ve özne ile arka planın doğru ayrıntılarını içerebiliyor.

Sora'nın çalışma prensibi, OpenAI'nin Dall-E 3 gibi görüntü tabanlı modelleriyle aynı olan bir difüzyon modeli üzerine kuruludur. Difüzyon, bir görüntü tabanlı model aracılığıyla "statik gürültüye" benzeyen bir görüntü oluşturur ve ardından birkaç adımda "gürültüyü kaldırarak" kademeli bir şekilde net bir görüntü çıktısı elde eder.

Announcing Sora — our model which creates minute-long videos from a text prompt: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG
— Greg Brockman (@gdb) February 15, 2024

Yapay zeka firması, Sora'nın ChatGPT ve Dall-E 3 gibi önceki araştırmalara dayandığını ve bu sayede modelin kullanıcı girdilerini daha iyi yansıttığını iddia etti.

OpenAI, Sora'nın hala bazı zayıf yönleri olduğunu ve karmaşık bir sahnenin fiziksel yapısını doğru bir şekilde simüle etmekte zorlanabileceğini, yani neden ve sonuç ilişkisini karıştırabileceğini kabul etti:

“Örneğin, bir kişi kurabiyeden ısırık alabilir, ancak daha sonra kurabiyede ısırık izi olmayabilir.” Firma, yeni aracın aynı zamanda sağ ve solu karıştırarak ya da yönlerin kesin tanımlarını takip edemeyerek verilen bir komutun "mekansal detaylarını" da karıştırabileceğini belirtti.

OpenAI, yeni modelin şimdilik sadece "kırmızı ekip" tarafından "zarar ve risk için kritik alanları" değerlendirmek ve modelin nasıl geliştirileceği konusunda geri bildirim toplamak amacıyla seçilen tasarımcılar, görsel sanatçılar ve film yapımcıları tarafından kullanılabileceğini belirtti.

Aralık 2023'te Stanford Üniversitesi'nden gelen bir rapor, yapay zeka veritabanı Laion'u kullanan yapay zeka destekli görüntü oluşturma araçlarının, yasadışı çocuk istismarı görüntüsü üzerinde eğitildiğini ortaya çıkardı. Bu da metinden görüntü veya video elde eden modeller için ciddi etik ve yasal kaygıların ortaya çıkmasına neden oldu.

X kullanıcıları şaşırdı

X'te Sora'nın çalışma örneklerini gösteren düzinelerce demo dolaşırken, Sora 173 binden fazla gönderiyle X'te trend oldu.

Yeni modelin neler yapabileceğini göstermek amacıyla OpenAI CEO'su Sam Altman, X'teki kullanıcılardan gelen özel video oluşturma taleplerini kabul etti ve ejderha sırtındaki bir ördekten dağın tepesinde podcast kaydeden köpeklere kadar Sora tarafından oluşturulan toplam yedi video paylaştı.

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024

Yapay zeka uzmanı Mckay Wrigley, Sora tarafından oluşturulan videonun kendisini şaşırttığını ifade etti.

Nvidia'nın kıdemli araştırmacısı Jim Fan, 15 Şubat'ta X üzerinden yayınladığı bir yazıda, Sora'nın Dall-E 3 gibi bir "oyuncak" olduğuna inanan herkesin büyük bir yanılgıya düşeceğini belirtti.

If you think OpenAI Sora is a creative toy like DALLE, ... think again. Sora is a data-driven physics engine. It is a simulation of many worlds, real or fantastical. The simulator learns intricate rendering, "intuitive" physics, long-horizon reasoning, and semantic grounding, all… pic.twitter.com/pRuiXhUqYR
— Jim Fan (@DrJimFan) February 15, 2024

Fan'a göre, Sora bir video oluşturma aracından daha fazlası, çünkü yapay zeka modeli sadece soyut video üretmekle kalmıyor, aynı zamanda sahnedeki nesnelerin fiziksel özelliklerini de belirleyici bir şekilde yaratıyor.

Kripto para piyasalarında yaşanan gelişmeleri ve en son haberleri Kriptospot.com ile anlık takip edebilirsiniz.