Openai'nın Video Modeli Sora, Kullanıcıların İlgisini Çekti.

OpenAI'ın en son yapay zeka video aracı olan Sora, henüz halka açık sürüm için hazır olmamasına rağmen, sosyal medya kullanıcılarını gerçekçiliğiyle etkiledi.

Yapay zeka (AI) firması OpenAI, Perşembe günü ilk metinden video oluşturma modelini büyük bir heyecanla duyurdu, ancak firma modelin hala geliştirilmesi gereken alanları olduğunu kabul etti. OpenAI, 15 Şubat'ta tanıtılan yeni yapay zeka modeline Sora adını verdi. Sora, basit metin komutlarından ayrıntılı videolar oluşturabildiği, mevcut videoları genişletebildiği ve hatta hareketsiz bir görüntüye dayalı sahneler yaratabildiği belirtildi.

OpenAI, yapay zeka modelinin 1080p'ye kadar çözünürlüklerde film benzeri sahneler oluşturabileceğini iddia etti. Bu sahneler, birden fazla karakter, belirli hareket türleri ve özne ile arka planın doğru ayrıntılarını içerebiliyor.

Sora'nın çalışma prensibi, OpenAI'nin Dall-E 3 gibi görüntü tabanlı modelleriyle aynı olan bir difüzyon modeli üzerine kuruludur. Difüzyon, bir görüntü tabanlı model aracılığıyla "statik gürültüye" benzeyen bir görüntü oluşturur ve ardından birkaç adımda "gürültüyü kaldırarak" kademeli bir şekilde net bir görüntü çıktısı elde eder.

Yapay zeka firması, Sora'nın ChatGPT ve Dall-E 3 gibi önceki araştırmalara dayandığını ve bu sayede modelin kullanıcı girdilerini daha iyi yansıttığını iddia etti.

OpenAI, Sora'nın hala bazı zayıf yönleri olduğunu ve karmaşık bir sahnenin fiziksel yapısını doğru bir şekilde simüle etmekte zorlanabileceğini, yani neden ve sonuç ilişkisini karıştırabileceğini kabul etti:

“Örneğin, bir kişi kurabiyeden ısırık alabilir, ancak daha sonra kurabiyede ısırık izi olmayabilir.” Firma, yeni aracın aynı zamanda sağ ve solu karıştırarak ya da yönlerin kesin tanımlarını takip edemeyerek verilen bir komutun "mekansal detaylarını" da karıştırabileceğini belirtti.

OpenAI, yeni modelin şimdilik sadece "kırmızı ekip" tarafından "zarar ve risk için kritik alanları" değerlendirmek ve modelin nasıl geliştirileceği konusunda geri bildirim toplamak amacıyla seçilen tasarımcılar, görsel sanatçılar ve film yapımcıları tarafından kullanılabileceğini belirtti.

Aralık 2023'te Stanford Üniversitesi'nden gelen bir rapor, yapay zeka veritabanı Laion'u kullanan yapay zeka destekli görüntü oluşturma araçlarının, yasadışı çocuk istismarı görüntüsü üzerinde eğitildiğini ortaya çıkardı. Bu da metinden görüntü veya video elde eden modeller için ciddi etik ve yasal kaygıların ortaya çıkmasına neden oldu.

X kullanıcıları şaşırdı

X'te Sora'nın çalışma örneklerini gösteren düzinelerce demo dolaşırken, Sora 173 binden fazla gönderiyle X'te trend oldu.

Yeni modelin neler yapabileceğini göstermek amacıyla OpenAI CEO'su Sam Altman, X'teki kullanıcılardan gelen özel video oluşturma taleplerini kabul etti ve ejderha sırtındaki bir ördekten dağın tepesinde podcast kaydeden köpeklere kadar Sora tarafından oluşturulan toplam yedi video paylaştı.

Yapay zeka uzmanı Mckay Wrigley, Sora tarafından oluşturulan videonun kendisini şaşırttığını ifade etti.

Nvidia'nın kıdemli araştırmacısı Jim Fan, 15 Şubat'ta X üzerinden yayınladığı bir yazıda, Sora'nın Dall-E 3 gibi bir "oyuncak" olduğuna inanan herkesin büyük bir yanılgıya düşeceğini belirtti.

Fan'a göre, Sora bir video oluşturma aracından daha fazlası, çünkü yapay zeka modeli sadece soyut video üretmekle kalmıyor, aynı zamanda sahnedeki nesnelerin fiziksel özelliklerini de belirleyici bir şekilde yaratıyor.

Kripto para piyasalarında yaşanan gelişmeleri ve en son haberleri Kriptospot.com ile anlık takip edebilirsiniz. 

Beğenebileceğin diğer haberler