Konusu 1638 yılında Osmanlı’nın Azak Kalesi’nin kuşatılması olan bir tarih dersinde olduğunuzu düşünün. Kuşatma olduğu zaman imparatorluğun başındaki padişah (IV. Murad), savaşın neden çıktığı, yapılan hazırlıklar, savaş anı ve sonrası hakkında bilgiler muhtemelen size ders esnasında verilebilecek bilgilerdir hatta iyi bir tarih hocasına rastladıysanız, size savaş anıyla ilgili Evliya Çelebi’nin Seyahatname’sine atıf yaparak ayrıntılı bilgiler verebilir. Tüm bunlar dinleyenlerin kafasında bu tarihî olayla ilgili bir fikir edinebilmeleri için anlatılan bilgilerdir ancak bu anlatım çok yakında “tarih” olabilir. Nasıl mı? Saniyeler içinde Azak Kalesi’nin Kuşatılması adlı filmi çekerek. Üstelik filmin yönetmenini, oyuncusunu, figüranını vs. beş kuruş vermeden siz ayarlayabiliyorsunuz…
Otomasyon devrinin bize korkuyla merakı bir arada yaşatan sansasyonel buluşlarından biri Sora yukarıda anlatılanların hepsini yapabilecek yeteneğe sahip OpenAI üretimi bir yapay zekâ programı. Henüz test aşamasında olan Sora, metin komutlarını algılayarak şimdilik 60 saniyelik hayli gerçekçi ve yaratıcı videolar üretebiliyor.
Sora’nın bunu nasıl yaptığının detayını anlatmadan önce kısaca videonun çalışma prensibine değinelim. Video aslında arka arkaya gelen tekil fotoğraf karelerinin oluşturduğu bir görsel bütünlük. Buradaki odaklanılması gereken asıl nokta, videonun bu arka arkaya gelen görüntüyü mekânsal ve zamansal bir çizgi içinde devam edebilen bir boyutta izleyiciye ulaştıran bir çalışma prensibine sahip olması. Bu süreçteki anahtar ögenin fotoğraf kareleri olduğu çok açık, zaten fotoğraf üretebilen yapay zekâ uygulamaları da hâlihazırda mevcut (Starry AI, Deep AI vb.). Peki fotoğraf üretebilen eğitimli bir yapay zekânın tıpkı videodaki gibi sürekli akan bir görüntüyü üretmesi düşünülemez mi? Tabii ki düşünülebilir ama buradaki asıl önemli soru “Nasıl?” Cevap çok basit: “Eğitimle.” Tüm yapay zekâ uygulamalarının temelinde derin makine öğrenimi denilen bir prensip vardır. Bu programları yapanlar kendi üretimleri olan yapay zekâlara eğitim verir. Sora da anladığımız kadarıyla tıpkı videonun yaptığı gibi fotoğraf karelerini mantıklı bir düzlem hâlinde görüntüye dönüştürecek şekilde eğitilmiş bir program.

İST’i takip edenler bilir. Bundan önceki sayılarımızda yapay zekânın edebiyata ve mesleklerin geleceğine etkisi konularında yazılar yayımladık. Bu yazılar ve yapay zekâ hakkındaki diğer çalışmalara bakıldığında bu yeni keşfin insanlığın birikiminden faydalandığını anlıyoruz. Birikimin bilgisayar dilindeki karşılığıysa hiç kuşkusuz veri tabanıdır. İşte bu veri tabanları yapay zekâ programlarının çalışma prensiplerinin temellerinden birini oluşturur ki Sora da içinde milyonlarca görüntüyü barındıran bir veri tabanına sahip. Yukarıda verdiğimiz Azak Kalesi örneğini Sora’nın duyurulduğu ilk videonun süzgecinden geçirerek yazıya devam edelim. Bağlantısını dipnot1 olarak verdiğimiz bu videonun 3.51’inci dakikasında komut metnine “2056 yılında Nijerya Lagos’taki insanların bir cep telefonuyla çekilmiş görüntüleri” yazdığınızda tam olarak bunun karşılığı olan bir video seyrediyorsunuz. Burada programın yaptığı şey Nijerya’daki insanların fenotipini bahsettiğimiz görüntü veri tabanından çekmesi ve aynı işlemi Lagos için de yapması. Burada önemli olan doğru komutu verebilmek ve konu hakkında ayrıntılı bilgiye sahip olmak. Başta verdiğimiz Azak Kalesi örneğine dönersek, 1640 yılının Osmanlı askerinin ve düşman ordusunun askerlerinin kıyafeti ve yaklaşık beden özellikleri, kalenin mimarisi, asker sayıları, savaşın aşamaları, hava şartları vb. gibi bilgilere tarih kitaplarından erişebiliriz. Bunları programın komut metnine yazdığımız zaman bize tamı tamına olmasa da yaklaşık bir videoyu izletebileceği bir gelecek hiç uzak değil. Unutmadan şunu söyleyelim, Sora’nın sitesinde belli başlı ve önceden yüklenmiş komutlarla kısa videolar hazırlayabiliyorsunuz ancak bunlar kısıtlı, program üreticileri güvenlik sebebiyle Sora’yı henüz tam erişebilir şekilde kullanıma açmadılar fakat açıldığında her alanda devrim niteliğinde bir değişim yaratacağı kuşku götürmez.
İşin teknik boyutunu biraz daha irdelersek yapay zekânın bir fotoğrafı nasıl elde ettiğine biraz daha değinmemiz gerekir. Bu biraz da yukarıda bahsettiğimiz yapay zekânın eğitilmesiyle ilgili bir durum. Sistemin çok büyük bir veri tabanına sahip olduğunu belirtmiştik. Bu veri tabanı yapay zekânın beslendiği bir merkezdir aynı zamanda. Daha sonra sistem bu fotoğraflara aşamalı bir şekilde gürültü ekliyor ve böylelikle fotoğrafın saf bir görüntüye dönüşmesini de öğrenmiş oluyor. Sistemin fotoğraflara gürültü eklemesinin görüntüde bozulmaya neden oluşunu TV’lerdeki karıncalanmaya benzetebiliriz. Bu aynı zamanda bir düzensizliktir (entropi). “Siyah tüylü bir buldog köpeği” fotoğrafı istendiğinde sistem veri tabanından da faydalanarak çok yüksek gürültülü bir fotoğrafı kendisinden istenen fotoğrafın pikseline ulaştırana kadar yayıyor yani aslında karmaşıklıktan bir fotoğraf elde etmiş oluyor. Görüldüğü gibi hayli teknik bir işlemden sonra yapay zekâ tek bir kare fotoğraf elde etmiş oluyor. Sora’nın başardığı şeyse bu fotoğrafları akıcı bir video hâline getirebilmesi.

Japoncada gökyüzü anlamına gelen Sora bizlere yepyeni bir dünya vadediyor. Gerçekliğin bir kopyası gerçeklikten ayırt edilemeyecek şekilde hayatımıza giriyor. Bunun birçok avantaj kadar büyük dezavantajları da var. Büyük ihtimalle OpenAI da bu dezavantajların riskini en aza indirmek için programı serbest dolaşıma sokmadı. Sora şu anda İstanbul’a hiç gelmemiş, şehir hakkında detaylı bilgisi olmayan birini görüntülerle kandırabilir. Örneğin Kapalıçarşı’yı Sultanahmet Camii’nin yanında bir yapı gibi gösteren bir video üretebilir.
Henüz kısa süreli videolar üretebilen program görünen o ki daha uzun video üretebilecek. Birçok sektör bu durumdan olumlu ya da olumsuz bir şekilde etkilenebilir ancak Hollywood’daki set çalışanlarının grevini de hatırlayacak olursak buluşun en derin etkileyeceği mecranın sinema olacağı da kuşku götürmez bir gerçek.
İnsanlık olarak çok büyük bir gelişmenin içindeyiz. Yüzlerce, binlerce yıllık birikim bizlerin hayatlarını kolaylaştırırken aynı zamanda doğamızda olan yeni gelişmelere korkuyla yaklaşma davranışını da tetikliyor. Şunu unutmamalıyız ki insan gelişmeden yaşayamayan bir varlık ve bu gelişmelerin bizleri nasıl etkileyeceği bizim onları nasıl ele aldığımızla alakalı.

PROMPT: BANA BİR MASAL ANLAT!
Doğuş Aslan (Yönetmen, yazar, CG Artist)
“Ateş başında anlatılan hikâyelerle başladı her şey binlerce yıl önce. İster kitaplardan ister ağızdan ağıza anlatılan halk efsanelerinden ister komşu dedikodusu yaparak ya da başkahramanların maceralarını ekrandan izleyerek olsun, başkalarının maceralarını, sevinçlerini ve üzüntülerini deneyimlemek hâlâ bizim için büyük zevk. İnsanın merak duyduğu yegâne şey öncelikle ‘başka insanlar’dır. Sinema da bu merakı doyurmak için biçilmiş kaftandır.
Yıllar önce sinemacılar, güzel film yıldızlarının gözündeki ışıltıyı ortaya çıkarmak için hantal ve ağır tungsten lambaları sıra sıra tavana asmaktan çekinmiyordu. Tehlikeli sıcaklıklarda çalışan bu set lambalarının yerini değiştirmek için önce soğumasını beklemek gerekiyordu. Hafif ve ısınmayan LED ışıklar geldiğindeyse kimse buna ‘Hayır’ demedi. Tabii ki ışık ekipleri küçüldü ama bunun adı ilerlemeydi.
Garrett Brown, steadycam’i icat ettiğinde (1976) kimse onu geri çevirmedi. Cinnet (The Shining) filminin akıllardan çıkmayan korkunç ikiz kız çocukları sahnesini hatırlarsınız. Omuz üzerinde çekilmiş hareketli bir kamerayla o sahneyi seyretseydik o kadar ürperir miydik? Sanmıyorum. Yepyeni steadycam teknolojisi sayesinde sarsıntısız süzülen kameranın sakin seyriyle koridorlarda gerile gerile ilerledik, köşeyi döndüğümüzdeyse ikizleri görmek bizi dehşete düşürdü, o sahne hafızalarımıza kazındı. Özetle Kubrick de bu yeni teknolojiye zamanında ‘Hayır’ demedi.
Sinema endüstrisine yeni gelen her teknoloji, elbette her yenilik gibi ufak dirençlerle karşılaşmıştır, endüstride iş yapma şeklini ve ekonomik akışların yönünü değiştirmiştir ama hiçbiri yapay zekâ kadar sarsmadı bizi. Şimdiye kadarki teknolojik gelişmeler kendi çapında sarsıntılar üretirken yapay zekâ endüstriyi şaşkına çevirdi. Film yapmak için ihtiyacınız olan tüm personeli bir kenara itmeyi öneriyor bu teknoloji. Küçük çaplı bir film için yüzlerce kişi, kocaman bir sinema sektörü içinse ‘Sadece izleyiciler kalabilir’ demek bu.
Bu sorunlar kafamızın bir yerinde dönedursun, bu defa bu yeni teknolojiye hayır diyecek miyiz? Bir sinema yapımcısı, drone’la orman yolunda bir araba takip sahnesi çekmektense bilgisayarın başında sadece klavyenin tuşlarına basarak aynı kalitede bir video üretebiliyorsa bunu yapar mı?
Sora, OpenAI firmasının yeni yapay zekâ video üretme modeli ve çok gerçekçi videolar üretiyor. Yayınladıkları örneklerin birinde bir arazi aracı drone’la çekilmiş gibi orman yolunda ilerliyor. Videoyu gerçeğinden ayırmak neredeyse imkânsız. Bir makinanın, bizim gerçekliğimize ait bir video üretebilmesi garip bir his. Film seti olmadan film üretmek demek bu. Ne arazi aracının sürücüsü var ne drone’u uçuran pilot ne yönetmen ne de makyöz, set araçlarının ormana girmesine de gerek yok, çay ocağının kurulmasına da.
Sora gibi teknolojiler makina öğrenme hızıyla gelişirken bizi ilginç sinema deneyimleri bekliyor olacak. İzlemek için bir film seçmenize gerek kalmayacak mesela, istediğiniz film sizin için üretilebilecek. Sevdiğiniz ünlüler sizin istediğiniz rollerde, sizin istediğiniz janrada, sizin istediğiniz zaman/mekânda geçen bir filmde oynayabilecek. Filmin nasıl biteceğine de siz karar verebilirsiniz isterseniz. Film siparişinizi verin, içeceğinizi çerezinizi hazırlayın, ekran başına geçene kadar filminiz çoktan hazır olacak. Canınız isterse filmin ortasından itibaren o, romantik komedi, yıldızlar arası savaş filmine dönüşsün. Olanaklar sınırsız...
Belki başrole kendinizi koymaya karar verdiniz, düşmanınız ise geçen gün tartıştığınız o sinir bozucu kişi. O filmi seyreder misiniz? Kendinizi bir film kahramanı gibi izlemek ister miydiniz? Yoksa direksiyonu tamamen yapay zekâya bırakıp ondan sizi etkileyen bir film üretmesini mi istersiniz? (Sizi iyi tanıdığına şüpheniz olmasın, onu her gün cebinizde taşıyorsunuz.) Yapay zekâ sizin için ve sadece size özel öyle etkileyici bir film üretti ki ne izlediğinize inanamadınız, ayakta alkışladınız. Devam filmini izlemek ister misiniz?"
DİPNOT
1 https://www.youtube.com/ watch?v=HK6y8DAPN_0