Oldal kiválasztása

««« Az eredeti cikket a 360° fokos Vuze kamera gyártója, a Human Eyes CTO-ja, Anton Bar tette közzé. Ebből szemlézünk. »»»

Emlékszel az első találkozásodra bármilyen VR headset-tel?

Had találjam ki: a korábban jellemző és elkerülhetetlen hányingeren túl az egykoron pl. Nokia 3130-as mobiltelefonnal készített 480 pixeles videók minőségét idézte fel. Ez persze túlzás, de a legtöbb felhasználók által létrehozott tartalom ma sem néz ki sokkal jobban. A technológia nagyon friss, épphogy csak elindultunk az úton.

És mégis, ahogy Dobó Mátyás írja:

VR szemüvegek szét fogják robbantani a szórakoztatás piacát.

Minden technológiának, főleg, ha az élmények piacára akar betörni, egy nagyságrenddel jobban le kell kötnie a fogyasztókat, mint korábban bármi.

Emlékszem a 90-es években volt hasonló érzésem, amikor felhasználók először leültek az internet elé és egyszerűen nem értették a csodát, ami történik. A világ másik pontján lévő emberekkel tudnak kommunikálni, tele tartalommal és élménnyel, ami akkor érkezik, amikor akarjuk.

Emlékszem azokra a korai filmekre, amiket színházakban vetítettek és ahogy az emberek arcát nézed ezeken, látod hogy csodát látnak. A VR ugyanezt csinálja egy rendkívül inflálódott élmény piacon, ahol már mindenki mindent látott.

Csak nézd meg emberek első találkozását ezekkel a termékekkel. A VR egy tökéletes piacot épít. Az utóbbi időben láttam gyerekeket szemüveggel és láttam idősebb generációt szemüveggel és egy dologról megbizonyosodtam. Ennek a technológiának nincsenek életkori korlátai. Sem élmény szempontból, sem használati szempontból. Olyan élményt ad, sokszor már a mostani állapotában is – pedig ott vagyunk ahol a filmek voltak 110 éve –, ami újra gyerekké teszi az embert. Rácsodálkozik arra, hogy ez lehetséges és elmerül benne annyira, hogy a külvilág eltűnik számára. Minden szórakoztatás legmagasabb szintje, amikor a néző már-már viccesen elfeledkezik magáról és a környezetről. A VR ilyen. Tovább..

Ebben a cikkben megpróbáljuk felvázolni a jelenlegi állást, azonosítani a felhasználók által generált VR tartalmak legfontosabb három problémáját és végül megadni “az igazán magával ragadó VR élmény” lehetséges definícióját.

Ez meglehetősen technikai jellegű lesz, vagyis, ha úgy éreznéd, hogy nem szívesen olvasnál felbontásokról, frame rate-ekről, látószögről vagy éppen videótömörítési szabványokról, úgy javasoljuk, hogy tekerj le az Összefoglalásra!

A szakadék

A felhasználók által előállított tartalmak világa sokat változott azért a Nokia 3130-as óta. Talán az volna az igazságos, ha azt mondanánk, hogy ez az iPhone bemutatásával kezdődött, leginkább az iPhone 4-gyel 2010 júniusában. qHD képernyője volt és 960×640-es felbontása, 326 pixels per inch (PPI) pixelsűrűsége. Steve Jobs ezt keresztelte Retina Display-nek, azért, mert az ember normál távolságból nem látja a pixeleket. A képek és a videók nagyszerűen néztek ki, talán éppen ez volt a legfőbb oka annak, hogy a mobiltelefon kijelzők nem fejlődtek jelentős mértékben a múltban.

Azóta megjelentek a HD Ready (1280×720), FullHD (1920×1080), a qHD (2560×1440) és UHD (3840×2160), vagyis a 4K (2160p) kijelzők. Az utóbbi felbontás persze még mindíg elég ritka, e cikk írásának pillanatában, legjobb tudomásunk szerint, ez a legjobb, melyet mobiltelefongyártó ma kínálhat. Azon telefonok listája, amely támogatja az UHD-t elég rövid, kategóriájában az első a Sony Xperia Z5 Premium, 5.5″ UHD kijelző 806 pixels per inch (PPI) pixelsűrűséggel.

De szüksége van erre valakinek egyáltalán? Egyet kell értsünk a CNET véleményével, miszerint a napi felhasználás során

egy telefon UHR 4K képernyővel nagyon durván túlzás. Nagyon durván.

Ez teljes mértékben igaz, feltételezve, hogy hagyományos tartalmakat fogyasztasz és nem VR-t. A Virtuális Valóság tartalmak minősége még mindíg erősen korlátozott, akár a Sony Xperia Z5 Premium technológiájával is.

Ez juttatott el odáig, hogy elgondolkodjunk azon, hogy mik lehetnek a kritériumai az igazán magávalragadó VR élménynek. Csak a felbontás? Minden bizonnyal a válasz: nem. Melyek azok a technológiai összetevők, amelyek elválasztanak minket attól, hogy a VR élmény megkülönböztethetetlen legyen a valóságtól?

Három dologra tudunk gondolni:

  1. 3D 360
  2. VR retinafelbontás
  3. Ultra magas képsebesség

Nézzük is meg őket egyesével.

3D 360

Mindenek előtt a 3D 360 tartalom gyakorlatilag két teljesen gömb alakú panoráma kép vagy videó, az egyik a bal, a másik a jobb szemnek, és mindkettő egyazon 3D 360 képből vagy videóból áll. Ezeket hívják általában Top-bottom formátumnak, amikor is az egyes képkockák első fele egy teljesen gömb alakú kép az egyik, míg az alsó egy szintén teljesen gömb alakú kép a másik szemnek. Gyakran ezek egymás mellé vannak rendezve.

Miért van erre szükség? Nos, ez egyszerű: a világ nem lapos, nincs hát semmi ok arra, hogy a VR videó az legyen. A világot két szemmel látjuk átlagosan 5-6 cm-rel a kettő között. Ez a sztereoszkópikus látás, és ez a legfőbb oka annak, hogy az emberek a mélységet viszonylag rövid távon érzékelik.

Sajnos, azok a kameraállványok, amelyek esetében az egyes kameramodulok néznek minden irányba, nem képesek leképezni az emberi látást. Egy szemmel látják a világot, mint a zsákmány, s nem pedig a ragadozó. Ahhoz, hogy 3D 360 felvételt kapjunk pár szettnyi sztereópárra van szükség.

VR retinafelbontás

A hagyományos retinafelbontás két okból nem elégséges a tökéletes VR élményhez:

  1. A VR kijelzők általában maximum 5cm távolságban helyezkedik el a szemtől.
  2. A VR kijelzők lencséket használnak ahhoz, hogy a képernyő képét még közelebb hozza a szemünkhöz.

Most próbáljuk meg megbecsülni az általunk említett VR retinafelbontás minimális követelményeit. Más szóval: hány pixel volna elégséges ahhoz, hogy ne észleljük őket VR headsetben?

Először is, definiáljuk a maximális teoretikus emberi látómezőt. Ahogy az alábbi diagram mutatja, a maximális binokuláris látásunk hozzávetőleg 120 fok és a vertikális látómező olyan 55 és 120 fok közé esik, hogy egyszerűbb legyen a dolgunk, utóbit vegyük 90 foknak.

Szóval a látómezőnk horizontálisan 120 fok, vertikálisan 90 fok. A teljes gömb egyébként 360×180 fok, és nem 360×360 fok, ahogy gyakran gondolják, mert a gömb lefed mindent körülötted (360 fok), fentről lefelé (180 fok). Ezt így képzeld el:

Tehát a 120×90 fokos látómezőnk a teljes gömb 1/6-odát fedi le. Ez azt jelenti, ha a monitor 4K-s, ami a fentebb említett okok miatt a tökéletes VR élményhez nem elég, a teljes gömb felbontása ezért legalább az óriási 11520×4320 pixel (3840 x 3 = 11520 és 2160 x 2 = 4320) kell legyen. Ezt sem a h264 (4K) sem a h255 (8K) nem támogatja, pedig jelenleg ezek a legelterjedtebb kodekek. A VP9 videótömörítési formátum látszik az egyedüli opciónak, de egyelőre nem látszik, hogy volna olyan chip amely ezt támogatja ésszerű méretben és ésszerű áron.

Képsebesség

Eddig a napig a legelterjedtebb videó sztenderdek a PAL és NTSC szabványok. Ahogy az angol Wikipédia szócikk fogalmaz:

Az NTSC esetében 30 képkoca míg a PAL esetében általában 25 képkocka per másodperc a jellemző. Mindkettő éppen elegendő, hogy a folyamatos mozgás illúzióját adják.

Valóban?

Nézzünk csak két példát a játékfejlesztés világából. Elég világosnak tűnik ebben a konkrét esetben, hogy 50 képkocka/másodperccel sem tűnik elég folyamatosnak a mozgás.

 

Hogy még világosabb legyen a kép, nézzük meg a különbséget a 60fps és 30fps között különböző sebességek mellett.

Fontos megjegyzés: egy hagyományos videóban egyedül maga a tartalom ami mozog, a VR videók esetében a néző maga is mozog, potenciálisan elég gyorsan és potenciálisan éppen a tartalom mozgásával ellentétes irányban. Ez könnyedén megnégyszerezi a problémát.

Lassan, de kezdi felismerni ezt a szakma. 200 fps felett már jó eséllyel a valóságból megszokott mozgást észlelnénk.

De nem csak a tartalom képsebessége a kérdés. Az azt dekódoló chipeknek ezt támogatnia kell azon felül, hogy a kijelzőnek is bírnia kell a tempót.

Összefoglalás

Összefoglalva a fentieket, elmondhatjuk, hogy a kulcs a tökéletes VR élményhez az összes fentebb említett probléma megoldása. Különös tekintettel a 12288p felbontásra 200 képkocka per másodperc mellett. Mindaddig engednünk kell az elvárásainkból és élvezzük amink van, azt ahol tartunk!

««« Az eredeti cikket a 360° fokos Vuze kamera gyártója, a Human Eyes CTO-ja, Anton Bar tette közzé. Ebből szemléztünk. »»»