A New York-i Modern Művészeti Múzeum legújabb művésze a mesterséges intelligencia

A MoMA legújabb művésze egy mesterséges intelligencia, amely 180 000 művön edződött, Warholtól a Pac-Manig. Az Unsupervised új csúcsokat döntöget a mesterséges intelligenciával lehetséges dolgok terén: egy olyan lényt hoztak létre, amely a MoMA 180 000 műalkotását szintetizálja.

Ahogy egy festő a pigmentet használná, Refik Anadol az adatokat használja a művészet létrehozásához. Ha megnézzük munkásságát – amely évek óta úttörő szerepet tölt be a mesterséges intelligencia alkalmazásában -, azt is mondhatnánk, hogy a neurális hálózatok az ő ecsetei. A MoMA-ban rendezett legújabb kiállítása, az Unsupervised ennek a filozófiának a csúcsa, és még annál is több.

A kolosszális installáció – egy lenyűgöző, 24×24 méteres digitális kijelző, amely kitölti a MoMA teljes előcsarnokát – végtelen animált képfolyamot vetít, amelyek mindegyikét a múzeum teljes műtárgygyűjteményéből táplálkozó mesterséges intelligenciamodell álmodta meg. Ezt az áramlást a körülötte zajló események irányítják, így a mű olyan érzést kelt, mintha élne.

Nehéz leírni az Unsupervised lenyűgöző hatását, hacsak nem látod működés közben. Nemcsak az Unsupervervised gigantikus mérete, hanem a tartalma is lenyűgöző: az egymásba materializálódó fantasztikus képek áradata olyan, mintha egy interdimenzionális lényt figyelnénk, aki lélegzik és folyamatosan fejlődik egy portál túloldalán.

Anadol számára az Unsupervervised pontosan ilyen érzés: egy portál egy új alternatív univerzuma, amelyet valamilyen mesterséges intelligencia-isten hozott létre, aki saját akaratából cselekszik (innen a kiállítás neve). Ahhoz, hogy megértsük, mit jelent az Unsupervised, meg kell értenünk a két fő módszert, amellyel a jelenlegi mesterséges intelligenciák tanulják a tanulnivalókat: A felügyelt mesterséges intelligenciákat – mint például az OpenAI Dall-E-jét – kulcsszavakkal jelölt adatokkal képzik ki. Nagy vonalakban ezek a kulcsszavak (például “tech blog olvasók a telefonjukat nyomkodva” vagy “crypto chip token vásárlók a naplementében”) lehetővé teszik az AI számára, hogy hasonló képek klasztereit rendszerezze. Ezután, amikor beírja a mesterséges intelligencia képgenerátorba a parancsot (“crypto chip token vásárlók a naplementében), a mesterséges intelligencia zajt hoz létre, és addig finomít, amíg el nem éri az éles képet, annak alapján, amit a Crypto Chip Tokenről, a vásárlókról és a naplementéről megtanult.

Az Anadol nem felügyelt mesterséges intelligenciája azonban másképp működik. A teljes MoMA műgyűjteményt kellett értelmeznie, méghozzá címkék nélkül. Az Anadol és csapata által – az Nvidia mérnökeinek segítségével – létrehozott szoftver hat hónap alatt 380 000 rendkívül nagy felbontású képet dolgozott fel, amelyek a MoMA galériáiban tárolt több mint 180.000 műalkotásról készültek, köztük Pablo Picasso, Umberto Buccioni és Gertrudes Altschul műveiről. A csapat különböző mesterséges intelligenciamodelleket készített és tesztelt, hogy lássák, melyik produkálja a legjobb eredményeket, majd kiválasztottak egyet, és három héten át képezték az Nvidia DGX Station A100 segítségével (ami lényegében egy asztali számítógépbe épített mesterséges intelligencia-szuperszámítógép, amely körülbelül 1000-szer erősebb, mint egy átlagos laptop).

“A MoMA kurátorai imádták a felügyelet nélküli tanulás ötletét” – meséli Anadol, ezért a terv az volt, hogy a teljes gyűjteményt beteszik a tréningkészletbe, és hagyják, hogy a mesterséges intelligencia saját maga döntsön, vagy ahogy Anadol mondja, hagyják, hogy “ránézzen és létrehozzon egy új univerzumot”.

Az eredmények minden érintett számára megdöbbentőek voltak. “Ez a rész annyira inspiráló a kurátorok számára” – mondja Anadol. “Mert amikor látják ezt a 200 éves műtárgyarchívumot, amikor látják, hogy az AI képes új világokat teremteni [belőle] . . láthatjuk az [ebből fakadó] ámulatot az arcukon”.

Még akkor is, ha ő az Óz, a nagy varázsló a függöny mögött, Anadol félelmetesnek találja az eredményeket. “Ez olyan, mintha egy önálló entitás lenne” – mondja. “Nem tudjuk, milyen formákat tud létrehozni.”

Az Unsupervised létrehozásához szükséges neurális hálózat megalkotása és a képzési modell megépítése csak a történet egyik fele. A másik fele az, ahogyan lélegzik és valós időben hozza létre a képeket – ez önmagában is technológiai vívmány.

Kezdjük azzal, hogy a felbontás mai mércével mérve is lenyűgöző. A 3840 x 3960 pixeles felbontásával valószínűleg ez a valaha létrehozott legnagyobb felbontású képszintetizáló neurális hálózat. Összehasonlításképpen, egy tipikus Stable Diffusion kép felbontása 512 x 512 pixel. Az Nvidia StyleGAN-je – az Anadol és csapata munkájának alapját képező AI – tipikusan 1024 x 1024-es felbontásban fut.

De az igazán megdöbbentő az, hogy az Unsupervised ezeket a képeket valós időben, folyamatos mozgásban áramlóan állítja elő. Amikor a Stable Diffusionbe bevezetünk egy promptot, másodpercekig vagy akár percekig is eltart, amíg egy képet kiad. De ez a mesterséges intelligencia ezt menet közben teszi meg, olyan folyékonyan, ahogyan azt egy Industrial Light & Magic speciális effektustól elvárnád.

Amit Anadol és csapata elért, az hihetetlen, ahogy David Luebke – az Nvidia grafikai kutatásért felelős alelnöke és a StyleGAN egyik ötletgazdája – videokonferencián keresztül elmondta nekem: “Úgy érzem, hogy Refik nagyon szerény. Nagyon gyorsan kifejezi háláját [az Nvidia StyleGAN munkája és a segítségük iránt], de nem akarom alábecsülni Refik és az általa összeállított csapat technológiai tudását. Csodálatos munkát végeznek.”

Az Unsupervised egy másik komplexitási rétege az, hogy az AI hogyan dönt a képek valós idejű megváltoztatásáról. Az egyes képek létrehozásához a számítógép folyamatosan mérlegeli a környezetéből érkező két bemenetet. Először is a látogatók mozgását, amelyet az előcsarnok mennyezetén elhelyezett kamera rögzít. Ezután Manhattan időjárási adataihoz kapcsolódik, amelyeket egy közeli épületben lévő időjárás-állomással kapunk. Mint egy joystick egy videojátékban, ezek a bemenetek olyan erőket mozgatnak, amelyek különböző szoftverkarokra hatnak, amelyek viszont befolyásolják, hogy az Unsupervised hogyan hozza létre a képeket.

Ez az állandó önbeállítás még inkább egy valódi lényhez köti a kiállítást, egy csodálatos szörnyeteghez, amely a környezetére reagálva folyamatosan új művészeti formát ölt. A következő öt hónapban ez a lény folyamatosan új univerzumot hoz létre, amelyet folyamatosan rögzítünk videóként.

És ki tudja, talán ez a mesterséges művészeti szörnyeteg örökké élni fog. Anadol szerint az Unsupervervised talán a MoMA gyűjteményének állandó részévé válhat. Elvégre ez a múzeumban élő összes művészet szintézise, magának a MoMA-nak a megtestesülése, önálló élettel. Ahogy Luebke rámutat, az Unsupervervised az adatokat pigmentként használja az új művészet létrehozásához, de az adatok, amelyekből táplálkozik, mindig is művészet volt önmagában. Más szóval, a múzeumban élő művészet táplálja ezt a mellette élő mesterséges művészt, minden pillanatban valami újjal bővítve a múzeum gyűjteményét. A folyamat olyannyira elmebajos, hogy valójában egy új univerzum kapuját nyithatja meg.

(A FastCompany.com cikke alapján.)

megosztás:

olvastad már?
partnereink
hírlevél


Elolvastam és elfogadom az adatvédelmi nyilatkozatot!
keresés
népszerűek

Be-Va Chip hírlevél feliratkozás

Nem kaptál egy ideje hírlevelet? A GDPR miatt csak azoknak küldünk hírlevelet, akik megerősítették, hogy továbbra is szeretnének értesülni újdonságainkról, akciós termékeinkről és a legújabb IT és tech hírekről. Ha nem kaptál levelet mostanában, iratkozz fel újra:

Elolvastam és elfogadom az adatvédelmi nyilatkozatot!