De grote stappen van kunstmatige intelligentie

Het is makkelijk om een beetje badinerend te doen over kunstmatige intelligentie. Elke fotobewerkingssoftware, Lightroom, Luminar, ON1, Google Foto’s of Apple Foto’s werkt met die kunstmatige intelligentie. Het is ook makkelijk om te zeggen: dat doe ik zelf wel even sneller, zoals ik laatst dacht bij de luchtverbeteraar van Luminar. Toch zijn de stappen die op dit gebied worden gezet heel erg groot. Kunstmatige manipulatie – nep-video’s, nep-foto’s – kunstmatige foto’s, het kan allemaal. Welk landschap wil je: Eentje met mist of met een zonsopgang? Of met allebei? Content Aware Fill in Photoshop is niets vergeleken met de mogelijkheden van nu en straks. Ik las erover in een razend interessant artikel in The New Yorker.

Fotografie? Figuratieve schilderkunst!

De schrijver van The Online Photographer, Mike Johnston, wees me in een blogpost op een artikel in The New Yorker: In the age of A.I., is seeing still believing?. In de blogpost over dat artikel is zijn conclusie: ‘De veranderingen (op het gebied van digital imaging. H.F.) zijn veel diepgaander dan alleen de manier waarop we een lensafbeelding maken om een ​​foto te maken. Echt, D.I. is dichter bij figuratieve schilderkunst dan bij fotografie.’ Als het artikel in de New Yorker leest, vraag je je bijna af waarom je nog een foto zou willen maken. In de – nabije – toekomst zeg je tegen je computer: Hee Google/Alexa/Siri/Cortana: maak voor mij een foto van een rode zonsopgang, beetje mistig met een molen. Een beetje Hollands landschap. En hup!, daar staat het beeld op je scherm.

Kunstmatige intelligentie
Een zonsopkomst, met mist en molen (een echte foto).

Een nummerbord ontcijferd

Het artikel in The New Yorker begint met het verhaal over een moord van een paar jaar geleden. Een beveiligingscamera had een opname gemaakt van de auto waarin het slachtoffer werd afgevoerd. De kwaliteit van de camera was erg slecht, het nummerbord van de auto was een waas van pixels en niet te ontcijferen. Hany Farid, een fotoforensisch expert ging samen met zijn studenten met de magere informatie aan de gang. Door eerst een paar honderd nummerborden te fotograferen, daar vervolgens tientallen miljoenen verschillende andere nummerborden mee te genereren en die te voeren aan een gesimuleerde beveiligingscamera waren er drie tekens van het nummerbord te ontcijferen. De moordzaak komt waarschijnlijk tot een oplossing. Dat is een van de vele voorbeelden in dit artikel.

Overtuigende, synthetische gebouwen

Hier een voorbeeld van technologie die veel verder gaat dan Content Aware Fill. Een citaat uit het artikel: ‘Op zijn computer liet Efros (Alexei A. Efros, een in Rusland geboren professor die nu lesgeeft aan de universiteit van Californië. H.F.) me een foto zien van een brug in Lyon. Een groot deel van de rivieroever, waar mogelijk auto’s, bomen en mensen in zaten, was verwijderd. In 2007 hielp hij met het bedenken van een systeem dat door Flickr snuffelt voor vergelijkbare foto’s, waarvan velen tijdens een vakantie worden genomen, en ze samplen. Hij klikte en de lege ruimte werd opgevuld met overtuigende, synthetische gebouwen en groen. “Waarschijnlijk vond het foto’s van een andere stad,” zei Efros. “Maar weet je, we zijn saai. We bouwen altijd hetzelfde soort gebouwen op dezelfde soorten rivieroevers. En dan, als we over bruggen lopen, zeggen we allemaal, samen met duizend andere mensen: ‘Hé, dit ziet er goed uit, laat me een foto maken’, en we zetten allemaal de horizon op dezelfde plaats.’

Waarheidsgetrouwe landschappen

Daar houdt het echt niet op. De computer kan zelf ook landschappen maken. Nog een voorbeeld uit het artikel over twee neurale netwerken die elkaar trainen in het maken van een landschap. Het ene neurale netwerk maakt het landschap, het andere netwerk geeft commentaar op het landschap. Uit het artikel: ‘Op het scherm toonde Zhang (Richard Zhang, een recent afgestudeerde leerling van Efros.H.F.) me een uitgebreid stroomdiagram waarin neurale netwerken andere netwerken trainen – een regeling die onderzoekers een ‘generatief adversariaal netwerk’ of ‘gan’ noemen. Hij wees naar een van de netwerken: de ‘generator’, geladen met het synthetiseren, min of meer willekeurig, van nieuwe versies van het landschap. Een tweede netwerk, de ‘discriminator’, zou de waarheidsgetrouwheid van die beelden beoordelen door ze te vergelijken met de ‘grondwaarheid’ van echte landschapsfoto’s. Het eerste netwerk riffte; de tweede gedisciplineerde de eerste. Zhang’s scherm toonde het systeem in actie. Een afbeelding van een klein stadje in een vallei, op een meer, misschien in Zwitserland, verscheen; het was nacht en het uitzicht werd verduisterd door de duisternis. Toen, beeld voor beeld, begonnen we “de latente ruimte te doorkruisen”. De zon kwam op; wolken verschenen; de bladeren draaiden; regen neergedaald. De maan scheen; mist opgerold; een storm verzamelde zich; sneeuw viel. De zon kwam terug. De bomen waren groen, bruin, goud, rood, wit en kaal; de lucht was grijs, roze, zwart, wit en blauw. “Het vindt de bronnen van patronen van variatie,” zei Zhang. We keken hoe de textuur van het weer zich ontvouwde.’

De vingerafdruk van je sensor

En zo gaat het artikel door. Hoe herken je nep-foto’s en nep-video’s? Ik las dat elke camerasensor een eigen specifiek patroon heeft, dat uit een foto te halen is. Zo kun je – net als bij een vingerafdruk – aanwijzen met welke camera een foto gemaakt is. Niet alleen het merk maar een specifieke camera. Jouw camera. Ik zou zeggen, als je wilt weten welke kant fotografie opgaat: lees dit artikel. Nog een ding. De citaten die ik uit het Engelse artikel heb opgenomen zijn automatisch vertaald door Google. Ook op het gebied van vertalen worden grote stappen gezet. Er zitten misschien wat rare dingen in (riffte?), maar zo komen ze rechtstreeks uit Google Translate. Als je niet graag in het Engels leest: plak het hele artikel in Google Translate!

De mogelijkheden van kunstmatige intelligentie worden op dit moment voornamelijk toegepast in de software van de smartphones. Portretmodus, fake-bokeh, allemaal mogelijkheden dankzij kunstmatige intelligentie. Wil je meer lezen over die nieuwe, fotografische mogelijkheden van je smartphone, dan is Beter fotograferen met je smartphone misschien iets voor jou.

Geef een reactie

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.