AI van Microsoft zet tekst om in afbeeldingen

za, 24/03/2018 - 15:05

Door: Redactie WINMAG Pro

AI maakt laatste jaren grote sprongen. Ook Microsoft investeert flink in deze technologie bij voorbeeld met een AI die afbeeldingen kan samenstellen op basis van niet meer dan een korte beschrijving.

Je typt het, deze AI tekent het, pixel voor pixel. Microsoft heeft een AI ontwikkeld die tekst omzet in beeld, en die doet dat op bijzonder indrukwekkende wijze. Wanneer onderzoekers een korte beschrijving invoeren als ‘deze vogel is geel met zwart en heeft een lange snavel’ levert het vaak realistische beelden op. Naast vogels kan de AI ook landelijke en stedelijke scenes tekenen, van doodnormale afbeeldingen van grazende koeien tot absurde scenes als een drijvende schoolbus.

Neuraal netwerk

De kern van de AI is een Generative Adversarial Network (GAN). Dit neurale netwerk wordt ondersteund door twee machine-learning modellen, een om beeld te genereren op basis van en beschrijving (de generator) en een die aan de hand van een beschrijving het resultaat beoordeelt (de discriminator). De AI is ‘getraind’ door hem afbeeldingen met bijschriften te voeden.

Breed onderzoek

De AI is ontwikkeld door de Deep Learning Group bij Microsoft, als deel van een breed onderzoek over het grensgebied tussen waarneming en taalbegrip van kunstmatige intelligentie. Dat leverde eerder al andere technologie op, zoals de Captionbot die fotobijschriften maakt en een systeem dat vragen kon beantwoorden over individuele foto’s.

Beeld via Microsoft