AI van Microsoft zet tekst om in afbeeldingen
Je typt het, deze AI tekent het, pixel voor pixel. Microsoft heeft een AI ontwikkeld die tekst omzet in beeld, en die doet dat op bijzonder indrukwekkende wijze. Wanneer onderzoekers een korte beschrijving invoeren als ‘deze vogel is geel met zwart en heeft een lange snavel’ levert het vaak realistische beelden op. Naast vogels kan de AI ook landelijke en stedelijke scenes tekenen, van doodnormale afbeeldingen van grazende koeien tot absurde scenes als een drijvende schoolbus.
Neuraal netwerk
De kern van de AI is een Generative Adversarial Network (GAN). Dit neurale netwerk wordt ondersteund door twee machine-learning modellen, een om beeld te genereren op basis van en beschrijving (de generator) en een die aan de hand van een beschrijving het resultaat beoordeelt (de discriminator). De AI is ‘getraind’ door hem afbeeldingen met bijschriften te voeden.
Breed onderzoek
De AI is ontwikkeld door de Deep Learning Group bij Microsoft, als deel van een breed onderzoek over het grensgebied tussen waarneming en taalbegrip van kunstmatige intelligentie. Dat leverde eerder al andere technologie op, zoals de Captionbot die fotobijschriften maakt en een systeem dat vragen kon beantwoorden over individuele foto’s.
Beeld via Microsoft