Databricks lanceert DBRX, een open source LLM dat een nieuwe standaard voor efficiëntie neerzet
Data- en AI-bedrijf Databricks kondigt vandaag de lancering aan van DBRX, een large language model (LLM) voor algemeen gebruik dat alle andere bestaande open source-modellen overtreft in AI-benchmarktesten. DBRX maakt voor iedere organisatie de training en fine-tuning van eigen, hoogwaardige LLM’s mogelijk, zodat ze niet meer afhankelijk hoeven te zijn van een handjevol closed-source modellen. DBRX is vanaf vandaag wereldwijd beschikbaar voor organisaties die op kostenefficiënte wijze hun eigen LLM’s willen bouwen, trainen en gebruiken.
“Het is bij Databricks altijd al onze visie geweest om data en AI te democratiseren, door data intelligence voor iedere organisatie mogelijk te maken. We helpen om data te analyseren en in te zetten om eigen AI-systemen te bouwen. DBRX is het resultaat van die visie”, zegt Ali Ghodsi, medeoprichter en CEO van Databricks. “Er zijn drie redenen waarom we ontzettend enthousiast zijn over DBRX: het overtreft open source-modellen in state-of-the-art benchmarks; het verslaat GPT-3.5 in de meeste benchmarks, wat de huidige trend kan versnellen om propriëtaire modellen door open source modellen te vervangen; en het maakt tot slot gebruik van een ‘mixture-of-experts’-architectuur, waardoor DBRX zeer kosteneffectief een hoog aantal tokens per seconde verwerkt. Al met al zet DBRX een nieuwe standaard neer voor open-source LLM’s.”
DBRX overtreft open source-modellen in AI-benchmarks
DBRX presteert in AI-benchmarks beter dan bestaande open source-LLM’s als Llama 2 70B en Mixtral-8x7B, onder meer op gebied van taalbegrip, wiskunde en logica.
DBRX presteert ook beter dan GPT-3.5 op relevante benchmarks.
DBRX overtreft GPT 3.5 in taalbegrip (MMLU), programmeren (HumanEval) en wiskunde (GSM8K).
Lees het technische blog van Mosaic Research voor een gedetailleerde modelevaluatie en prestatiebenchmarks, en om te zien hoe DBRX concurrerend is met de kwaliteit van GPT-4 voor interne use cases zoals SQL.
DBRX legt de lat hoger voor efficiënte open source-LLM’s
DBRX is ontwikkeld door Mosaic AI en getraind op NVIDIA DGX Cloud. Databricks heeft DBRX geoptimaliseerd voor efficiëntie, met een mixture-of-experts-architectuur op basis van het MegaBlocks open source-project. Het resulterende model heeft toonaangevende prestaties en is tot twee keer zo efficiënt in compute-gebruik als andere grote LLM’s.
DBRX zet daarmee een nieuwe standaard neer voor open source modellen, waarmee aanpasbare en transparante generatieve AI mogelijk wordt voor alle organisaties. Uit recent onderzoek van Andreessen Horowitz blijkt dat bijna 60% van AI-leiders oren hebben naar meer open source-gebruik, of erop willen overstappen wanneer gefinetunede open source-modellen de prestaties evenaren van closed source-modellen. Er wordt vanaf dit jaar dan ook een significante beweging van closed source naar open source verwacht. Databricks gelooft dat DBRX deze trend zal versnellen.
Organisaties profiteren van hoogwaardige DBRX-mogelijkheden op het Data Intelligence Platform
In combinatie met de tooling van Databricks Mosaic AI helpt DBRX klanten om snel generatieve AI-toepassingen van hoogwaardige productiekwaliteit te bouwen en te implementeren die veilig, nauwkeurig en beheersbaar zijn – zonder controle over eigen data en intellectueel eigendom te verliezen. Klanten profiteren daarnaast van ingebouwde mogelijkheden voor databeheer, governance, dataherkomst en monitoring op het Databricks Data Intelligence Platform.
Reacties op DBRX:
"Bij Accenture lopen we voorop in de implementatie van generatieve AI-oplossingen en gebruiken we geavanceerde technieken om open source-modellen aan te passen aan de unieke behoeften van onze klanten met onze foundation model customization services", zegt Lan Guan, Chief AI Officer bij Accenture. "De beschikbaarheid van geavanceerdere open source-modellen kan nieuwe mogelijkheden bieden om positieve resultaten te behalen voor onze klanten in ieder aspect van de organisatie."
“AI-ontwikkeling staat op een belangrijk kantelpunt. Maar een brede community van onderzoekers, engineers en technologen is nodig om verdere, betekenisvolle innovatie te stimuleren. Daarom is ons team bij AI2 gewijd aan het bevorderen van de wetenschap van generatieve AI met behulp van open modelontwikkeling. We zijn dan ook enthousiast om nieuwe modellen zoals DBRX te zien verschijnen, die meer transparantie, toegankelijkheid en samenwerking bevorderen”, zegt Dirk Groeneveld, Principal Software Engineer bij Allen Institute for Artificial Intelligence (AI2).
“Databricks is een cruciale partner van Nasdaq voor enkele van onze meest belangrijke datasystemen. Ze blijven aan de voorhoede van de branche wat betreft databeheer en de inzet van AI en we zijn enthousiast over de lancering van DBRX. De combinatie van sterke modelprestaties en kostenefficiëntie is precies het soort innovatie waar we naar op zoek zijn wanneer we ons gebruik van generatieve AI bij Nasdaq uitbreiden”, aldus Mike O'Rourke, hoofd van AI & Data Services bij NASDAQ.
“Als een van de grootste tech-investeerders ter wereld erkent Prosus de transformerende kracht van generatieve AI. We kijken uit naar de lancering van DBRX en het potentieel om meer bedrijven de mogelijkheid te geven veilige, portable en uiterst krachtige, op maat gemaakte modellen te bouwen”, zegt Paul Boor, Senior Director Data Science bij Prosus Group.
“We hebben nauw samengewerkt met het Mosaic AI-team bij Databricks om aangepaste LLM's te bouwen die brede toegang tot coderen bieden voor de volgende generatie softwareontwikkelaars. Met de lancering van het krachtige DBRX open source-model, verwachten we de versnelde ingebruikname van veilige generatieve AI-modellen die zijn aangepast op basis van de eigen data van een organisatie", zegt Michele Catasta, VP of AI bij Replit.
“Zoom gebruikt de kracht van LLM's om nieuwe platformfeatures mogelijk te maken, zoals onze AI Companion. We kijken ernaar uit de toegevoegde waarde van DBRX te evalueren in snellere en kosteneffectievere training en werking van aangepaste generatieve AI-modellen voor onze belangrijkste use cases”, aldus Chenguang Zhu, hoofd van GenAI Science bij Zoom.
Beschikbaarheid
DBRX is vrij beschikbaar op GitHub en Hugging Face voor onderzoek en commercieel gebruik. Vanaf vandaag kunnen organisaties ook op het Databricks Platform met DBRX werken, gebruikmaken van de long context-mogelijkheden in retrieval augmented generation (RAG)-systemen en eigen DBRX-modellen bouwen op basis van hun eigen data. DBRX is daarnaast beschikbaar op AWS en Google Cloud en op Microsoft Azure via Azure Databricks.
DBRX wordt naar verwachting ook beschikbaar via de NVIDIA API Catalog met ondersteuning van de NVIDIA NIM inferentie-microservice.