Industry Wire

Geplaatst door AWS

TII traint zijn ultramoderne large language model, Falcon 40B, op AWS

Het #1 model op het Hugging Face Open LLM Leaderboard is nu beschikbaar voor klanten via Amazon SageMaker Jumpstart waardoor het makkelijker wordt om geavanceerde generatieve AI-applicaties te bouwen met behulp van het best presterende open source-model

AMSTERDAM, 7 juni 2023 – Amazon Web Services (AWS) kondigt vandaag aan dat het Technology Innovation Institute (TII), een toonaangevend wereldwijd wetenschappelijk onderzoekscentrum in Abu Dhabi, zijn best presterende, open source Falcon 40B-model op AWS traint. Falcon 40B is een large language model (LLM) met 40 miljard parameters, beschikbaar onder de Apache 2.0-licentie en nummer één in Hugging Face’s Open LLM Leaderboard, dat LLM’s volgt, rangschikt en evalueert in meerdere benchmarks om de best presterende modellen te identificeren. Klanten kunnen Falcon 40B nu implementeren vanuit Amazon SageMaker JumpStart, een machine learning (ML) hub die vooraf getrainde modellen biedt, waardoor klanten toegang krijgen tot Falcon 40B’s enorme nauwkeurigheid en toonaangevende prestaties, zonder hun eigen model te hoeven bouwen.

LLM’s zijn een subset van ML-modellen gericht op taal, die een breed scala aan generatieve AI-toepassingen – van tekstverwerking en -samenvatting tot het beantwoorden van vragen – kunnen aandrijven. Deze LLM’s hebben het potentieel om industrieën te transformeren. Maar, het proces van bouwen, trainen en implementeren van een LLM kan weken, zo niet maanden duren en tientallen miljoenen euro’s kosten, waardoor ze buiten het bereik van veel bedrijven blijven. Om tijdens het ontwikkelingsproces betere prestaties én kostenbesparingen te realiseren, vertrouwen talloze klanten, waaronder Stability AI, AI 21 Labs, Hugging Face en LG AI op Amazon SageMaker, om hun LLM’s te bouwen, trainen en implementeren.

Daarom is ook TII aan de slag met Amazon SageMaker, om zijn Falcon 40B-model te bouwen. Omdat SageMaker een volledig beheerde service is, heeft TII zich kunnen richten op het ontwikkelen van aangepaste trainingsmechanismen en optimalisaties in plaats van het beheren van de ML-infrastructuur. Om de trainingskosten te minimaliseren en de time-to-market te verkorten, heeft TII verschillende optimalisaties doorgevoerd, waaronder het schrijven van een aangepaste matrixvermenigvuldiging om de trainingssnelheid te verhogen. Tijdens het trainingsproces werkte AWS nauw samen met TII om de veerkracht van het gebruik van SageMaker te vergroten, en er zeker van te zijn dat de training soepel verliep door onderbrekingen die de aandacht van de ontwikkelaar vereisten te verminderen.

TII heeft in mei 2023 zijn Falcon 40B-model uitgebracht onder de Apache 2.0-licentie. Sinds de release heeft de Falcon 40B het beter gedaan dan vergelijkbare hedendaagse modellen in verschillende benchmarks, en daarmee uitzonderlijke prestaties laten zien zonder gespecialiseerde afstemming. Om het makkelijker te maken om toegang te krijgen tot Falcon 40B, heeft AWS dit ultramoderne model ook beschikbaar gesteld aan klanten via Amazon SageMaker Jumpstart. Nu kunnen klanten van elke omvang en in elke branche snel en eenvoudig hun eigen Falcon 40B-model implementeren en aanpassen aan hun specifieke behoeften voor toepassingen zoals vertaling, het beantwoorden van vragen, het samenvatten van informatie of het identificeren van afbeeldingen.

Om klanten te helpen snel aan de slag te gaan met ML, kunnen zij de Falcon-modellen eenvoudig implementeren en gebruiken in SageMaker Studio of programmatisch via de SageMaker Python SDK. Falcon 40B is vandaag algemeen verkrijgbaar via Amazon SageMaker JumpStart in US East (Ohio), US East (N. Virginia), US West (Oregon), Asia Pacific (Sydney), Asia Pacific (Seoul), Europa (Londen) en Canada (Centraal), en binnenkort beschikbaar in andere AWS-regio’s.

Dit artikel is een ingezonden bericht en valt buiten de verantwoordelijkheid van de redactie.

Deel dit bericht