Introduktion af forbedringer til finjusterings-API'en og udvidelse af vores tilpassede modelprogram

Introduktion af forbedringer til finjusterings-API'en og udvidelse af vores tilpassede modelprogram

Introduktion af forbedringer til finjusterings-API'en og udvidelse af vores brugerdefinerede modelprogram PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Assisteret finjustering

På DevDay i november sidste år havde vi annoncerede et Custom Model-program designet til at træne og optimere modeller til et specifikt domæne i samarbejde med en dedikeret gruppe af OpenAI-forskere. Siden da har vi mødtes med snesevis af kunder for at vurdere deres tilpassede modelbehov og udviklet vores program for yderligere at maksimere ydeevnen.

I dag annoncerer vi formelt vores tilbud om assisteret finjustering som en del af Custom Model-programmet. Assisteret finjustering er et samarbejde med vores tekniske teams for at udnytte teknikker ud over finjusterings-API'en, såsom yderligere hyperparametre og forskellige parametereffektive finjusteringsmetoder (PEFT) i større skala. Det er især nyttigt for organisationer, der har brug for support til at opsætte effektive træningsdatapipelines, evalueringssystemer og skræddersyede parametre og metoder for at maksimere modelydelsen til deres brugssag eller opgave.

For eksempel: SK Telecom, en telekommunikationsoperatør, der betjener over 30 millioner abonnenter i Sydkorea, ønskede at tilpasse en model til at være ekspert inden for telekommunikationsdomænet med et indledende fokus på kundeservice. De arbejdede sammen med OpenAI for at finjustere GPT-4 for at forbedre dens ydeevne i telekommunikationsrelaterede samtaler på det koreanske sprog. I løbet af flere uger har SKT og OpenAI opnået en meningsfuld præstationsforbedring inden for telekommunikationskundeserviceopgaver - en stigning på 35 % i kvaliteten af ​​samtaleopsummering, en stigning på 33 % i hensigtsgenkendelsesnøjagtighed og en stigning i tilfredshedsscore fra 3.6 til 4.5 (udenfor). af 5), når man sammenligner den finjusterede model med GPT-4. 

Specialuddannet model

I nogle tilfælde skal organisationer træne en specialbygget model fra bunden, der forstår deres forretning, branche eller domæne. Fuldt skræddersyede modeller tilfører ny viden fra et specifikt domæne ved at ændre nøgletrin i modeltræningsprocessen ved hjælp af nye teknikker midt i træningen og efter træningen. Organisationer, der ser succes med en fuldt skræddersyet model, har ofte store mængder proprietære data – millioner af eksempler eller milliarder af tokens – som de ønsker at bruge til at lære modellen ny viden eller kompleks, unik adfærd til meget specifikke brugssager. 

For eksempel: Harvey, et AI-native juridiske værktøj til advokater, samarbejdet med OpenAI til skabe en specialuddannet storsprogmodel for retspraksis. Mens grundlagsmodeller var stærke til at ræsonnere, manglede de den omfattende viden om juridisk sagshistorie og anden viden, der kræves til juridisk arbejde. Efter at have testet prompt engineering, RAG og finjustering, arbejdede Harvey sammen med vores team for at tilføje den nødvendige dybde af kontekst til modellen – svarende til 10 milliarder tokens værdi af data. Vores team ændrede hvert trin i modeltræningsprocessen, fra domænespecifik midtvejs til tilpasning af efteruddannelsesprocesser og inkorporering af ekspertfeedback fra advokater. Den resulterende model opnåede en stigning på 83 % i faktuelle svar, og advokater foretrak den tilpassede models output 97 % af tiden frem for GPT-4.

Tidsstempel:

Mere fra OpenAI