Tutvustame peenhäälestusliidese täiustusi ja laiendame kohandatud mudelite programmi

Tutvustame peenhäälestusliidese täiustusi ja laiendame kohandatud mudelite programmi

Tutvustame peenhäälestusliidese täiustusi ja laiendame kohandatud mudelite programmi PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Abistav peenhäälestus

Möödunud aasta novembris DevDay'l me teatas kohandatud mudeli programm, mis on loodud konkreetse domeeni mudelite koolitamiseks ja optimeerimiseks koostöös spetsiaalse OpenAI teadlaste rühmaga. Sellest ajast alates oleme kohtunud kümnete klientidega, et hinnata nende kohandatud mudelite vajadusi, ja arendanud oma programmi, et jõudlust veelgi maksimeerida.

Täna kuulutame ametlikult välja oma abistatud peenhäälestuspakkumise, mis on osa kohandatud mudeliprogrammist. Abistatud peenhäälestus on koostöö meie tehniliste meeskondadega, et kasutada peenhäälestus-API-st kaugemale jäävaid tehnikaid, nagu täiendavad hüperparameetrid ja mitmesugused parameetritõhusad peenhäälestuse (PEFT) meetodid suuremas ulatuses. See on eriti kasulik organisatsioonidele, kes vajavad tuge tõhusate koolitusandmete torujuhtmete, hindamissüsteemide ning kohandatud parameetrite ja meetodite seadistamisel, et maksimeerida mudeli jõudlust nende kasutusjuhtumite või ülesande jaoks.

Näiteks SK TelecomLõuna-Koreas üle 30 miljoni abonendi teenindav telekommunikatsioonioperaator soovis kohandada mudelit, et olla telekommunikatsioonivaldkonna ekspert, keskendudes esmalt klienditeenindusele. Nad töötasid koos OpenAI-ga GPT-4 peenhäälestamiseks, et parandada selle toimivust telekommunikatsiooniga seotud koreakeelsetes vestlustes. Mitme nädala jooksul aitasid SKT ja OpenAI oluliselt parandada telekommunikatsiooni klienditeenindusülesannete jõudlust – vestluse kokkuvõtte kvaliteet 35%, kavatsuste tuvastamise täpsus 33% ja rahulolu skoor 3.6-lt 4.5-le (väljas). 5), kui võrrelda peenhäälestatud mudelit GPT-4-ga. 

Kohandatud väljaõppega mudel

Mõnel juhul peavad organisatsioonid koolitama nullist välja eesmärgipärase mudeli, mis mõistaks nende äri, tööstust või domeeni. Täielikult kohandatud väljaõppega mudelid lisavad uusi teadmisi konkreetsest valdkonnast, muutes mudeli koolitusprotsessi põhietappe, kasutades uudseid koolituse kesk- ja koolitusjärgseid tehnikaid. Organisatsioonidel, mis näevad edu täielikult kohandatud väljaõppega mudeliga, on sageli suur hulk omandiõigusega kaitstud andmeid – miljoneid näiteid või miljardeid märke –, mida nad soovivad kasutada mudelile uute teadmiste või keerukate ja ainulaadsete käitumiste õpetamiseks väga spetsiifiliste kasutusjuhtude jaoks. 

Näiteks Harvey, tehisintellektist pärit juriidiline tööriist advokaatidele, mis teeb koostööd OpenAI-ga luua kohtupraktika jaoks kohandatud koolitusega suur keelemudel. Kuigi alusmudelid olid arutlusvõimes tugevad, puudusid neil laialdased teadmised kohtuasjade ajaloost ja muud õigustööks vajalikud teadmised. Pärast kiire inseneri, RAG-i ja peenhäälestuse testimist töötas Harvey koos meie meeskonnaga, et lisada mudelile vajalik konteksti sügavus – võrdne 10 miljardi märgi väärtuses andmetega. Meie meeskond muutis mudeli koolitusprotsessi iga etappi, alates domeenipõhisest keskkoolitusest kuni koolitusjärgsete protsesside kohandamiseni ja ekspertide advokaatide tagasiside kaasamiseni. Saadud mudel saavutas faktiliste vastuste arvu 83% kasvu ja advokaadid eelistasid kohandatud mudeli väljundeid 97% ajast GPT-4 asemel.

Ajatempel:

Veel alates OpenAI