Interjú A kereskedelmi nagynyelvi modellek versenyképes programozási problémák megoldására való képessége jelentősen javítható, ha ügyes, gyors tervezéssel gondosan irányítják a folyamatokat.
Ennek demonstrálására az izraeli székhelyű Codium AI megépítette az AlphaCodiumot és felszabaduló a szoftver ebben a hónapban a GitHubon. Az AlphaCodium önmagában nem egy nagy nyelvi modell. Ehelyett ez egy olyan módszer, amely javítja a generatív mesterséges intelligencia eszközök, például a GPT-4 problémamegoldó képességeit azáltal, hogy Itamar Friedman vezérigazgató által „flow engineering”-nek nevezett módszert alkalmazza.
Először egy programozási kérdést táplálunk be a mögöttes nagy nyelvi modellbe, és felkérjük a probléma leírására és összefoglalására. Ezek az információk aztán útmutatást nyújtanak a probléma megoldásához. Az AlphaCodium meghatározza a dolgokat, például, hogy milyen bemeneteknek és kimeneteknek kell lenniük, amikor megoldást találnak ki. Mindez természetes nyelven van megadva.
A modell ezután elkezdi generálni a kódot, amely megfelel az imént leírt specifikációknak. Azok a programozási versenyek, amelyekben a versenyzőket specifikáció kódolására kérik fel, általában teszteket biztosítanak, amelyek megmutatják, hogy egy szkriptnek mit kell kiadnia egy adott bemenethez. Az AlphaCodium több ilyen tesztesetet generál, majd lefut a lehetséges megoldásokon, hogy ellenőrizze, hogy a kód megfelelően működik-e.
Ha egyik tesztben sem sikerül egyeznie a kimenetek egyikével sem, a modell különböző megoldásokat generál mindaddig, amíg az összes teszten átmennek, vagy meghiúsul. Hibák akkor fordulhatnak elő, ha a kódja nem fordítódik le, vagy egyszerűen hibás.
Az alábbi diagramon láthatja az áramlástervezési folyamat különböző lépéseit. Ez nagyrészt egy előfeldolgozási fázisra oszlik, ahol a rendszer természetes nyelven elemzi a problémát, és egy kóditerációs szakaszra, ahol lehetséges megoldásokat futtat le nyilvános és mesterséges intelligencia által generált tesztekkel szemben.
Az összes olyan átfogó lépés, amely az AlphaCodiumot a problémák megoldásához szükséges kód generálásához vezeti
„Nem fogjuk fel a problémát, hanem odamegyünk a modellhez, és azt mondjuk neki: „Hé, kérem, készítse el a végső megoldást” – mondta Friedman. A regisztráció. "Arra kérjük a modellt, hogy definiálja újra ezt a problémát pontokban." Az egyszerűsítés és a dolgok darabokra bontása megkönnyíti a modell számára, hogy később kódot generáljon az algoritmus különböző részeihez.
Az áramlástechnika lényegében egy olyan eljárás, amely jól meghatározott lépésekre bontva irányítja a modell problémamegoldási folyamatát. Ha arra kéri, hogy „a generált kódot apró alfüggvényekre ossza fel, értelmes nevekkel és funkciókkal”, azt mondják, kevesebb hibát okoz, és könnyebbé teszi a kód tesztelését és javítását.
"Alapvetően az időnk 95 százalékát töltöttük áramlástechnikával, és csak 5 százalékát azonnali tervezéssel, és nem változtattunk minden egyes lépésnél" - tette hozzá Friedman.
A Codium mérnökei modelljük teljesítményét a Google DeepMind által két évvel ezelőtt összeállított CodeForces adatkészlet ellenőrzési és tesztrészei során használt problémák százaival tesztelték. Azt állítják, hogy az AlphaCodium jobb volt a kódolási problémák megoldásában, mint a Google DeepMind AlphaCode és AlphaCode2 modelljei.
Az arXiv-ben közölt eredményekben papír [PDF], az AlphaCodium a kérdések 44 százalékát tudta helyesen megválaszolni, szemben az AlphaCode 24 százalékával, miközben mindössze öt megoldást generált az AlphaCode tíz választott megoldásához képest 107 érvényesítési problémára. Érdekes módon a különbség csökkent, amikor 165 tesztproblémáról volt szó, amelyeknél az AlphaCodium 29 százalékot oldott meg, szemben az AlphaCode 28 százalékával.
Az AlphaCode kiválasztja a tíz legígéretesebb megoldást a több tízezer vagy több százezer általa generált lehetséges szkript közül – így a futtatása számításigényes.
"Sokkal inkább a tesztelés teljes folyamatára összpontosítottunk" - mondta Friedman. „A [Google] nagyon sokat dolgozott a generáción. Több száz egyéb lehetőséget próbálnak létrehozni, mi pedig nagyon kevés megoldást generálunk, de nagyon jól teszteljük őket, hogy irányítsák a kód fejlesztését.”
Az AlphaCodium egy kicsivel jobb, mint a Google DeepMind legújabb AlphaCode2 modellje, amely 10,000 XNUMX-szer hatékonyabb, mint elődje, az AlphaCode - tette hozzá.
Hogyan viszonyul az AlphaCodium a többi csúcstechnológiás modellhez a pontosság és a hatékonyság tekintetében
Friedman azt mondta, biztos benne, hogy az AlphaCodium teljesítménye nem az adatszivárgásnak köszönhető, mivel az alapul szolgáló modellt ugyanazokon a problémákon betanították és tesztelték. Az AlphaCodiumot működtető GPT-4 verziót 2021 szeptemberéig az internetről lekapart szövegre képezték, míg a problémák, amelyeken a rendszerét tesztelték, a fent említett CodeForces adatkészletből származtak, amelyet jóval később adtak ki.
Egy jobb alma-alma összehasonlítás azonban, amely felméri az áramlástervezési folyamatot, azt vizsgálja, hogy a GPT-4 képes-e megoldani ugyanezeket a kérdéseket AlphaCodium alkalmazásával és anélkül. A sima régi GPT-4 csak a problémák 19 és 12 százalékát tudta helyesen megválaszolni az érvényesítési és tesztkészletekben, míg az AlphaCodium-motoros változat 44 és 29 százalékát.
Röviden, úgy tűnik, hogy egy gondos folyamat megvalósítása, amely további adatokat generál a kód létrehozásának útmutatása és a tesztelési folyamat javítása érdekében, hatékonyabb lehet, mintha egy nagy nyelvi modellt a semmiből próbálnánk betanítani.
A Codium nemrégiben kiadott egy új eszközt a Python fejlesztők támogatására, akik mostantól hívhatják az AlphaCodiumot, hogy közvetlenül megoldják egy kódolási problémát az IDE-ben. Játszhatsz vele itt. ®
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://go.theregister.com/feed/www.theregister.com/2024/02/19/codium_ai_interview/
- :van
- :is
- :nem
- :ahol
- $ UP
- 10
- 12
- 19
- 2021
- 24
- 28
- 29
- 7
- a
- képességek
- képesség
- Képes
- pontosság
- hozzáadott
- További
- ellen
- Augusztus
- AI
- algoritmus
- Igazítás
- Minden termék
- an
- elemzések
- és a
- válasz
- bármilyen
- Megjelenik
- Alkalmazása
- felmerülhet
- AS
- kérdez
- kér
- értékeli
- At
- alapján
- Alapvetően
- BE
- óta
- kezdődik
- elkezdődik
- lent
- Jobb
- Bit
- Javítottak
- Törés
- széles
- bogarak
- épült
- de
- by
- hívás
- kéri
- jött
- TUD
- óvatos
- gondosan
- esetek
- vezérigazgató
- változik
- ellenőrizze
- választott
- követelés
- CO
- kód
- Kódolás
- érkező
- kereskedelmi
- képest
- összehasonlítás
- Versenyek
- versenyképes
- összeállított
- számításilag
- magabiztos
- helyesen
- tudott
- dátum
- adatszivárgás
- adatkészlet
- DeepMind
- meghatározott
- Annak meghatározása,
- bizonyítani
- leírni
- leírt
- fejlesztők
- diagram
- DID
- különböző
- közvetlenül
- osszuk
- nem
- Don
- két
- minden
- könnyebb
- Hatékony
- hatékony
- Mérnöki
- Egész
- hibák
- várható
- nem sikerül
- Fed
- kevés
- kevesebb
- utolsó
- öt
- Rögzít
- áramlási
- összpontosított
- A
- ból ből
- funkcionalitás
- rés
- generál
- generált
- generál
- generáló
- generáció
- nemző
- Generatív AI
- GitHub
- adott
- Go
- útmutató
- Útmutatók
- irányadó
- he
- Hogyan
- azonban
- HTTPS
- Több száz
- if
- végrehajtási
- javul
- javulás
- javítja
- in
- információ
- bemenet
- bemenet
- helyette
- Internet
- bele
- Hát
- Izrael
- IT
- ismétlés
- ITS
- jpg
- éppen
- Címke
- nyelv
- nagy
- nagymértékben
- a későbbiekben
- legutolsó
- vezetékek
- szivárgás
- mint
- keres
- KÉSZÍT
- Gyártás
- kezelése
- Mérkőzés
- jelentőségteljes
- módszer
- modell
- modellek
- Hónap
- több
- hatékonyabb
- a legtöbb
- sok
- nevek
- Természetes
- Új
- Most
- of
- Régi
- on
- csak
- Opciók
- or
- Más
- mi
- ki
- teljesítmény
- kimenetek
- alkatrészek
- elhalad
- mert
- százalék
- teljesítmény
- fázis
- csővezeték
- Egyszerű
- Plató
- Platón adatintelligencia
- PlatoData
- játszani
- kérem
- pont
- lehetséges
- Bekapcsolom
- előző
- Probléma
- problémamegoldás
- problémák
- eljárás
- folyamat
- Folyamatok
- Programozás
- biztató
- utasításokat
- ad
- nyilvános
- Piton
- kérdés
- Kérdések
- RE
- tényleg
- nemrég
- újradefiniál
- felszabaduló
- Számolt
- illetőleg
- Eredmények
- futás
- fut
- s
- Mondott
- azonos
- kaparni
- forgatókönyv
- szkriptek
- lát
- szeptember
- készlet
- Szettek
- rövid
- kellene
- mutató
- jelentősen
- egyszerűsítése
- kicsi
- So
- szoftver
- megoldások
- Megoldások
- SOLVE
- Megoldása
- specifikációk
- meghatározott
- költött
- osztott
- Színpad
- csúcs-
- Lépés
- Lépései
- összegez
- támogatás
- rendszer
- Vesz
- meghozott
- mondd
- tíz
- tíz
- feltételek
- teszt
- kipróbált
- Tesztelés
- tesztek
- szöveg
- mint
- hogy
- A
- azok
- Őket
- akkor
- Ezek
- ők
- dolgok
- ezt
- azok
- bár?
- ezer
- Keresztül
- idő
- nak nek
- mondta
- szerszám
- szerszámok
- Vonat
- kiképzett
- megpróbál
- próbál
- kettő
- jellemzően
- mögöttes
- -ig
- használt
- segítségével
- érvényesítés
- Változat
- Igazolás
- változat
- nagyon
- volt
- we
- JÓL
- jól definiált
- voltak
- Mit
- amikor
- mivel
- míg
- WHO
- val vel
- nélkül
- Munka
- dolgozó
- Rossz
- év
- te
- zephyrnet