görüşme Ticari büyük dil modellerinin rekabetçi programlama sorunlarını çözme yetenekleri, süreçlerinin akıllı ve hızlı mühendislik yoluyla dikkatli bir şekilde yönlendirilmesiyle önemli ölçüde artırılabilir.
Bunu göstermek için İsrail merkezli Codium AI, AlphaCodium'u inşa etti ve serbest Bu ay GitHub'daki yazılım. AlphaCodium başlı başına büyük bir dil modeli değildir. Bunun yerine, CEO Itamar Friedman'ın "akış mühendisliği" dediği şeyi kullanarak GPT-4 gibi üretken yapay zeka araçlarının problem çözme yeteneklerini geliştiren bir yöntemdir.
İlk olarak, temeldeki geniş dil modeline bir programlama sorusu beslenir ve sorunu tanımlaması ve özetlemesi istenir. Bu bilgi daha sonra sorunu çözmeye nasıl başlaması gerektiğine rehberlik eder. AlphaCodium, bir çözüm bulurken girdilerin ve çıktıların ne olması gerektiği gibi şeyleri tanımlar. Bütün bunlar doğal dilde belirtilmiştir.
Model daha sonra az önce tanımladığı spesifikasyonlara uygun kod üretmeye başlar. Yarışmacılardan spesifikasyona göre kod yazmalarını isteyen programlama yarışmaları, genellikle bir komut dosyasının belirli bir girdi için ne çıktı vermesi gerektiğini gösteren testler sağlar. AlphaCodium bu test senaryolarından daha fazlasını oluşturur ve ardından kodun beklendiği gibi çalışıp çalışmadığını kontrol etmek için olası çözümleri çalıştırır.
Model, testlerden herhangi birinde tanımlanan çıktılardan herhangi birini eşleştirmeyi başaramazsa, tüm testleri geçinceye veya başarısız olana kadar farklı çözümler üretir. Kodu derlenmediğinde veya yanlış olduğunda hatalar ortaya çıkabilir.
Aşağıdaki şemada akış mühendisliği sürecindeki farklı adımları görebilirsiniz. Büyük ölçüde sistemin sorunu doğal dilde analiz ettiği bir ön işleme aşamasına ve olası çözümleri genel ve yapay zeka tarafından oluşturulan testlere karşı çalıştırdığı bir kod yineleme aşamasına bölünmüştür.
Friedman, "Sorunu alıp modele gidip ona 'Hey, lütfen nihai çözümü üret' demiyoruz" dedi. Kayıt. "Modelden lütfen bu sorunu maddeler halinde yeniden tanımlamasını istiyoruz." Bunu basitleştirmek ve parçaları parçalara ayırmak, modelin daha sonra algoritmanın farklı bölümleri için kod üretmesini kolaylaştırır.
Temel olarak akış mühendisliği, modelin problem çözme sürecini iyi tanımlanmış adımlara bölerek yönlendiren bir prosedürdür. Bize "oluşturulan kodu anlamlı adlar ve işlevlerle küçük alt işlevlere bölmesi" yönünde yönlendirmenin daha az hataya yol açtığı ve kodun test edilmesini ve düzeltilmesini kolaylaştırdığı söylendi.
Friedman, "Temel olarak zamanımızın yüzde 95'ini akış mühendisliğine ve yalnızca yüzde 5'ini hızlı mühendisliğe harcadık ve her [adım] için istemleri değiştirmedik" diye ekledi.
Codium mühendisleri, modellerinin performansını, iki yıl önce Google DeepMind tarafından derlenen CodeForces veri setinin doğrulama ve test kısımlarında kullanılan yüzlerce problem üzerinde test etti. AlphaCodium'un kodlama sorunlarını çözmede Google DeepMind'ın AlphaCode ve AlphaCode2 modellerinden daha iyi olduğunu iddia ediyorlar.
arXiv'de bildirilen sonuçlarda kâğıt [PDF], AlphaCodium, AlphaCode'un yüzde 44'üne kıyasla soruların yüzde 24'ünü doğru yanıtlamayı başardı ve AlphaCode'un 107 doğrulama sorunu için seçilen on çözümüne kıyasla yalnızca beş çözüm üretti. İlginç bir şekilde, AlphaCode'un yüzde 165'ine kıyasla AlphaCodium'un yüzde 29'unu çözdüğü 28 test problemine gelindiğinde aradaki fark daraldı.
AlphaCode, ürettiği onbinlerce veya yüzbinlerce olası komut dosyası arasından en umut verici on çözümü seçiyor ve bu da onu çalıştırmayı hesaplama açısından yoğun hale getiriyor.
Friedman, "Test akışının tamamına çok daha fazla odaklandık" dedi. “[Google] için nesil üzerinde çok fazla çalışma yaptılar. Onlar yüzlerce başka seçenek üretmeye çalışıyorlar ve biz çok az çözüm üretiyoruz, ancak kodun geliştirilmesine rehberlik etmek için bunları gerçekten iyi test ediyoruz."
AlphaCodium'un Google DeepMind'ın en yeni AlphaCode2 modelinden biraz daha iyi olduğunu ve önceki AlphaCode'dan 10,000 kat daha verimli olduğunu ekledi.
Friedman, AlphaCodium'un performansının, temel modelin aynı sorunlar üzerinde eğitilip test edildiği veri sızıntısından kaynaklanmadığından emin olduğunu söyledi. AlphaCodium'u çalıştıran GPT-4 sürümü, Eylül 2021'e kadar internetten alınan metinler üzerinde eğitilirken, sistemini test ettiği sorunlar, daha sonra yayınlanan yukarıda belirtilen CodeForces veri setinden alınmıştı.
Ancak akış mühendisliği sürecini değerlendiren daha iyi bir elma-elma karşılaştırması, GPT-4'ün aynı soruları AlphaCodium uygulayarak ve uygulamadan çözme becerisine bakmaktır. Sıradan eski GPT-4, doğrulama ve test setlerindeki sorunların sırasıyla yalnızca yüzde 19 ve 12'sine doğru yanıt verebilirken, AlphaCodium destekli varyantın yüzde 44 ve 29'u doğruydu.
Kısacası, kodun nasıl oluşturulduğuna rehberlik edecek ve test sürecini iyileştirecek ek veriler üreten dikkatli bir işlem hattının uygulanması, büyük bir dil modelini sıfırdan eğitmeye çalışmaktan daha etkili olabilir gibi görünüyor.
Codium yakın zamanda, IDE'lerindeki bir kodlama sorununu doğrudan çözmek için AlphaCodium'u arayabilen Python geliştiricilerini desteklemek için yeni bir araç yayınladı. Onunla oynayabilirsin Burada. ®
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://go.theregister.com/feed/www.theregister.com/2024/02/19/codium_ai_interview/
- :vardır
- :dır-dir
- :olumsuzluk
- :Neresi
- $UP
- 10
- 12
- 19
- 2021
- 24
- 28
- 29
- 7
- a
- yeteneklerini
- kabiliyet
- Yapabilmek
- doğruluk
- katma
- Ek
- karşı
- önce
- AI
- algoritma
- Hizalar
- Türkiye
- an
- analizler
- ve
- cevap
- herhangi
- belirir
- Uygulanması
- ortaya
- AS
- sormak
- soran
- değerlendirilirler
- At
- merkezli
- temel olarak
- BE
- olmuştur
- başlamak
- başlıyor
- altında
- Daha iyi
- Bit
- arttırdı
- Kırma
- geniş
- böcek
- yapılı
- fakat
- by
- çağrı
- aramalar
- geldi
- CAN
- dikkatli
- dikkatlice
- durumlarda
- ceo
- değişiklik
- Kontrol
- seçilmiş
- iddia
- CO
- kod
- kodlama
- gelecek
- ticari
- karşılaştırıldığında
- karşılaştırma
- Yarışmalar
- rekabet
- derlenmiş
- hesaplamalı olarak
- emin
- doğru
- olabilir
- veri
- veri sızıntısı
- veri seti
- DeepMind
- tanımlı
- tanımlar
- göstermek
- tanımlamak
- tarif edilen
- geliştiriciler
- diyagram
- DID
- farklı
- direkt olarak
- bölmek
- gelmez
- don
- gereken
- her
- kolay
- Etkili
- verimli
- Mühendislik
- Tüm
- Hatalar
- beklenen
- başarısız
- Fed
- az
- daha az
- son
- beş
- sabit
- akış
- odaklanmış
- İçin
- itibaren
- işlevsellik
- boşluk
- oluşturmak
- oluşturulan
- üretir
- üreten
- nesil
- üretken
- üretken yapay zeka
- GitHub
- verilmiş
- Go
- rehberlik
- Rehberler
- rehberlik
- he
- Ne kadar
- Ancak
- HTTPS
- Yüzlerce
- if
- uygulanması
- iyileştirmek
- iyileşme
- geliştirir
- in
- bilgi
- giriş
- girişler
- yerine
- Internet
- içine
- degil
- Israil
- IT
- tekrarlama
- ONUN
- jpg
- sadece
- etiket
- dil
- büyük
- çok
- sonra
- son
- İlanlar
- kaçak
- sevmek
- bakıyor
- YAPAR
- Yapımı
- yönetmek
- Maç
- anlamlı
- yöntem
- model
- modelleri
- Ay
- Daha
- daha verimli
- çoğu
- çok
- isimleri
- Doğal (Madenden)
- yeni
- şimdi
- of
- Eski
- on
- bir tek
- Opsiyonlar
- or
- Diğer
- bizim
- dışarı
- çıktı
- çıkışlar
- parçalar
- geçmek
- başına
- yüzde
- performans
- faz
- boru hattı
- Sade
- Platon
- Plato Veri Zekası
- PlatoVeri
- OYNA
- Lütfen
- noktaları
- mümkün
- Açılması
- öncel
- Sorun
- problem çözme
- sorunlar
- prosedür
- süreç
- Süreçler
- Programlama
- umut verici
- istemleri
- sağlamak
- halka açık
- Python
- soru
- Sorular
- RE
- Gerçekten mi
- geçenlerde
- yeniden tanımlamak
- serbest
- Bildirilen
- sırasıyla
- Sonuçlar
- koşmak
- ishal
- s
- Adı geçen
- aynı
- çizik
- senaryo
- scriptler
- görmek
- Eylül
- set
- Setleri
- kısa
- meli
- gösterme
- önemli ölçüde
- basitleştirilmesi
- küçük
- So
- Yazılım
- çözüm
- Çözümler
- ÇÖZMEK
- Çözme
- özellikler
- Belirtilen
- harcanmış
- bölmek
- Aşama
- state-of-the-art
- adım
- Basamaklar
- özetlemek
- destek
- sistem
- Bizi daha iyi tanımak için
- alınan
- söylemek
- on
- onlarca
- şartlar
- test
- test edilmiş
- Test yapmak
- testleri
- metin
- göre
- o
- The
- ve bazı Asya
- Onları
- sonra
- Bunlar
- onlar
- işler
- Re-Tweet
- Bu
- gerçi?
- Binlerce
- İçinden
- zaman
- için
- söyledi
- araç
- araçlar
- Tren
- eğitilmiş
- denemek
- çalışıyor
- iki
- tipik
- altında yatan
- kadar
- Kullanılmış
- kullanma
- onaylama
- Varyant
- Doğrulama
- versiyon
- çok
- oldu
- we
- İYİ
- iyi tanımlanmış
- vardı
- Ne
- ne zaman
- oysa
- süre
- DSÖ
- ile
- olmadan
- İş
- çalışma
- Yanlış
- yıl
- Sen
- zefirnet