Amazon SageMaker JumpStart ile Mistral 7B'de İnce Ayar Yapın ve Dağıtın

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Bugün, Mistral 7B modeline ince ayar yapma yeteneğini duyurmanın heyecanını yaşıyoruz. Amazon SageMaker Hızlı Başlangıç. Artık SageMaker JumpStart'ta Mistral metin oluşturma modellerine ince ayar yapabilir ve dağıtabilirsiniz. Amazon SageMaker Stüdyosu Birkaç tıklamayla veya SageMaker Python SDK'yı kullanarak kullanıcı arayüzü.

Temel modeller, metin ve özet hazırlamaktan soruları yanıtlamaktan resim ve video üretmeye kadar üretken görevlerde çok iyi performans gösterir. Bu modellerin büyük genelleme yeteneklerine rağmen, sıklıkla çok spesifik alan verilerine (sağlık hizmetleri veya finansal hizmetler gibi) sahip kullanım senaryoları vardır ve bu modeller, bu kullanım senaryoları için iyi sonuçlar sağlayamayabilir. Bu, kullanım durumuna özgü ve alana özgü veriler üzerinden bu üretken yapay zeka modellerinde daha fazla ince ayar yapılması ihtiyacını doğurur.

Bu yazıda, SageMaker JumpStart kullanarak Mistral 7B modeline nasıl ince ayar yapılacağını gösteriyoruz.

Mistral 7B Nedir?

Mistral 7B, Mistral AI tarafından geliştirilen, İngilizce metin ve kod oluşturma yeteneklerini destekleyen bir temel modeldir. Metin özetleme, sınıflandırma, metin tamamlama ve kod tamamlama gibi çeşitli kullanım durumlarını destekler. Mistral AI, modelin özelleştirilebilirliğini göstermek amacıyla, sohbet kullanım durumları için, halka açık çeşitli konuşma veri kümeleri kullanılarak ince ayar yapılan bir Mistral 7B-Instruct modelini de yayınladı.

Mistral 7B bir dönüştürücü modelidir ve daha hızlı çıkarım (düşük gecikme) elde etmek ve daha uzun dizileri işlemek için gruplandırılmış sorgu dikkatini ve kayan pencere dikkatini kullanır. Gruplandırılmış sorgu dikkati, çoklu sorgu dikkatine yakın çıktı kalitesi ve çoklu sorgu dikkatiyle karşılaştırılabilir hız elde etmek için çoklu sorgu ve çok kafalı dikkati birleştiren bir mimaridir. Kayan pencere dikkat yöntemi, daha önce gelen bilgilere odaklanmak için bir dönüştürücü modelinin çoklu düzeylerini kullanır; bu, modelin daha uzun bir bağlamı anlamasına yardımcı olur. . Mistral 7B, 8,000 jetonluk bağlam uzunluğuna sahiptir, düşük gecikme süresi ve yüksek verim gösterir ve daha büyük model alternatifleriyle karşılaştırıldığında güçlü bir performansa sahiptir ve 7B model boyutunda düşük bellek gereksinimleri sağlar. Model, kısıtlama olmaksızın kullanılmak üzere izin verilen Apache 2.0 lisansı altında kullanıma sunulmuştur.

SageMaker Studio kullanıcı arayüzünü veya SageMaker Python SDK'yı kullanarak modellerde ince ayar yapabilirsiniz. Bu yazıda her iki yöntemi de tartışıyoruz.

SageMaker Studio kullanıcı arayüzü aracılığıyla ince ayar yapın

SageMaker Studio'da, Mistral modeline SageMaker JumpStart aracılığıyla şu adresten erişebilirsiniz: Modeller, not defterleri ve çözümler, aşağıdaki ekran görüntüsünde gösterildiği gibi.

Mistral modellerini göremiyorsanız SageMaker Studio sürümünüzü kapatıp yeniden başlatarak güncelleyin. Sürüm güncellemeleri hakkında daha fazla bilgi için bkz. Studio Uygulamalarını Kapatın ve Güncelleyin.

Amazon SageMaker JumpStart ile Mistral 7B'de İnce Ayar Yapın ve Dağıtın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Model sayfasında şunu işaret edebilirsiniz: Amazon Basit Depolama Hizmeti İnce ayar için eğitim ve doğrulama veri kümelerini içeren (Amazon S3) paketi. Ayrıca, ince ayar yapmak için dağıtım yapılandırmasını, hiperparametreleri ve güvenlik ayarlarını yapılandırabilirsiniz. Daha sonra seçebilirsiniz Tren SageMaker ML örneğinde eğitim işini başlatmak için.

Amazon SageMaker JumpStart ile Mistral 7B'de İnce Ayar Yapın ve Dağıtın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Modeli dağıtın

Modelde ince ayar yapıldıktan sonra SageMaker JumpStart'taki model sayfasını kullanarak dağıtabilirsiniz. Aşağıdaki ekran görüntüsünde gösterildiği gibi, ince ayar tamamlandığında ince ayarlı modeli dağıtma seçeneği görünecektir.

Amazon SageMaker JumpStart ile Mistral 7B'de İnce Ayar Yapın ve Dağıtın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

SageMaker Python SDK aracılığıyla ince ayar yapın

Ayrıca SageMaker Python SDK'yı kullanarak Mistral modellerine ince ayar yapabilirsiniz. Dizüstü bilgisayarın tamamı şu adreste mevcuttur: GitHub. Bu bölümde iki tür ince ayar örneği sunuyoruz.

Talimat ince ayarı

Talimat ayarlama, talimatları kullanarak bir dizi doğal dil işleme (NLP) görevi üzerinde bir dil modeline ince ayar yapmayı içeren bir tekniktir. Bu teknikte model, her görev için belirli veri kümeleri yerine metinsel talimatları izleyerek görevleri gerçekleştirmek üzere eğitilir. Model, her görev için bir dizi girdi ve çıktı örneğiyle ince ayarlanmıştır ve görevler için bilgi istemleri sağlandığı sürece modelin, üzerinde açıkça eğitim almadığı yeni görevlere genelleştirilmesine olanak tanır. Talimat ayarlama, modellerin doğruluğunu ve etkililiğini artırmaya yardımcı olur ve belirli görevler için büyük veri kümelerinin mevcut olmadığı durumlarda faydalıdır.

Örnekte verilen ince ayar kodunu inceleyelim defter SageMaker Python SDK'sı ile.

Bir alt kümesini kullanıyoruz Dolly veri kümesi bir talimat ayarlama formatında ve belirtin template.json Giriş ve çıkış formatlarını açıklayan dosya. Eğitim verileri, her satırın tek bir veri örneğini temsil eden bir sözlük olduğu JSON satırları (.jsonl) biçiminde biçimlendirilmelidir. Bu durumda adını koyarız. train.jsonl.

Aşağıdaki kod parçası buna bir örnektir train.jsonl. Anahtarlar instruction, context, ve response her örnekte karşılık gelen girişler bulunmalıdır {instruction}, {context}, {response} içinde template.json.

{ "instruction": "What is a dispersive prism?", "context": "In optics, a dispersive prism is an optical prism that is used to disperse light, that is, to separate light into its spectral components (the colors of the rainbow). Different wavelengths (colors) of light will be deflected by the prism at different angles. This is a result of the prism material's index of refraction varying with wavelength (dispersion). Generally, longer wavelengths (red) undergo a smaller deviation than shorter wavelengths (blue). The dispersion of white light into colors by a prism led Sir Isaac Newton to conclude that white light consisted of a mixture of different colors.", "response": "A dispersive prism is an optical prism that disperses the light's different wavelengths at different angles. When white light is shined through a dispersive prism it will separate into the different colors of the rainbow."
}

Aşağıdaki bir örnektir template.json:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. " "Write a response that appropriately completes the request.nn" "### Instruction:n{instruction}nn### Input:n{context}nn", "completion": " {response}",
}

Bilgi istemi şablonunu ve eğitim verilerini bir S3 klasörüne yükledikten sonra hiper parametreleri ayarlayabilirsiniz.

my_hyperparameters["epoch"] = "1"
my_hyperparameters["per_device_train_batch_size"] = "2"
my_hyperparameters["gradient_accumulation_steps"] = "2"
my_hyperparameters["instruction_tuned"] = "True"
print(my_hyperparameters)

Daha sonra ince ayar sürecini başlatabilir ve modeli bir çıkarım uç noktasına dağıtabilirsiniz. Aşağıdaki kodda ml.g5.12xlarge örneğini kullanıyoruz:

from sagemaker.jumpstart.estimator import JumpStartEstimator instruction_tuned_estimator = JumpStartEstimator( model_id=model_id, hyperparameters=my_hyperparameters, instance_type="ml.g5.12xlarge",
)
instruction_tuned_estimator.fit({"train": train_data_location}, logs=True) instruction_tuned_predictor = instruction_tuned_estimator.deploy()

Etki alanı uyarlamasında ince ayar

Etki alanı uyarlama ince ayarı, önceden eğitilmiş bir LLM'yi belirli bir etki alanına veya göreve daha iyi uyacak şekilde hassaslaştıran bir süreçtir. Daha küçük, alana özgü bir veri kümesi kullanarak LLM, orijinal eğitimi sırasında kazandığı geniş bilgiyi korurken, söz konusu alan için daha doğru, ilgili ve anlayışlı içeriği anlamak ve oluşturmak için ince ayar yapılabilir.

Mistral modeline, alana özgü herhangi bir veri kümesinde ince ayar yapılabilir. İnce ayar yapıldıktan sonra alana özgü metin üretmesi ve o belirli alanda çeşitli NLP görevlerini çözmesi bekleniyor. Eğitim veri kümesi için, her biri tek bir CSV, JSON veya TXT dosyası içeren bir eğitim dizini ve isteğe bağlı bir doğrulama dizini sağlayın. CSV ve JSON formatları için aşağıdaki verilerden yararlanın: text sütun veya ilk sütun ise text mevcut değil. Her dizinin altında yalnızca bir dosyanın bulunduğundan emin olun. Örneğin, giriş verileri bir metin dosyası olarak Amazon'un SEC dosyaları olabilir:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions.

Hiperparametreyi belirterek etki alanı uyarlama ince ayarını başlatabilirsiniz "instruction_tuned" gibi "False“. Adımların geri kalanı talimattaki ince ayar adımlarına benzer.

Ayarladık max_input_length g2048xlarge'da 5.12 olacaktır. Daha büyük bir örnek türünde daha yüksek bir giriş uzunluğu kullanabilirsiniz. Ayrıntılar için bkz. örnek not defteri.

İnce ayarlı ve ince ayarsız çıkarım örneği

Aşağıdaki tablo, Amazon'un 7-2021 yılları arasındaki SEC dosyalama belgeleriyle ince ayar yapılan Mistral 2022B modelinin sonuçlarını içermektedir. İnce ayardan önceki ve sonraki çıktıyı karşılaştırıyoruz.

Giriş İstemi	İnce Ayardan Önce Çıktı	İnce Ayardan Sonra Çıktı	parametreler
Bu Form 10-K raporu şunu gösteriyor:	Şirket 10 yıldır faaliyet göstermektedir ve toplam 10 çalışanı bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve kamuya hizmet sağlama faaliyetinde bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve kamuya hizmet sağlama faaliyetinde bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve kamuya hizmet sağlama faaliyetinde bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve kamuya hizmet sağlama faaliyetinde bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve kamuya hizmet sağlama faaliyetinde bulunmaktadır. Şirketin toplam 10 çalışanı bulunmaktadır ve hizmet sağlama işindedir.	1.2, 1.5 ve 1.8 yıllarında 2004 milyar $, 2003 milyar $ ve 2002 milyar $ net satışımız oldu. Bu tutarlara uluslararası web sitelerimizden yapılan satışlar da dahildir. Uluslararası web sitelerimizden elde edilen net satışlar 323, 242 ve 150 yıllarında 2004 milyon $, 2003 milyon $ ve 2002 milyon $ olmuştur. Uluslararası web sitelerimizden elde edilen net satışlar 27, 16 ve 8 yıllarında net satışların %2004, %2003 ve %2002'ini temsil etmektedir. .	“sıcaklık”: 0.2, “max_new_tokens”: 150,
aracılığıyla tüketicilere hizmet veriyoruz.	Amerika Birleşik Devletleri'nde 1,700, Kanada'da 1,200 ve Meksika'da 400 mağazadan oluşan 100 mağazadan oluşan perakende ağımız. Tüketicilere e-ticaret sitelerimiz aracılığıyla da hizmet veriyoruz. ## En büyük ev tadilatı mağazası hangisidir? Home Depot, Amerika Birleşik Devletleri'ndeki en büyük ev geliştirme perakendecisidir. ## Dünyanın en büyük ev tadilatı mağazası hangisidir? Dünyanın en büyük ev geliştirme mağazası Home Depot'tur. ## Dünyanın en büyük ev tadilat mağazası hangisidir?	çevrimiçi ve fiziksel mağazalarımız ve seçim, fiyat ve rahatlığa odaklanın. Mağazalarımızı, onlarca ürün kategorisinde yüz milyonlarca benzersiz ürünün tarafımızdan ve üçüncü taraflarca satılmasına olanak sağlayacak şekilde tasarlıyoruz. Müşteriler tekliflerimize web sitelerimiz, mobil uygulamalarımız, Alexa, cihazlarımız, yayınlarımız aracılığıyla ve mağazalarımızı fiziksel olarak ziyaret ederek erişebilirler. Ayrıca Kindle, Fire tablet, Fire TV, Echo ve Ring gibi elektronik cihazların da üretim ve satışını yapıyor, medya içerikleri geliştiriyor ve üretiyoruz. Müşterilerimize düşük fiyatlar, hızlı ve ücretsiz teslimat, kullanımı kolay işlevsellik ve zamanında müşteri hizmetleri sunmaya çalışıyoruz. Ayrıca Amazon Prime gibi abonelik hizmetleri de sunuyoruz.
Vizyonumuz	Hizmet verdiğimiz topluluklarda kaliteli, uygun fiyatlı ve erişilebilir sağlık hizmetlerinin lider sağlayıcısı olmak. Misyonumuz, hizmet verdiğimiz topluluklara kaliteli, uygun fiyatlı ve erişilebilir sağlık hizmetleri sunmaktır. Değerlerimiz: – Dürüstlük: Tüm ilişkilerimizde dürüstlük ve doğrulukla hareket ederiz. – Saygı: Herkese saygı ve itibarla davranırız. – Mükemmellik: Yaptığımız her şeyde mükemmellik için çabalıyoruz. – Şefkat: Hastalarımıza ve birbirimize şefkatle önem veririz. – Ekip Çalışması: Hedeflerimize ulaşmak için ekip olarak birlikte çalışırız. Hastalarımıza olan bağlılığımız kaliteli, uygun fiyatlı ve erişilebilir sağlık hizmetleri sunmaktır.	Dünyanın en müşteri odaklı şirketi olmak. Dört prensip bize rehberlik ediyor: rakip odaklılık yerine müşteri takıntısı, buluş tutkusu, operasyonel mükemmelliğe bağlılık ve uzun vadeli düşünme. Segmentlerimizin her birinde tüketicilerden, satıcılardan, geliştiricilerden, işletmelerden ve içerik yaratıcılarından oluşan birincil müşteri kümelerimize hizmet veriyoruz. Ayrıca reklamcılık gibi hizmetler de sağlıyoruz. Operasyonlarımızı üç segmentte düzenledik: Kuzey Amerika, Uluslararası ve AWS. Bu bölümler Şirketin iş performansını değerlendirme ve operasyonlarını yönetme şeklini yansıtır. Net satışlarımıza ilişkin bilgiler II. Bölüm “Finansal Tablolar”ın 8. Maddesinde yer almaktadır.

Gördüğünüz gibi, ince ayarlı model, önceden eğitilmiş genel modele kıyasla Amazon ile ilgili daha spesifik bilgiler sağlar. Bunun nedeni, ince ayarın modeli, sağlanan veri kümesinin nüanslarını, kalıplarını ve özelliklerini anlayacak şekilde uyarlamasıdır. Önceden eğitilmiş bir model kullanarak ve onu ince ayarlarla uyarlayarak, her iki dünyanın da en iyisini elde etmenizi sağlıyoruz: önceden eğitilmiş modele ilişkin geniş bilgi ve benzersiz veri kümeniz için özel doğruluk. Makine öğrenimi dünyasında tek boyut herkese uymayabilir ve ince ayar, ihtiyacınız olan kişiye özel çözümdür!

Sonuç

Bu yazıda Mistral 7B modeline SageMaker JumpStart kullanarak ince ayar yapmayı tartıştık. Bu modellere ince ayar yapmak ve dağıtmak için SageMaker Studio'daki SageMaker JumpStart konsolunu veya SageMaker Python SDK'yı nasıl kullanabileceğinizi gösterdik. Bir sonraki adım olarak, kullanım senaryolarınız için sonuçları test etmek ve kıyaslamak amacıyla GitHub deposunda sağlanan kodu kullanarak bu modellere kendi veri kümenizde ince ayar yapmayı deneyebilirsiniz.

Yazarlar Hakkında

Xin Huang Amazon SageMaker JumpStart ve Amazon SageMaker yerleşik algoritmaları için Kıdemli Uygulamalı Bilim İnsanıdır. Ölçeklenebilir makine öğrenimi algoritmaları geliştirmeye odaklanıyor. Araştırma ilgi alanları, doğal dil işleme, tablo verileri üzerinde açıklanabilir derin öğrenme ve parametrik olmayan uzay-zaman kümelemenin sağlam analizi alanındadır. ACL, ICDM, KDD konferanslarında ve Royal Statistical Society: Series A'da birçok makale yayınladı.

Vivek Gangasani AWS'de Üretken Yapay Zeka girişimleri için AI/ML Başlangıç Çözümleri Mimarıdır. Gelişmekte olan GenAI girişimlerinin AWS hizmetlerini ve hızlandırılmış bilgi işlemi kullanarak yenilikçi çözümler oluşturmasına yardımcı oluyor. Şu anda Büyük Dil Modellerinin çıkarım performansının ince ayarını yapmak ve optimize etmek için stratejiler geliştirmeye odaklanıyor. Vivek boş zamanlarında yürüyüş yapmayı, film izlemeyi ve farklı mutfakları denemeyi seviyor.

Ashish Khetan Amazon SageMaker yerleşik algoritmalarına sahip Kıdemli Uygulamalı Bilim Adamıdır ve makine öğrenimi algoritmalarının geliştirilmesine yardımcı olur. Doktora derecesini University of Illinois Urbana-Champaign'den almıştır. Makine öğrenimi ve istatistiksel çıkarım alanlarında aktif bir araştırmacıdır ve NeurIPS, ICML, ICLR, JMLR, ACL ve EMNLP konferanslarında birçok makale yayınlamıştır.

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
Kaynak: https://aws.amazon.com/blogs/machine-learning/fine-tune-and-deploy-mistral-7b-with-amazon-sagemaker-jumpstart/

Zaman Damgası: 14 Kasım 2023

Zaman Damgası: Nisan 26, 2024

Plato tarafından yeniden yayınlandı

InformedIQ, makine öğrenimini kullanarak Origence'ın otomatik kredilendirmesi için doğrulamaları otomatik hale getiriyor

Thomson Reuters, Amazon Personalize'ı kullanarak kişiselleştirilmiş içerik abonelik planlarını geniş ölçekte nasıl sunar?

Amazon SageMaker Automatic Model Tuning artık SageMaker Training Instance Fallbacks'i destekliyor

İki aşamalı Amazon Rekognition Custom Labels modellerini kullanarak yüksek çözünürlüklü görüntülerde hata tespiti | Amazon Web Hizmetleri

Makine öğrenimi destekli kodlama arkadaşı Amazon CodeWhisperer ile tanışın

Amazon SageMaker Sunucusuz Çıkarım kullanarak Hugging Face dönüştürücü modellerini barındırın

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap