Sempurnakan Falcon 7B Dan LLM Lainnya Di Amazon SageMaker Dengan @remote Decorator

Diterbitkan Ulang Oleh Plato

Followers: 0

Saat ini, model AI generatif mencakup berbagai tugas mulai dari peringkasan teks, tanya jawab, serta pembuatan gambar dan video. Untuk meningkatkan kualitas keluaran, pendekatan seperti n-short learning, Prompt engineering, Pengambilan Augmented Generation (RAG) dan penyetelan halus digunakan. Penyempurnaan memungkinkan Anda menyesuaikan model AI generatif ini untuk mencapai peningkatan kinerja pada tugas spesifik domain Anda.

Dengan Amazon SageMaker, sekarang Anda dapat menjalankan tugas pelatihan SageMaker hanya dengan memberi anotasi pada kode Python Anda @dekorator jarak jauh. itu SDK Python SageMaker secara otomatis menerjemahkan lingkungan ruang kerja Anda yang ada, serta kode pemrosesan data dan kumpulan data apa pun yang terkait, ke dalam tugas pelatihan SageMaker yang berjalan di platform pelatihan. Keuntungannya adalah penulisan kode dengan cara yang lebih alami dan berorientasi objek, dan masih menggunakan kemampuan SageMaker untuk menjalankan tugas pelatihan pada cluster jarak jauh dengan sedikit perubahan.

Dalam posting ini, kami menunjukkan cara menyempurnakan a Elang-7B Foundation Models (FM) menggunakan dekorator @remote dari SageMaker Python SDK. Itu juga menggunakan Penyesuaian parameter yang efisien dari Hugging Face (PEFT) perpustakaan dan teknik kuantisasi melalui bitsandbytes untuk mendukung penyesuaian. Kode yang disajikan di blog ini juga dapat digunakan untuk menyempurnakan FM lainnya, seperti Llama-2 13b.

Representasi presisi penuh dari model ini mungkin memiliki tantangan untuk dimasukkan ke dalam memori pada satu atau bahkan beberapa model Unit Pemrosesan Grafis (GPU) — atau bahkan mungkin memerlukan instance yang lebih besar. Oleh karena itu, untuk menyempurnakan model ini tanpa menambah biaya, kami menggunakan teknik yang disebut LLM terkuantisasi dengan Low-Rank Adapters (QLoRA). QLoRA adalah pendekatan penyesuaian efisien yang mengurangi penggunaan memori LLM sekaligus mempertahankan kinerja yang sangat baik.

Keuntungan menggunakan dekorator @remote

Sebelum melangkah lebih jauh, mari kita pahami bagaimana dekorator jarak jauh meningkatkan produktivitas pengembang saat bekerja dengan SageMaker:

@remote dekorator memicu tugas pelatihan secara langsung menggunakan kode python asli, tanpa pemanggilan eksplisit SageMaker Estimators dan saluran input SageMaker
Hambatan masuk yang rendah bagi pengembang model pelatihan di SageMaker.
Tidak perlu beralih Lingkungan pengembangan terintegrasi (IDE). Lanjutkan menulis kode dalam IDE pilihan Anda dan aktifkan tugas pelatihan SageMaker.
Tidak perlu belajar tentang container. Lanjutkan menyediakan dependensi di a requirements.txt dan berikan itu ke dekorator jarak jauh.

Prasyarat

Akun AWS diperlukan dengan Identitas AWS dan Manajemen Akses (AWS IAM) peran yang memiliki izin untuk mengelola sumber daya yang dibuat sebagai bagian dari solusi. Untuk detailnya, lihat Membuat akun AWS.

Dalam posting ini, kami menggunakan Studio Amazon SageMaker pada pengatur terkenal. Pengatur ini menawarkan bantuan hukum kepada traderapabila trader berselisih dengan broker yang terdaftar dengan mereka. Data Science 3.0 gambar dan a ml.t3.medium contoh peluncuran cepat. Namun, Anda dapat menggunakan lingkungan pengembangan terintegrasi (IDE) pilihan Anda. Anda hanya perlu mengaturnya Antarmuka Baris Perintah AWS (AWS CLI) kredensial dengan benar. Untuk informasi lebih lanjut, lihat Konfigurasikan AWS CLI.

Untuk penyempurnaan, Falcon-7B, an ml.g5.12xlarge contoh digunakan dalam posting ini. Harap pastikan kapasitas yang cukup untuk instans ini di akun AWS.

Anda perlu mengkloning ini Gudang Github untuk mereplikasi solusi yang ditunjukkan dalam posting ini.

Ikhtisar solusi

Instal prasyarat untuk menyempurnakan model Falcon-7B
Siapkan konfigurasi dekorator jarak jauh
Pra-proses kumpulan data yang berisi FAQ layanan AWS
Menyempurnakan FAQ Falcon-7B pada layanan AWS
Uji model penyempurnaan pada contoh pertanyaan terkait layanan AWS

1. Instal prasyarat untuk menyempurnakan model Falcon-7B

Luncurkan notebook falcon-7b-qlora-remote-decorator_qa.ipynb di SageMaker Studio dengan memilih Ibijaksana as Data Science dan Inti as Python 3. Instal semua perpustakaan yang diperlukan yang disebutkan di requirements.txt. Beberapa perpustakaan perlu diinstal pada instance notebook itu sendiri. Lakukan operasi lain yang diperlukan untuk pemrosesan himpunan data dan memicu tugas pelatihan SageMaker.

%pip install -r requirements.txt %pip install -q -U transformers==4.31.0
%pip install -q -U datasets==2.13.1
%pip install -q -U peft==0.4.0
%pip install -q -U accelerate==0.21.0
%pip install -q -U bitsandbytes==0.40.2
%pip install -q -U boto3
%pip install -q -U sagemaker==2.154.0
%pip install -q -U scikit-learn

2. Atur konfigurasi dekorator jarak jauh

Buat file konfigurasi tempat semua konfigurasi yang terkait dengan tugas pelatihan Amazon SageMaker ditentukan. File ini dibaca oleh dekorator @remote saat menjalankan tugas pelatihan. File ini berisi pengaturan seperti dependensi, gambar pelatihan, instance, dan peran eksekusi yang akan digunakan untuk tugas pelatihan. Untuk referensi mendetail tentang semua pengaturan yang didukung oleh file konfigurasi, lihat Mengonfigurasi dan menggunakan default dengan SageMaker Python SDK.

SchemaVersion: '1.0'
SageMaker: PythonSDK: Modules: RemoteFunction: Dependencies: ./requirements.txt ImageUri: '{aws_account_id}.dkr.ecr.{region}.amazonaws.com/huggingface-pytorch-training:2.0.0-transformers4.28.1-gpu-py310-cu118-ubuntu20.04' InstanceType: ml.g5.12xlarge RoleArn: arn:aws:iam::111122223333:role/ExampleSageMakerRole

Tidak wajib untuk menggunakan config.yaml file agar dapat bekerja dengan dekorator @remote. Ini hanyalah cara yang lebih bersih untuk menyediakan semua konfigurasi ke dekorator @remote. Hal ini membuat parameter terkait SageMaker dan AWS tetap berada di luar kode dengan upaya satu kali untuk menyiapkan file konfigurasi yang digunakan di seluruh anggota tim. Semua konfigurasi juga dapat diberikan langsung dalam argumen dekorator, namun hal ini mengurangi keterbacaan dan pemeliharaan perubahan dalam jangka panjang. Selain itu, file konfigurasi dapat dibuat oleh administrator dan dibagikan dengan semua pengguna di suatu lingkungan.

Pra-proses kumpulan data yang berisi FAQ layanan AWS

Langkah selanjutnya adalah memuat dan memproses kumpulan data terlebih dahulu agar siap untuk tugas pelatihan. Pertama, mari kita lihat kumpulan datanya:

Sempurnakan Falcon 7B dan LLM lainnya di Amazon SageMaker dengan @remote dekorator | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Ini menunjukkan FAQ untuk salah satu layanan AWS. Selain QLoRA, bitsanbytes digunakan untuk mengonversi ke presisi 4-bit untuk mengkuantisasi LLM beku menjadi 4-bit dan melampirkan LoRA adaptor di atasnya.

Buat template prompt untuk mengonversi setiap sampel FAQ ke format prompt:

from random import randint # custom instruct prompt start
prompt_template = f"{{question}}n---nAnswer:n{{answer}}{{eos_token}}" # template dataset to add prompt to each sample
def template_dataset(sample): sample["text"] = prompt_template.format(question=sample["question"], answer=sample["answers"], eos_token=tokenizer.eos_token) return sample

Langkah selanjutnya adalah mengonversi input (teks) menjadi ID token. Hal ini dilakukan oleh a Tokenizer Transformers Wajah Memeluk.

from transformers import AutoTokenizer model_id = "tiiuae/falcon-7b" tokenizer = AutoTokenizer.from_pretrained(model_id)
# Set the Falcon tokenizer
tokenizer.pad_token = tokenizer.eos_token

Sekarang cukup gunakan prompt_template berfungsi untuk mengonversi semua FAQ ke format prompt dan menyiapkan kumpulan data pelatihan dan pengujian.

Sempurnakan Falcon 7B dan LLM lainnya di Amazon SageMaker dengan @remote dekorator | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

4. Menyempurnakan FAQ Falcon-7B pada layanan AWS

Sekarang Anda dapat menyiapkan skrip pelatihan dan menentukan fungsi pelatihan train_fn dan letakkan dekorator @remote pada fungsinya.

Fungsi pelatihan melakukan hal berikut:

memberi token dan membagi kumpulan data
mendirikan BitsAndBytesConfig, yang menentukan model harus dimuat dalam 4-bit tetapi sementara komputasi harus dikonversi ke bfloat16.
Muat modelnya
Temukan modul target dan perbarui matriks yang diperlukan dengan menggunakan metode utilitas find_all_linear_names
membuat LoRA konfigurasi yang menentukan peringkat matriks pembaruan (s), faktor skala (lora_alpha), modul untuk menerapkan matriks pembaruan LoRA (target_modules), probabilitas putus sekolah untuk lapisan Lora(lora_dropout), task_type, Dll
Mulai pelatihan dan evaluasi

import bitsandbytes as bnb def find_all_linear_names(hf_model): lora_module_names = set() for name, module in hf_model.named_modules(): if isinstance(module, bnb.nn.Linear4bit): names = name.split(".") lora_module_names.add(names[0] if len(names) == 1 else names[-1]) if "lm_head" in lora_module_names: lora_module_names.remove("lm_head") return list(lora_module_names)
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
from sagemaker.remote_function import remote
import torch
from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import transformers # Start training
@remote(volume_size=50)
def train_fn( model_name, train_ds, test_ds, lora_r=8, lora_alpha=32, lora_dropout=0.05, per_device_train_batch_size=8, per_device_eval_batch_size=8, learning_rate=2e-4, num_train_epochs=1
): # tokenize and chunk dataset lm_train_dataset = train_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, batch_size=24, remove_columns=list(train_dataset.features) ) lm_test_dataset = test_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, remove_columns=list(test_dataset.features) ) # Print total number of samples print(f"Total number of train samples: {len(lm_train_dataset)}") bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_use_double_quant=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.bfloat16 ) # Falcon requires you to allow remote code execution. This is because the model uses a new architecture that is not part of transformers yet. # The code is provided by the model authors in the repo. model = AutoModelForCausalLM.from_pretrained( model_name, trust_remote_code=True, quantization_config=bnb_config, device_map="auto") model.gradient_checkpointing_enable() model = prepare_model_for_kbit_training(model, use_gradient_checkpointing=True) # get lora target modules modules = find_all_linear_names(model) print(f"Found {len(modules)} modules to quantize: {modules}") config = LoraConfig( r=lora_r, lora_alpha=lora_alpha, target_modules=modules, lora_dropout=lora_dropout, bias="none", task_type="CAUSAL_LM" ) model = get_peft_model(model, config) print_trainable_parameters(model) trainer = transformers.Trainer( model=model, train_dataset=lm_train_dataset, eval_dataset=lm_test_dataset, args=transformers.TrainingArguments( per_device_train_batch_size=per_device_train_batch_size, per_device_eval_batch_size=per_device_eval_batch_size, logging_steps=2, num_train_epochs=num_train_epochs, learning_rate=learning_rate, bf16=True, save_strategy="no", output_dir="outputs" ), data_collator=transformers.DataCollatorForLanguageModeling(tokenizer, mlm=False), ) model.config.use_cache = False trainer.train() trainer.evaluate() model.save_pretrained("/opt/ml/model")

Dan panggil train_fn()

train_fn(model_id, train_dataset, test_dataset)

Pekerjaan penyetelan akan berjalan di klaster pelatihan Amazon SageMaker. Tunggu hingga pekerjaan penyetelan selesai.

5. Uji model penyempurnaan pada contoh pertanyaan terkait layanan AWS

Sekarang, saatnya menjalankan beberapa pengujian pada model. Pertama, mari kita muat modelnya:

from peft import PeftModel, PeftConfig
import torch
from transformers import AutoModelForCausalLM device = 'cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu' config = PeftConfig.from_pretrained("./model")
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, trust_remote_code=True)
model = PeftModel.from_pretrained(model, "./model")
model.to(device)

Sekarang muat contoh pertanyaan dari kumpulan data pelatihan untuk melihat jawaban asli, lalu ajukan pertanyaan yang sama dari model yang disetel untuk melihat jawabannya sebagai perbandingan.

Berikut ini contoh pertanyaan dari set pelatihan dan jawaban aslinya:

Sempurnakan Falcon 7B dan LLM lainnya di Amazon SageMaker dengan @remote dekorator | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Sekarang, pertanyaan yang sama ditanyakan pada model Falcon-7B yang disetel:

Sempurnakan Falcon 7B dan LLM lainnya di Amazon SageMaker dengan @remote dekorator | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Ini menyimpulkan implementasi penyempurnaan Falcon-7B pada kumpulan data FAQ layanan AWS menggunakan dekorator @remote dari Amazon SageMaker Python SDK.

Membersihkan

Selesaikan langkah-langkah berikut untuk membersihkan sumber daya Anda:

Matikan instans Amazon SageMaker Studio untuk menghindari biaya tambahan.
Bersihkan Sistem File Amazon Elastic Anda (Amazon EFS) dengan mengosongkan direktori cache Hugging Face:
```
rm -R ~/.cache/huggingface/hub
```

Kesimpulan

Dalam postingan ini, kami menunjukkan kepada Anda cara efektif menggunakan kemampuan dekorator @remote untuk menyempurnakan model Falcon-7B menggunakan QLoRA, Hugging Face PEFT dengan bitsandbtyes tanpa menerapkan perubahan signifikan pada notebook pelatihan, dan menggunakan kemampuan Amazon SageMaker untuk menjalankan tugas pelatihan pada klaster jarak jauh.

Semua kode yang ditampilkan sebagai bagian dari posting ini untuk menyempurnakan Falcon-7B tersedia di Repositori GitHub. Repositori juga berisi buku catatan yang menunjukkan cara menyempurnakan Llama-13B.

Sebagai langkah berikutnya, kami mendorong Anda untuk memeriksa fungsi dekorator @remote dan API Python SDK dan gunakan dalam lingkungan dan IDE pilihan Anda. Contoh tambahan tersedia di amazon-sagemaker-contoh repositori untuk membantu Anda memulai dengan cepat. Anda juga dapat melihat postingan berikut:

Tentang Penulis

Bruno Piston adalah Arsitek Solusi Spesialis AI/ML untuk AWS yang berbasis di Milan. Dia bekerja dengan pelanggan besar untuk membantu mereka memahami secara mendalam kebutuhan teknis mereka dan merancang solusi AI dan Machine Learning yang memanfaatkan AWS Cloud dan tumpukan Amazon Machine Learning dengan sebaik-baiknya. Keahliannya meliputi: Machine Learning end to end, Machine Learning Industrialization, dan Generative AI. Dia senang menghabiskan waktu bersama teman-temannya dan menjelajahi tempat-tempat baru, serta bepergian ke destinasi baru.

Vikesh Pandey adalah Arsitek Solusi Spesialis Pembelajaran Mesin di AWS, membantu pelanggan dari industri keuangan merancang dan membangun solusi pada AI dan ML generatif. Di luar pekerjaan, Vikesh senang mencoba masakan yang berbeda dan berolahraga di luar ruangan.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
PlatoESG. Otomotif / EV, Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
ChartPrime. Tingkatkan Game Trading Anda dengan ChartPrime. Akses Di Sini.
BlockOffset. Modernisasi Kepemilikan Offset Lingkungan. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/fine-tune-falcon-7b-and-other-llms-on-amazon-sagemaker-with-remote-decorator/

Stempel Waktu: September 14, 2023

Stempel Waktu: Juni 3, 2022

Diterbitkan Ulang Oleh Plato

Mengonfigurasi lokasi keluaran kueri Amazon S3 khusus dan kebijakan penyimpanan data untuk sumber data Amazon Athena di Amazon SageMaker Data Wrangler

Kurangi limbah makanan untuk meningkatkan keberlanjutan dan hasil keuangan di ritel dengan Amazon Forecast

Buat set data siap pembelajaran mesin dari Toko Fitur offline Amazon SageMaker menggunakan Amazon SageMaker Python SDK | Layanan Web Amazon

Buat aplikasi peringkasan dokumen HCLS dengan Falcon menggunakan Amazon SageMaker JumpStart | Layanan Web Amazon

Buat prediksi batch dengan Amazon SageMaker Autopilot

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun