Hôm nay, chúng tôi vui mừng thông báo rằng các mẫu nền tảng Meta Llama 3 đã có sẵn thông qua Khởi động Amazon SageMaker để triển khai và chạy suy luận. Các mô hình Llama 3 là tập hợp các mô hình văn bản tổng quát được đào tạo trước và tinh chỉnh.
Trong bài đăng này, chúng tôi hướng dẫn cách khám phá và triển khai các mô hình Llama 3 thông qua SageMaker JumpStart.
Meta Llama 3 là gì
Llama 3 có hai kích thước tham số — 8B và 70B với độ dài ngữ cảnh 8k — có thể hỗ trợ nhiều trường hợp sử dụng với những cải tiến về lý luận, tạo mã và hướng dẫn sau. Llama 3 sử dụng kiến trúc biến áp chỉ dành cho bộ giải mã và bộ mã thông báo mới giúp cải thiện hiệu suất mô hình với kích thước 128k. Ngoài ra, Meta đã cải thiện các quy trình sau đào tạo giúp giảm đáng kể tỷ lệ từ chối sai, cải thiện sự liên kết và tăng tính đa dạng trong các phản hồi của mô hình. Giờ đây, bạn có thể tận dụng các lợi thế kết hợp giữa hiệu suất Llama 3 và điều khiển MLOps bằng các tính năng của Amazon SageMaker như SageMaker Pipelines, SageMaker Debugger hoặc nhật ký vùng chứa. Ngoài ra, mô hình sẽ được triển khai trong môi trường bảo mật AWS dưới sự kiểm soát VPC của bạn, giúp cung cấp bảo mật dữ liệu.
Khởi động SageMaker là gì
Với SageMaker JumpStart, bạn có thể chọn từ rất nhiều mô hình nền tảng có sẵn công khai. Những người thực hành ML có thể triển khai các mô hình nền tảng cho các phiên bản SageMaker chuyên dụng từ môi trường mạng bị cô lập và tùy chỉnh các mô hình bằng SageMaker để đào tạo và triển khai mô hình. Bây giờ bạn có thể khám phá và triển khai các mô hình Llama 3 chỉ bằng vài cú nhấp chuột trong Xưởng sản xuất Amazon SageMaker hoặc lập trình thông qua SageMaker Python SDK, cho phép bạn lấy được hiệu suất mô hình và các điều khiển MLOps bằng các tính năng của SageMaker như Đường ống SageMaker, Trình gỡ lỗi SageMakerhoặc nhật ký vùng chứa. Mô hình này được triển khai trong môi trường bảo mật AWS và dưới sự kiểm soát VPC của bạn, giúp cung cấp bảo mật dữ liệu. Các mô hình Llama 3 hiện đã có sẵn để triển khai và suy luận trong Amazon SageMaker Studio ở us-east-1
(Bắc Virginia), us-east-2
(Ohio), us-west-2
(Oregon), eu-west-1
(Ireland) và ap-northeast-1
(Tokyo) Khu vực AWS.
Khám phá các mô hình
Bạn có thể truy cập các mô hình nền tảng thông qua SageMaker JumpStart trong giao diện người dùng SageMaker Studio và SageMaker Python SDK. Trong phần này, chúng ta sẽ tìm hiểu cách khám phá các mô hình trong SageMaker Studio.
SageMaker Studio là một môi trường phát triển tích hợp (IDE) cung cấp một giao diện trực quan dựa trên web duy nhất, nơi bạn có thể truy cập các công cụ chuyên dụng để thực hiện tất cả các bước phát triển ML, từ chuẩn bị dữ liệu đến xây dựng, đào tạo và triển khai các mô hình ML của bạn. Để biết thêm chi tiết về cách bắt đầu và thiết lập SageMaker Studio, hãy tham khảo Xưởng sản xuất Amazon SageMaker.
Trong SageMaker Studio, bạn có thể truy cập SageMaker JumpStart, nơi chứa các mô hình, sổ ghi chép và giải pháp dựng sẵn được đào tạo trước, trong Các giải pháp dựng sẵn và tự động.
Từ trang đích SageMaker JumpStart, bạn có thể dễ dàng khám phá nhiều mô hình khác nhau bằng cách duyệt qua các trung tâm khác nhau được đặt tên theo nhà cung cấp mô hình. Bạn có thể tìm thấy các mô hình Llama 3 trong Meta hub. Nếu bạn không thấy mẫu Llama 3, vui lòng cập nhật phiên bản SageMaker Studio bằng cách tắt và khởi động lại. Để biết thêm thông tin, hãy tham khảo Tắt và cập nhật ứng dụng Studio Classic.
Bạn có thể tìm thấy các mẫu Llama 3 bằng cách tìm kiếm “Meta-llama-3” từ hộp tìm kiếm nằm ở trên cùng bên trái.
Bạn có thể khám phá tất cả các mô hình Meta có sẵn trong SageMaker JumpStart bằng cách nhấp vào Meta hub.
Nhấp vào thẻ mô hình sẽ mở ra trang chi tiết mô hình tương ứng, từ đó bạn có thể dễ dàng Triển khai mô hình.
Triển khai một mô hình
Khi bạn chọn Triển khai và thừa nhận các điều khoản EULA, quá trình triển khai sẽ bắt đầu.
Bạn có thể theo dõi tiến trình triển khai trên trang hiển thị sau khi nhấp vào nút Triển khai.
Ngoài ra, bạn có thể chọn Mở sổ tay để triển khai thông qua sổ ghi chép mẫu. Sổ tay ví dụ cung cấp hướng dẫn toàn diện về cách triển khai mô hình để suy luận và dọn dẹp tài nguyên.
Để triển khai bằng sổ ghi chép, bạn bắt đầu bằng cách chọn một mô hình thích hợp, được chỉ định bởi model_id
. Bạn có thể triển khai bất kỳ mô hình nào đã chọn trên SageMaker bằng mã sau.
Theo mặc định accept_eula
được thiết lập để False
. Bạn cần chấp nhận EULA theo cách thủ công để triển khai điểm cuối thành công. Bằng cách đó, bạn chấp nhận thỏa thuận cấp phép người dùng và chính sách sử dụng được chấp nhận. Bạn cũng có thể tìm thấy thỏa thuận cấp phép Trang web Llama. Việc này sẽ triển khai mô hình trên SageMaker với các cấu hình mặc định bao gồm loại phiên bản mặc định và cấu hình VPC mặc định. Bạn có thể thay đổi các cấu hình này bằng cách chỉ định các giá trị không mặc định trong JumpStartModel
. Để tìm hiểu thêm, vui lòng tham khảo sau tài liệu hướng dẫn.
Bảng sau liệt kê tất cả các mẫu Llama 3 có sẵn trong SageMaker JumpStart cùng với model_ids
, loại phiên bản mặc định và số lượng tổng mã thông báo tối đa (tổng số mã thông báo đầu vào và số lượng mã thông báo được tạo) được hỗ trợ cho từng mô hình này.
Tên Model | ID mô hình | Tổng số mã thông báo tối đa | Loại phiên bản mặc định |
Meta-Llama-3-8B | meta-textthế hệ-llama-3-8B | 8192 | ml.g5.12xlarge |
Meta-Llama-3-8B-Hướng dẫn | meta-textthế hệ-llama-3-8B-hướng dẫn | 8192 | ml.g5.12xlarge |
Meta-Llama-3-70B | siêu văn bản-llama-3-70b | 8192 | ml.p4d.24xlarge |
Meta-Llama-3-70B-Hướng dẫn | meta-textthế hệ-llama-3-70b-hướng dẫn | 8192 | ml.p4d.24xlarge |
Chạy suy luận
Sau khi triển khai mô hình, bạn có thể chạy suy luận dựa trên điểm cuối được triển khai thông qua công cụ dự đoán SageMaker. Các mô hình hướng dẫn được tinh chỉnh (Llama 3: 8B Instruct và 70B Instruct) chấp nhận lịch sử trò chuyện giữa người dùng và trợ lý trò chuyện và tạo cuộc trò chuyện tiếp theo. Các mô hình được đào tạo trước (Llama 3: 8B và 70B) yêu cầu dấu nhắc chuỗi và thực hiện hoàn thành văn bản trên dấu nhắc được cung cấp.
Các tham số suy luận kiểm soát quá trình tạo văn bản ở điểm cuối. Mã thông báo mới Max kiểm soát kích thước đầu ra do mô hình tạo ra. Con số này không giống với số lượng từ vì từ vựng của mô hình không giống với từ vựng tiếng Anh và mỗi mã thông báo có thể không phải là một từ tiếng Anh. Tham số nhiệt độ kiểm soát tính ngẫu nhiên ở đầu ra. Nhiệt độ cao hơn dẫn đến kết quả đầu ra sáng tạo và ảo giác hơn. Tất cả các tham số suy luận là tùy chọn.
Ví dụ về lời nhắc dành cho mẫu 70B
Bạn có thể sử dụng mô hình Llama 3 để hoàn thành văn bản cho bất kỳ đoạn văn bản nào. Thông qua việc tạo văn bản, bạn có thể thực hiện nhiều tác vụ khác nhau như trả lời câu hỏi, dịch ngôn ngữ và phân tích cảm xúc, v.v. Tải trọng đầu vào đến điểm cuối trông giống như đoạn mã sau:
Sau đây là một số lời nhắc ví dụ mẫu và văn bản do mô hình tạo ra. Tất cả các đầu ra được tạo với các tham số suy luận {"max_new_tokens":64, "top_p":0.9, "temperature":0.6}
.
Trong ví dụ tiếp theo, chúng tôi trình bày cách sử dụng các mô hình Llama 3 với một vài cảnh học tập trong bối cảnh trong đó chúng tôi cung cấp các mẫu đào tạo có sẵn cho mô hình. Chúng tôi chỉ chạy suy luận trên mô hình đã triển khai và trong quá trình này, trọng số của mô hình không thay đổi.
Lời nhắc ví dụ cho mô hình 70B-Instruct
Với các mô hình hướng dẫn Llama 3 được tối ưu hóa cho các trường hợp sử dụng hội thoại, đầu vào của điểm cuối mô hình hướng dẫn là lịch sử trước đó giữa trợ lý trò chuyện và người dùng. Bạn có thể đặt câu hỏi theo ngữ cảnh của cuộc trò chuyện đã diễn ra cho đến nay. Bạn cũng có thể cung cấp cấu hình hệ thống, chẳng hạn như cá tính, xác định hành vi của trợ lý trò chuyện. Mặc dù định dạng tải trọng đầu vào giống với mô hình được đào tạo trước cơ sở, nhưng văn bản đầu vào phải được định dạng theo cách sau:
Trong mẫu hướng dẫn này, bạn có thể tùy ý bắt đầu bằng một system
vai trò và bao gồm nhiều vai trò xen kẽ như mong muốn trong lịch sử theo lượt. Vai trò cuối cùng phải luôn là assistant
và kết thúc bằng hai nguồn cấp dữ liệu dòng mới.
Tiếp theo, hãy xem xét một số ví dụ gợi ý và phản hồi từ mô hình. Trong ví dụ sau, người dùng đang hỏi trợ lý một câu hỏi đơn giản.
Trong ví dụ sau, người dùng trò chuyện với trợ lý về các địa điểm du lịch ở Paris. Sau đó, người dùng hỏi về tùy chọn đầu tiên được trợ lý trò chuyện đề xuất.
Trong các ví dụ sau, chúng tôi thiết lập cấu hình của hệ thống.
Làm sạch
Sau khi chạy xong sổ ghi chép, hãy đảm bảo xóa tất cả tài nguyên bạn đã tạo trong quy trình để dừng thanh toán. Sử dụng mã sau đây:
Kết luận
Trong bài đăng này, chúng tôi đã hướng dẫn bạn cách bắt đầu với mô hình Llama 3 trong SageMaker Studio. Bây giờ bạn có quyền truy cập vào bốn mô hình nền tảng Llama 3 chứa hàng tỷ tham số. Vì các mô hình nền tảng đã được đào tạo trước nên chúng cũng có thể giúp giảm chi phí đào tạo và cơ sở hạ tầng, đồng thời cho phép tùy chỉnh cho trường hợp sử dụng của bạn. Thủ tục thanh toán Khởi động SageMaker trong SageMaker Studio ngay bây giờ để bắt đầu.
Về tác giả
Kyle Ulrich là Nhà khoa học ứng dụng II tại AWS
Tân Hoàng là Nhà khoa học ứng dụng cấp cao tại AWS
Thanh Lan là Kỹ sư phát triển phần mềm cấp cao tại AWS
Hạo Thiên Ân là Kỹ sư phát triển phần mềm II tại AWS
Christopher Whitten là Kỹ sư phát triển phần mềm II tại AWS
Tyler Osterberg là Kỹ sư phát triển phần mềm I tại AWS
Manan Shah là Giám đốc phát triển phần mềm tại AWS
Jonathan Guinegagne là Kỹ sư phát triển phần mềm cấp cao tại AWS
Adriana Simmons là Giám đốc tiếp thị sản phẩm cấp cao tại AWS
tháng sáu thắng là Giám đốc sản phẩm cấp cao tại AWS
Ashish Khetan là Nhà khoa học ứng dụng cấp cao tại AWS
rachna chadha là Kiến trúc sư giải pháp chính – AI/ML tại AWS
Deepak Rupakula là Chuyên gia GTM chính tại AWS
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/meta-llama-3-models-are-now-available-in-amazon-sagemaker-jumpstart/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 1
- 10
- 11
- 120
- 19
- 360-độ
- 43
- 7
- 8
- 8k
- 9
- a
- Giới thiệu
- Chấp nhận
- chấp nhận được
- truy cập
- có thể truy cập
- công nhận
- thêm vào
- thêm
- Ngoài ra
- lợi thế
- Sau
- một lần nữa
- chống lại
- Hiệp định
- AI / ML
- liên kết
- Tất cả
- dọc theo
- Ngoài ra
- luôn luôn
- am
- đàn bà gan dạ
- Amazon SageMaker
- Khởi động Amazon SageMaker
- Xưởng sản xuất Amazon SageMaker
- Amazon Web Services
- tuyệt
- an
- phân tích
- và
- và cơ sở hạ tầng
- Thông báo
- trả lời
- trả lời
- bất kì
- Apple
- áp dụng
- thích hợp
- kiến trúc
- LÀ
- Nghệ thuật
- AS
- xin
- yêu cầu
- Trợ lý
- liên kết
- At
- Bầu không khí
- thu hút
- hấp dẫn
- Tự động
- có sẵn
- tránh
- AWS
- cơ sở
- BE
- Ghi
- đẹp
- bởi vì
- được
- hành vi
- Bắc Kinh
- Tin
- giữa
- thanh toán
- tỷ
- Hộp
- nghỉ giải lao
- ngoạn mục
- rộng
- Bị phá vỡ
- Duyệt
- Xây dựng
- xây dựng
- nhưng
- nút
- by
- Cuộc gọi
- CAN
- vốn
- thẻ
- trường hợp
- trường hợp
- thay đổi
- trò chuyện trên mạng
- mèo
- kiểm tra
- Chọn
- City
- cổ điển
- giống cá lăng
- mã
- bộ sưu tập
- kết hợp
- kết hợp
- đến
- Giao tiếp
- hoàn thành
- Cấu hình
- Hãy xem xét
- không thay đổi
- chứa
- Container
- chứa
- bối cảnh
- theo ngữ cảnh
- liên tục
- điều khiển
- điều khiển
- Tiện lợi
- Conversation
- Tương ứng
- Chi phí
- tạo
- tạo ra
- Sáng tạo
- quan trọng
- văn hóa
- Cup
- khách hàng
- tùy biến
- tùy chỉnh
- dữ liệu
- bảo mật dữ liệu
- de
- dành riêng
- Mặc định
- định nghĩa
- triển khai
- triển khai
- triển khai
- triển khai
- triển khai
- lấy được
- mong muốn
- khu
- chi tiết
- chi tiết
- Nhà phát triển
- Phát triển
- Đối thoại
- sự khác biệt
- khác nhau
- bữa tối
- khám phá
- SỰ ĐA DẠNG
- do
- doesn
- làm
- don
- thực hiện
- tăng gấp đôi
- xuống
- suốt trong
- Tối tăm
- e
- mỗi
- dễ dàng
- những nỗ lực
- cho phép
- cho phép
- cuối
- Cuối cùng đến cuối
- Điểm cuối
- ky sư
- Kỹ Sư
- Tiếng Anh
- đủ
- đảm bảo
- Môi trường
- Ngay cả
- Mỗi
- mọi người
- ví dụ
- ví dụ
- kích thích
- kinh nghiệm
- công bằng
- sai
- nổi tiếng
- xa
- kỳ
- đặc sắc
- Tính năng
- Đôi chân
- vài
- phim
- cuối cùng
- Tìm kiếm
- Tên
- hương thơm
- Phao
- dòng chảy
- tiếp theo
- Chân
- Trong
- định dạng
- Nền tảng
- 4
- Nước pháp
- Tiếng Pháp
- tươi
- từ
- Tổng Quát
- Thuyết tương đối rộng
- tạo ra
- tạo ra
- thế hệ
- thế hệ
- nhẹ nhàng
- Tiếng Đức
- được
- ly
- Go
- đi
- dần dần
- tuyệt vời
- đột phá
- hướng dẫn
- hướng dẫn
- xảy ra
- đã xảy ra
- Cứng
- công việc khó khăn
- Có
- khỏe mạnh
- giúp đỡ
- giúp đỡ
- tại đây
- cao hơn
- lịch sử
- lịch sử
- tổ chức
- Trang Chủ
- giờ
- nhà ở
- Độ đáng tin của
- Hướng dẫn
- HTML
- HTTPS
- Hub
- trung tâm
- i
- mang tính biểu tượng
- if
- ii
- nhập khẩu
- ấn tượng
- cải thiện
- cải tiến
- in
- bao gồm
- Bao gồm
- Tăng lên
- tăng
- tăng
- thông tin
- Cơ sở hạ tầng
- đầu vào
- ví dụ
- ngay lập tức
- tích hợp
- Giao thức
- trong
- ireland
- bị cô lập
- IT
- ITS
- jpg
- chỉ
- Giữ
- Biết
- nổi tiếng
- hạ cánh
- Các địa danh
- Ngôn ngữ
- lớn nhất
- phóng
- Luật
- LEARN
- học tập
- trái
- Chiều dài
- Giấy phép
- Cuộc sống
- Nâng
- ánh sáng
- nhẹ hơn
- Lượt thích
- Dòng
- Chức năng
- văn chương
- ít
- sống
- cuộc sống
- Loài đà mã ở nam mỹ
- nằm
- NHÌN
- Rất nhiều
- thấp hơn
- thực hiện
- làm cho
- Làm
- giám đốc
- cách thức
- thủ công
- nhiều
- Marketing
- tối đa
- tối đa
- Có thể..
- có nghĩa là
- tin nhắn
- Siêu dữ liệu
- nửa đêm
- Phút
- máy trộn
- hỗn hợp
- ML
- MLOps
- kiểu mẫu
- mô hình
- Màn Hình
- chi tiết
- hầu hết
- Phổ biến nhất
- nhiều
- viện bảo tàng
- Viện Bảo tàng
- Được đặt theo tên
- Cần
- cần thiết
- mạng
- Mới
- tiếp theo
- đêm
- Không
- máy tính xách tay
- tại
- con số
- NY
- quan sát
- quan sát viên
- xảy ra
- of
- cung cấp
- cung cấp
- Cung cấp
- thường
- Ohio
- Dầu
- on
- ONE
- có thể
- mở ra
- tối ưu
- tối ưu hóa
- Tùy chọn
- or
- gọi món
- Oregon
- Khác
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- mang
- ra
- đầu ra
- kết quả đầu ra
- kết thúc
- trang
- tham số
- thông số
- paris
- một phần
- Thực hiện
- hiệu suất
- Vật lý
- mảnh
- Nơi
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- chơi
- xin vui lòng
- điều luật
- Phổ biến
- Bài đăng
- Predictor
- chuẩn bị
- trước
- Hiệu trưởng
- thủ tục
- quá trình
- Sản phẩm
- giám đốc sản xuất
- Profiles
- Tiến độ
- nhắc nhở
- Đề xuất
- cho
- cung cấp
- nhà cung cấp
- cung cấp
- công khai
- giao thông công cộng
- công khai
- mục đích
- đặt
- Python
- câu hỏi
- Câu hỏi
- ngẫu nhiên
- phạm vi
- Giá
- RE
- đạt
- lý do
- công thức
- đề nghị
- Giảm
- xem
- từ chối
- liên quan
- vùng
- thuyết tương đối
- yêu cầu
- tài nguyên
- Thông tin
- phản ứng
- Kết quả
- Sông
- Vai trò
- vai trò
- lãng mạn
- Phòng
- chạy
- chạy
- s
- nhà làm hiền triết
- Đường ống SageMaker
- muối
- tương tự
- mẫu
- nói
- Nhà khoa học
- sdk
- Tìm kiếm
- tìm kiếm
- Thứ hai
- Phần
- an toàn
- an ninh
- xem
- chọn
- lựa chọn
- lựa chọn
- cao cấp
- tình cảm
- DỊCH VỤ
- phục vụ
- định
- một số
- Hình dạng
- bắn
- nên
- hiển thị
- cho thấy
- Chương trình
- tắt
- có ý nghĩa
- Đơn giản
- đơn giản
- duy nhất
- Các trang web
- Kích thước máy
- kích thước
- chậm
- chậm rãi
- trơn tru
- So
- cho đến nay
- Phần mềm
- phát triển phần mềm
- giải pháp
- Giải pháp
- một số
- Tia sáng
- đặc biệt
- chuyên gia
- quy định
- xác định
- tốc độ
- Spot
- đứng
- đứng
- Bắt đầu
- bắt đầu
- Bang
- vững chắc
- Các bước
- Dừng
- dừng lại
- dòng
- Chuỗi
- cấu trúc
- phòng thu
- Stunning
- tiếp theo
- đáng kể
- Thành công
- như vậy
- hỗ trợ
- Hỗ trợ
- chắc chắn
- biểu tượng
- hệ thống
- bàn
- thợ may
- Hãy
- mất
- dùng
- nhiệm vụ
- hương vị
- nhóm
- mẫu
- về
- văn bản
- cảm tạ
- việc này
- Sản phẩm
- Thủ đô
- thế giới
- sau đó
- lý thuyết
- Đó
- Kia là
- họ
- mong
- điều này
- hàng ngàn
- Thông qua
- thời gian
- đến
- bây giờ
- bên nhau
- mã thông báo
- Tokens
- tokyo
- quá
- công cụ
- hàng đầu
- Tổng số:
- Chuyến du lịch
- Tháp
- Hội thảo
- biến áp
- dịch
- Dịch
- giao thông vận tải
- hai
- kiểu
- loại
- ui
- Dưới
- độc đáo
- cho đến khi
- Cập nhật
- sử dụng
- ca sử dụng
- người sử dang
- sử dụng
- sử dụng
- Quý báu
- Các giá trị
- biến thể
- nhiều
- khác nhau
- phiên bản
- rất
- thông qua
- Lượt xem
- virginia
- trực quan
- khối lượng
- vs
- đi bộ
- muốn
- chiến tranh
- là
- Nước
- cách
- we
- web
- các dịch vụ web
- Dựa trên web
- đám cưới
- TỐT
- đi
- Điều gì
- khi nào
- cái nào
- trong khi
- trắng
- tại sao
- sẽ
- cửa sổ
- RƯỢU NHO
- với
- tự hỏi
- Từ
- từ
- Công việc
- thế giới
- Bạn
- trên màn hình
- zephyrnet