Hôm nay, chúng tôi vui mừng thông báo rằng Hỗn hợp-8x7B mô hình ngôn ngữ lớn (LLM), được phát triển bởi Mistral AI, có sẵn cho khách hàng thông qua Khởi động Amazon SageMaker để triển khai chỉ bằng một cú nhấp chuột để chạy suy luận. Mixtral-8x7B LLM là sự kết hợp thưa thớt được đào tạo trước của mô hình chuyên gia, dựa trên đường trục tham số 7 tỷ với tám chuyên gia trên mỗi lớp chuyển tiếp nguồn cấp dữ liệu. Bạn có thể dùng thử mô hình này với SageMaker JumpStart, một trung tâm máy học (ML) cung cấp quyền truy cập vào các thuật toán và mô hình để bạn có thể nhanh chóng bắt đầu với ML. Trong bài đăng này, chúng tôi hướng dẫn cách khám phá và triển khai mô hình Mixtral-8x7B.
Mixtral-8x7B là gì
Mixtral-8x7B là mô hình nền tảng được phát triển bởi Mistral AI, hỗ trợ văn bản tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Ý và tiếng Tây Ban Nha, với khả năng tạo mã. Nó hỗ trợ nhiều trường hợp sử dụng khác nhau như tóm tắt văn bản, phân loại, hoàn thành văn bản và hoàn thành mã. Nó hoạt động tốt trong chế độ trò chuyện. Để chứng minh khả năng tùy chỉnh đơn giản của mô hình, Mistral AI cũng đã phát hành mô hình hướng dẫn Mixtral-8x7B cho các trường hợp sử dụng trò chuyện, được tinh chỉnh bằng nhiều bộ dữ liệu hội thoại có sẵn công khai. Các mô hình Mixtral có độ dài ngữ cảnh lớn lên tới 32,000 mã thông báo.
Mixtral-8x7B cung cấp những cải tiến hiệu suất đáng kể so với các mẫu máy tiên tiến nhất trước đây. Sự kết hợp thưa thớt của kiến trúc chuyên gia cho phép nó đạt được kết quả hiệu suất tốt hơn trên 9 trên 12 điểm chuẩn xử lý ngôn ngữ tự nhiên (NLP) được thử nghiệm bởi trí tuệ nhân tạo. Mixtral phù hợp hoặc vượt quá hiệu suất của các mô hình gấp 10 lần kích thước của nó. Bằng cách chỉ sử dụng một phần nhỏ tham số trên mỗi mã thông báo, nó đạt được tốc độ suy luận nhanh hơn và chi phí tính toán thấp hơn so với các mô hình dày đặc có kích thước tương đương—ví dụ: với tổng số 46.7 tỷ tham số nhưng chỉ có 12.9 tỷ tham số được sử dụng cho mỗi mã thông báo. Sự kết hợp giữa hiệu suất cao, hỗ trợ đa ngôn ngữ và hiệu quả tính toán khiến Mixtral-8x7B trở thành lựa chọn hấp dẫn cho các ứng dụng NLP.
Mô hình này được cung cấp theo giấy phép Apache 2.0 cho phép sử dụng mà không bị hạn chế.
Khởi động SageMaker là gì
Với SageMaker JumpStart, những người thực hành ML có thể chọn từ danh sách ngày càng nhiều các mô hình nền tảng hoạt động tốt nhất. Những người thực hành ML có thể triển khai các mô hình nền tảng cho các mục đích chuyên dụng Amazon SageMaker các phiên bản trong môi trường mạng biệt lập và tùy chỉnh các mô hình bằng SageMaker để đào tạo và triển khai mô hình.
Bây giờ bạn có thể khám phá và triển khai Mixtral-8x7B chỉ bằng vài cú nhấp chuột trong Xưởng sản xuất Amazon SageMaker hoặc lập trình thông qua SageMaker Python SDK, cho phép bạn lấy được hiệu suất mô hình và các điều khiển MLOps bằng các tính năng của SageMaker như Đường ống Amazon SageMaker, Trình gỡ lỗi Amazon SageMakerhoặc nhật ký vùng chứa. Mô hình này được triển khai trong môi trường bảo mật AWS và dưới sự kiểm soát VPC của bạn, giúp đảm bảo tính bảo mật dữ liệu.
Khám phá các mô hình
Bạn có thể truy cập các mô hình nền tảng Mixtral-8x7B thông qua SageMaker JumpStart trong giao diện người dùng SageMaker Studio và SageMaker Python SDK. Trong phần này, chúng ta sẽ tìm hiểu cách khám phá các mô hình trong SageMaker Studio.
SageMaker Studio là một môi trường phát triển tích hợp (IDE) cung cấp một giao diện trực quan dựa trên web duy nhất, nơi bạn có thể truy cập các công cụ chuyên dụng để thực hiện tất cả các bước phát triển ML, từ chuẩn bị dữ liệu đến xây dựng, đào tạo và triển khai các mô hình ML của bạn. Để biết thêm chi tiết về cách bắt đầu và thiết lập SageMaker Studio, hãy tham khảo Xưởng sản xuất Amazon SageMaker.
Trong SageMaker Studio, bạn có thể truy cập SageMaker JumpStart bằng cách chọn Khởi động trong khung điều hướng.
Từ trang đích SageMaker JumpStart, bạn có thể tìm kiếm “Mixtral” trong hộp tìm kiếm. Bạn sẽ thấy kết quả tìm kiếm hiển thị Mixtral 8x7B và Mixtral 8x7B Instruct.
Bạn có thể chọn thẻ mô hình để xem thông tin chi tiết về mô hình như giấy phép, dữ liệu dùng để đào tạo và cách sử dụng. Bạn cũng sẽ tìm thấy Triển khai mà bạn có thể sử dụng để triển khai mô hình và tạo điểm cuối.
Triển khai một mô hình
Triển khai bắt đầu khi bạn chọn Triển khai. Sau khi triển khai kết thúc, điểm cuối của bạn đã được tạo. Bạn có thể kiểm tra điểm cuối bằng cách chuyển trọng tải yêu cầu suy luận mẫu hoặc chọn tùy chọn thử nghiệm bằng SDK. Khi chọn tùy chọn sử dụng SDK, bạn sẽ thấy mã mẫu mà bạn có thể sử dụng trong trình chỉnh sửa sổ ghi chép ưa thích của mình trong SageMaker Studio.
Để triển khai bằng SDK, chúng tôi bắt đầu bằng cách chọn mô hình Mixtral-8x7B, được chỉ định bởi model_id with value huggingface-llm-mixtral-8x7b
. Bạn có thể triển khai bất kỳ mô hình nào đã chọn trên SageMaker bằng mã sau. Tương tự, bạn có thể triển khai hướng dẫn Mixtral-8x7B bằng ID model của chính nó:
Việc này sẽ triển khai mô hình trên SageMaker với các cấu hình mặc định, bao gồm loại phiên bản mặc định và cấu hình VPC mặc định. Bạn có thể thay đổi các cấu hình này bằng cách chỉ định các giá trị không mặc định trong JumpStartMô hình.
Sau khi triển khai, bạn có thể chạy suy luận dựa trên điểm cuối đã triển khai thông qua bộ dự đoán SageMaker:
Lời nhắc ví dụ
Bạn có thể tương tác với mô hình Mixtral-8x7B giống như bất kỳ mô hình tạo văn bản tiêu chuẩn nào, trong đó mô hình xử lý chuỗi đầu vào và xuất ra các từ tiếp theo được dự đoán trong chuỗi. Trong phần này, chúng tôi cung cấp lời nhắc ví dụ.
Tạo mã
Sử dụng ví dụ trước, chúng ta có thể sử dụng lời nhắc tạo mã như sau:
Bạn nhận được đầu ra sau:
Lời nhắc phân tích tình cảm
Bạn có thể thực hiện phân tích cảm tính bằng lời nhắc như sau với Mixtral 8x7B:
Bạn nhận được đầu ra sau:
Gợi ý trả lời câu hỏi
Bạn có thể sử dụng lời nhắc trả lời câu hỏi như sau với Mixtral-8x7B:
Bạn nhận được đầu ra sau:
Hướng dẫn Mixtral-8x7B
Phiên bản được điều chỉnh theo hướng dẫn của Mixtral-8x7B chấp nhận các hướng dẫn được định dạng trong đó vai trò hội thoại phải bắt đầu bằng lời nhắc của người dùng và xen kẽ giữa hướng dẫn người dùng và trợ lý (câu trả lời mẫu). Định dạng hướng dẫn phải được tôn trọng nghiêm ngặt, nếu không mô hình sẽ tạo ra kết quả đầu ra dưới mức tối ưu. Mẫu được sử dụng để xây dựng lời nhắc cho mô hình Instruct được xác định như sau:
Lưu ý rằng <s>
và </s>
là các mã thông báo đặc biệt cho đầu chuỗi (BOS) và cuối chuỗi (EOS), trong khi [INST]
và [/INST]
là các chuỗi thông thường.
Đoạn mã sau cho thấy cách bạn có thể định dạng lời nhắc ở định dạng hướng dẫn:
Truy xuất kiến thức
Bạn có thể sử dụng mã sau đây cho lời nhắc truy xuất kiến thức:
Bạn nhận được đầu ra sau:
Lập trình
Các mô hình Mixtral có thể chứng minh sức mạnh được đánh giá chuẩn cho các tác vụ mã hóa, như được hiển thị trong đoạn mã sau:
Toán học và lý luận
Các mô hình hỗn hợp cũng báo cáo điểm mạnh về độ chính xác trong toán học:
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/mixtral-8x7b-is-now-available-in-amazon-sagemaker-jumpstart/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 000
- 1
- 10
- 100
- 11
- 12
- 120
- 13
- 130
- 14
- 15%
- 16
- 17
- 1M
- 200
- 25
- 26%
- 30
- 32
- 50
- 600
- 7
- 72
- 8
- 9
- a
- khả năng
- Giới thiệu
- ở trên
- tăng tốc
- Chấp nhận
- truy cập
- Trợ Lý Giám Đốc
- chính xác
- Đạt được
- Đạt được
- ngang qua
- hoạt động
- thêm
- thêm
- Sau
- chống lại
- AI
- AI / ML
- thuật toán
- Tất cả
- Ngoài ra
- đàn bà gan dạ
- Amazon SageMaker
- Khởi động Amazon SageMaker
- Amazon Web Services
- số lượng
- an
- phân tích
- và
- và cơ sở hạ tầng
- Thông báo
- trả lời
- bất kì
- Apache
- hấp dẫn
- các ứng dụng
- áp dụng
- Nộp đơn
- kiến trúc
- LÀ
- đối số
- bài viết
- AS
- Trợ lý
- At
- có sẵn
- AWS
- trở lại
- Xương sống
- dựa
- bash
- ắc quy
- Bayesian
- BE
- bởi vì
- được
- trước
- Bắt đầu
- tin
- Chuông
- điểm chuẩn
- Điểm chuẩn
- Hơn
- giữa
- Hóa đơn
- thanh toán
- Tỷ
- đậm
- mua
- Hộp
- Nghỉ giải lao
- mang lại
- xây dựng
- Xây dựng
- được xây dựng trong
- kinh doanh
- nhưng
- by
- tính toán
- cuộc gọi
- gọi là
- Cuộc gọi
- CAN
- thẻ
- trường hợp
- trường hợp
- thay đổi
- trò chuyện trên mạng
- sự lựa chọn
- Chọn
- lựa chọn
- Chris
- phân loại
- Nhấp chuột
- mã
- Lập trình
- kết hợp
- so
- biên soạn
- hoàn thành
- tính toán
- Tính
- máy tính
- Tầm nhìn máy tính
- hội nghị
- liên tục
- Container
- nội dung
- bối cảnh
- liên tiếp
- liên tục
- điều khiển
- Conversation
- Phí Tổn
- Chi phí
- có thể
- tạo
- tạo ra
- quan trọng
- Cup
- Current
- khách hàng
- tùy biến
- tùy chỉnh
- dữ liệu
- bảo mật dữ liệu
- bộ dữ liệu
- ngày
- Ngày
- dành riêng
- Mặc định
- xác định
- Dân chủ hóa
- chứng minh
- triển khai
- triển khai
- triển khai
- triển khai
- triển khai
- lấy được
- chi tiết
- phát triển
- phát triển
- Nhà phát triển
- Phát triển
- DICT
- ĐÃ LÀM
- khám phá
- do
- làm
- đô la
- lĩnh vực
- thực hiện
- xuống
- Rơi
- Duke
- đại học công tước
- mỗi
- Kinh tế
- biên tập viên
- hiệu quả
- Trứng
- khác
- cho phép
- cho phép
- cho phép
- cuối
- Điểm cuối
- Kỹ Sư
- Tiếng Anh
- đảm bảo
- Môi trường
- EOS
- như nhau
- Tương đương
- đạo đức
- ví dụ
- vượt quá
- kích thích
- loại trừ
- chuyên gia
- các chuyên gia
- Giải thích
- giải thích
- mở rộng
- gia đình
- nhanh hơn
- Tính năng
- vài
- Các tập tin
- bộ lọc
- Tìm kiếm
- Tên
- tiếp theo
- sau
- Trong
- định dạng
- Nền tảng
- phân số
- Tiếng Pháp
- từ
- chức năng
- tương lai
- mục đích chung
- tạo ra
- tạo ra
- thế hệ
- thế hệ
- Trí tuệ nhân tạo
- Tiếng Đức
- được
- Go
- tốt
- có
- Phát triển
- ghét
- Có
- he
- giúp đỡ
- giúp đỡ
- giúp
- cô
- tại đây
- Cao
- Hills
- của mình
- Độ đáng tin của
- Hướng dẫn
- HTML
- HTTPS
- Hub
- i
- ICE
- kem
- ID
- if
- Illinois
- bệnh
- nhập khẩu
- quan trọng
- nâng cao
- cải tiến
- in
- bao gồm
- Bao gồm
- Hợp nhất
- Cơ sở hạ tầng
- đầu vào
- đầu vào
- ví dụ
- hướng dẫn
- tích hợp
- tích hợp
- tương tác
- lợi ích
- Giao thức
- Phát minh
- bị cô lập
- IT
- người Ý
- ITS
- chính nó
- jpg
- trẻ em
- kiến thức
- kyle
- Phòng thí nghiệm
- hạ cánh
- Ngôn ngữ
- lớn
- Họ
- lớp
- Dẫn
- học tập
- Chiều dài
- cho phép
- Giấy phép
- Lượt thích
- Lượt thích
- giới hạn
- LINK
- Danh sách
- Listening
- ít
- LLM
- logic
- tìm kiếm
- thấp hơn
- máy
- học máy
- thực hiện
- LÀM CHO
- Làm
- giám đốc
- nhiều
- diêm
- toán học
- toán học
- me
- trung bình
- hỗn hợp
- ML
- MLOps
- Chế độ
- kiểu mẫu
- mô hình
- sửa đổi
- tháng
- chi tiết
- xe mô tô
- nhiều
- nhân
- Âm nhạc
- phải
- my
- Tự nhiên
- Xử lý ngôn ngữ tự nhiên
- THÔNG TIN
- tiêu cực
- mạng
- Neutral
- Mới
- tiếp theo
- nlp
- Không áp dụng
- ghi
- máy tính xách tay
- tại
- con số
- of
- Dầu
- on
- hàng loạt
- ONE
- có thể
- hoạt động
- hệ điều hành
- Tùy chọn
- or
- Nền tảng khác
- nếu không thì
- ra
- đầu ra
- kết quả đầu ra
- bên ngoài
- kết thúc
- riêng
- trang
- thanh toán
- cửa sổ
- giấy tờ
- tham số
- thông số
- Đi qua
- niềm đam mê
- đam mê
- đường dẫn
- mỗi
- Thực hiện
- hiệu suất
- Bằng tiến sĩ
- điện thoại
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Điểm
- di động
- tích cực
- Bài đăng
- trước
- dự đoán
- Predictor
- ưa thích
- chuẩn bị
- trước
- Hiệu trưởng
- In
- thủ tục
- quá trình
- Quy trình
- xử lý
- Sản phẩm
- chương trình
- Lập trình
- nhắc nhở
- sự thịnh vượng
- cho
- nhà cung cấp
- cung cấp
- công khai
- công bố
- Python
- Quý
- câu hỏi
- Mau
- RE
- Reading
- công thức
- Đệ quy
- giảm
- xem
- đều đặn
- phát hành
- báo cáo
- yêu cầu
- nghiên cứu
- nhà nghiên cứu
- Thông tin
- tôn trọng
- phản ứng
- chịu trách nhiệm
- hạn chế
- kết quả
- Kết quả
- trở lại
- Trả về
- đi
- Nguy cơ
- Vai trò
- vai trò
- Phòng
- chạy
- chạy
- s
- SA
- nhà làm hiền triết
- muối
- khả năng mở rộng
- Quy mô
- Khoa học
- Nhà khoa học
- sdk
- Tìm kiếm
- Phần
- an toàn
- an ninh
- xem
- chọn
- chọn
- lựa chọn
- lựa chọn
- cao cấp
- tình cảm
- riêng biệt
- Trình tự
- Loạt Sách
- DỊCH VỤ
- định
- cho thấy
- thể hiện
- Chương trình
- có ý nghĩa
- Tương tự
- Đơn giản
- kể từ khi
- duy nhất
- Kích thước máy
- So
- Mạng xã hội
- Xã hội
- Phần mềm
- giải pháp
- Tiếng Tây Ban Nha
- đặc biệt
- chuyên gia
- quy định
- tốc độ
- Chi
- Tiêu chuẩn
- Bắt đầu
- bắt đầu
- bắt đầu
- nhà nước-of-the-art
- thống kê
- Bước
- Các bước
- Vẫn còn
- dừng lại
- hàng
- đơn giản
- Chiến lược
- dòng
- thế mạnh
- Chuỗi
- cấu trúc
- phòng thu
- như vậy
- hỗ trợ
- Hỗ trợ
- Hỗ trợ
- hệ thống
- mất
- nhiệm vụ
- hương vị
- nhóm
- Công nghệ
- mẫu
- thử nghiệm
- thử nghiệm
- Kiểm tra
- văn bản
- việc này
- Sản phẩm
- Tương lai
- sau đó
- Kia là
- họ
- điều này
- Thông qua
- thời gian
- Chuỗi thời gian
- thời gian
- đến
- bên nhau
- mã thông báo
- Tokens
- quá
- công cụ
- Tổng số:
- Train
- Hội thảo
- đúng
- thử
- kêu riu ríu
- kiểu
- ui
- Dưới
- trường đại học
- unix
- mở khóa
- cho đến khi
- sử dụng
- ca sử dụng
- đã sử dụng
- người sử dang
- sử dụng
- sử dụng
- Bằng cách sử dụng
- thung lũng
- giá trị
- Các giá trị
- nhiều
- phiên bản
- Video
- Xem
- tầm nhìn
- Truy cập
- trực quan
- đi bộ
- là
- Nước
- we
- web
- các dịch vụ web
- Dựa trên web
- TỐT
- Điều gì
- Là gì
- khi nào
- trong khi
- cái nào
- trắng
- CHÚNG TÔI LÀ
- sẽ
- với
- ở trong
- không có
- từ
- Công việc
- sẽ
- viết
- viết
- Bạn
- trên màn hình
- zephyrnet