Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Mô hình LightOn Lyra-fr hiện đã có trên Amazon SageMaker

Chúng tôi rất vui mừng thông báo về sự sẵn có của mô hình nền tảng LightOn Lyra-fr dành cho khách hàng sử dụng Amazon SageMaker. LightOn là công ty đi đầu trong việc xây dựng các mô hình nền tảng chuyên về ngôn ngữ Châu Âu. Lyra-fr là một mô hình ngôn ngữ tiếng Pháp tiên tiến nhất có thể được sử dụng để xây dựng AI đàm thoại, công cụ viết quảng cáo, phân loại văn bản, tìm kiếm ngữ nghĩa, v.v. Bạn có thể dễ dàng thử mô hình này và sử dụng nó với Khởi động Amazon SageMaker. JumpStart là trung tâm máy học (ML) của SageMaker cung cấp quyền truy cập vào các mô hình nền tảng bên cạnh các thuật toán tích hợp sẵn và các mẫu giải pháp toàn diện để giúp bạn nhanh chóng bắt đầu với ML.

Trong blog này, chúng tôi sẽ trình bày cách sử dụng mô hình Lyra-fr trong SageMaker.

Mô hình nền tảng

Các mô hình nền tảng thường được đào tạo trên hàng tỷ tham số và có thể thích ứng với nhiều loại trường hợp sử dụng. Các mô hình nền tảng nổi tiếng nhất hiện nay được sử dụng để tóm tắt các bài viết, tạo tác phẩm nghệ thuật kỹ thuật số và tạo mã từ các hướng dẫn văn bản đơn giản. Các mô hình này tốn kém để đào tạo, vì vậy khách hàng muốn sử dụng các mô hình nền tảng được đào tạo trước hiện có và tinh chỉnh chúng khi cần thay vì tự đào tạo các mô hình này. SageMaker cung cấp một danh sách các mô hình được sắp xếp mà bạn có thể chọn trên bảng điều khiển SageMaker. Bạn có thể kiểm tra các mô hình này trực tiếp trên giao diện web. Khi bạn muốn sử dụng một mô hình nền tảng ở quy mô lớn, bạn có thể thực hiện dễ dàng mà không cần rời khỏi SageMaker bằng cách sử dụng sổ ghi chép dựng sẵn từ các nhà cung cấp mô hình. Vì các mô hình được lưu trữ và triển khai trên AWS nên bạn có thể yên tâm rằng dữ liệu của mình, dù được dùng để đánh giá hay sử dụng mô hình trên quy mô lớn, sẽ không bao giờ được chia sẻ với bên thứ ba.

Lyra-fr là mô hình ngôn ngữ tiếng Pháp lớn nhất hiện có trên thị trường. Nó là một mô hình 10 tỷ tham số, được LightOn huấn luyện và cho phép truy cập. Lyra-fr đã được đào tạo trên một kho dữ liệu lớn do Pháp quản lý và nó có khả năng viết văn bản giống như con người và giải quyết các nhiệm vụ phức tạp như phân loại, trả lời câu hỏi và tóm tắt. Tất cả những điều này trong khi vẫn duy trì tốc độ suy luận hợp lý, trong khoảng 1–2 giây cho yêu cầu trung bình. Bạn có thể chỉ cần mô tả nhiệm vụ bạn muốn thực hiện bằng ngôn ngữ tự nhiên và Lyra-fr sẽ tạo phản hồi ở cấp độ của một người nói tiếng Pháp bản ngữ. Lyra-fr cung cấp các nguyên mẫu thông minh sẵn sàng cho doanh nghiệp, chẳng hạn như tạo và phân loại văn bản có thể điều khiển được, chỉ trong một vài dòng mã. Đối với các nhiệm vụ khó khăn hơn, hiệu suất có thể được cải thiện trong chế độ học tập “vài lần thực hiện”, cung cấp lời nhắc một vài ví dụ đầu vào-đầu ra.

Sử dụng Lyra-fr trên SageMaker

Chúng tôi sẽ hướng dẫn bạn cách sử dụng mô hình Lyra-fr trong 3 bước đơn giản:

  • Khám phá – Tìm mô hình Lyra-fr trên Bảng điều khiển quản lý AWS dành cho SageMaker.
  • Thử nghiệm – Kiểm tra mô hình bằng giao diện web.
  • Triển khai – Sử dụng sổ ghi chép để triển khai và kiểm tra các khả năng nâng cao của mô hình.

Khám phá

Để dễ dàng khám phá các mô hình nền tảng như Lyra-fr, chúng tôi đã hợp nhất tất cả các mô hình nền tảng ở một nơi. Để tìm mô hình Lyra-fr:

  1. Đăng nhập vào Bảng điều khiển quản lý AWS dành cho SageMaker.
  2. Trên bảng điều hướng bên trái, bạn sẽ thấy một phần có tên Khởi động với Mô hình nền tảng dưới nó. Yêu cầu quyền truy cập vào tính năng này nếu bạn chưa có quyền truy cập.
  3. Sau khi tài khoản của bạn được đưa vào danh sách cho phép, bạn sẽ thấy danh sách các mẫu ở bên phải. Đây là nơi bạn sẽ tìm thấy mẫu Lyra-fr 10B.
  4. Bấm vào Xem mô hình sẽ hiển thị thẻ mô hình đầy đủ với các tùy chọn bổ sung.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Thử nghiệm

Trường hợp sử dụng phổ biến là chạy thử nghiệm đặc biệt để đảm bảo mô hình đáp ứng nhu cầu của bạn. Bạn có thể kiểm tra mô hình Lyra-fr trực tiếp từ bảng điều khiển SageMaker. Trong ví dụ này, chúng ta sẽ sử dụng một lời nhắc văn bản đơn giản bằng cách yêu cầu người mẫu tạo danh sách các ý tưởng bài viết cho chủ đề “màu nước” hoặc “l'aquarelle” bằng tiếng Pháp.

  1. Từ thẻ mô hình được hiển thị trong phần trước, chọn Dùng thử mô hình. Điều này sẽ mở một tab mới với giao diện thử nghiệm.
  2. Trên giao diện này, cung cấp kiểu nhập văn bản mà bạn muốn chuyển đến mô hình. Bạn cũng có thể điều chỉnh bất kỳ thông số nào bạn muốn bằng thanh trượt bên phải. Khi bạn đã hài lòng, hãy chọn Tạo văn bản.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Lưu ý rằng các mô hình nền tảng và đầu ra của chúng là của nhà cung cấp mô hình và AWS không chịu trách nhiệm về nội dung hoặc độ chính xác trong đó.

Triển khai

Các mô hình tạo văn bản hoạt động tốt nhất khi bạn cung cấp các ví dụ về thông tin mà bạn muốn mô hình cung cấp. Điều này được gọi là học ít lần. Chúng tôi sẽ trình diễn khả năng này bằng sổ ghi chép mẫu Lyra-fr. Sổ ghi chép mẫu hướng dẫn cách triển khai mô hình Lyra-fr trên SageMaker, cách tóm tắt và tạo văn bản cũng như học vài lần.

Nó cũng bao gồm các ví dụ về cách thực hiện các yêu cầu suy luận trực tiếp bằng cách sử dụng JSON hoặc bằng Lyra Python SDK. Lyra Python SDK đảm nhận việc định dạng đầu vào, gọi điểm cuối và giải nén đầu ra. Có một lớp cho mỗi điểm cuối: Tạo, Phân tích, Chọn, Nhúng, So sánh và Mã thông báo. Lưu ý rằng ví dụ này sử dụng phiên bản ml.p4d.24xlarge. Nếu giới hạn mặc định cho tài khoản AWS của bạn là 0, thì bạn cần yêu cầu tăng giới hạn cho phiên bản GPU này.

SageMaker cung cấp trải nghiệm sổ ghi chép được quản lý thông qua SageMaker Studio. Để biết chi tiết về cách thiết lập SageMaker Studio, hãy xem Hướng dẫn dành cho nhà phát triển Amazon SageMaker. Chúng tôi sẽ sao chép repo GitHub này vào SageMaker Studio trong bản trình diễn này, nhưng sổ ghi chép cũng sẽ hoạt động trong các môi trường khác.

Chúng ta hãy xem làm thế nào để chạy máy tính xách tay:

  1. Chuyển đến thẻ mô hình từ phần Khám phá trong bài đăng trên blog này và chọn xem sổ tay. Bạn sẽ thấy một tab mới được mở trong GitHub với sổ ghi chép Lyra-fr.
  2. Trong GitHub, chọn lightonmuse-sagemaker-sdk; điều này sẽ đưa bạn đến repo. chọn và sao chép URL HTTPS.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.
  3. Mở SageMaker Studio. Lựa chọn Sao chép kho lưu trữ và sau đó dán vào URL được sao chép ở trên.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.
  4. Điều hướng đến sổ ghi chép Lyra-fr bằng trình duyệt tệp ở bên trái.
  5. Sổ ghi chép này chạy từ đầu đến cuối mà không cần đầu vào bổ sung và cũng dọn dẹp các tài nguyên mà nó tạo ra. Chúng ta có thể xem ví dụ “sử dụng Tạo để phân tích tình cảm”. Ví dụ này sử dụng Lyra Python SDK và thể hiện phương pháp học từng bước bằng cách dạy mô hình với một vài ví dụ về văn bản nào nên được phân loại thành tích cực (positifs), tiêu cực (négatifs) hoặc hỗn hợp (mitigés).
  6. Bạn có thể thấy rằng, với Lyra Python SDK, tất cả những gì bạn phải làm là cung cấp tên của điểm cuối SageMaker và đầu vào. SDK xử lý tất cả quá trình phân tích cú pháp, định dạng và thiết lập cho bạn.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.
  7. Chạy dấu nhắc này sẽ trả về câu lệnh cuối cùng là câu khẳng định.
    Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Làm sạch

Sau khi bạn đã kiểm tra điểm cuối, hãy nhớ xóa điểm cuối suy luận SageMaker và xóa mô hình để tránh phát sinh phí.

Kết luận

Trong bài đăng này, chúng tôi đã hướng dẫn bạn cách khám phá, thử nghiệm và triển khai mô hình Lyra-fr bằng Amazon SageMaker. Yêu cầu quyền truy cập vào thử mô hình nền tảng trong SageMaker ngay hôm nay và cho chúng tôi biết phản hồi của bạn!


Giới thiệu về tác giả

Mô hình LightOn Lyra-fr hiện có sẵn trên Amazon SageMaker PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Iacopo Poli là CTO của LightOn, chịu trách nhiệm về các lựa chọn kỹ thuật chiến lược cho công ty trong việc xây dựng các mô hình ngôn ngữ rất lớn và cung cấp chúng cho công chúng. Anh ấy đam mê dân chủ hóa Machine Learning thông qua các giao diện trực quan. Trong thời gian rảnh rỗi, anh ấy thích tìm kiếm những nhà hàng tốt nhất ở Paris.

Alan TấnAlan Tấn là Giám đốc Sản phẩm Cấp cao của SageMaker, dẫn đầu nỗ lực về suy luận mô hình lớn. Anh ấy đam mê ứng dụng học máy vào lĩnh vực phân tích. Ngoài công việc, anh ấy thích hoạt động ngoài trời.

Dấu thời gian:

Thêm từ Học máy AWS