Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon

Các doanh nghiệp tìm cách khai thác tiềm năng của Machine Learning (ML) để giải quyết các vấn đề phức tạp và cải thiện kết quả. Cho đến gần đây, việc xây dựng và triển khai các mô hình ML đòi hỏi kỹ năng kỹ thuật và mã hóa ở mức độ sâu, bao gồm điều chỉnh các mô hình ML và duy trì quy trình vận hành. Kể từ khi được giới thiệu vào năm 2021, Canvas SageMaker của Amazon đã cho phép các nhà phân tích kinh doanh xây dựng, triển khai và sử dụng nhiều mô hình ML khác nhau - bao gồm dạng bảng, thị giác máy tính và xử lý ngôn ngữ tự nhiên - mà không cần viết một dòng mã. Điều này đã đẩy nhanh khả năng các doanh nghiệp áp dụng ML vào các trường hợp sử dụng như dự báo chuỗi thời gian, dự đoán tỷ lệ rời bỏ khách hàng, phân tích cảm tính, phát hiện lỗi công nghiệp và nhiều trường hợp khác.

Như đã thông báo trên 5 Tháng Mười , SageMaker Canvas đã mở rộng hỗ trợ mô hình sang mô hình nền tảng (FM) – mô hình ngôn ngữ lớn được sử dụng để tạo và tóm tắt nội dung. Với Ngày phát hành ngày 12 tháng 2023 năm XNUMX, SageMaker Canvas cho phép người dùng đặt câu hỏi và nhận câu trả lời dựa trên dữ liệu doanh nghiệp của họ. Điều này đảm bảo rằng các kết quả mang tính cụ thể theo ngữ cảnh, mở ra các trường hợp sử dụng bổ sung trong đó ML không cần mã có thể được áp dụng để giải quyết các vấn đề kinh doanh. Ví dụ: các nhóm kinh doanh giờ đây có thể xây dựng các câu trả lời phù hợp với từ vựng và nguyên lý cụ thể của tổ chức, đồng thời có thể truy vấn các tài liệu dài nhanh hơn để nhận được câu trả lời cụ thể và có cơ sở cho nội dung của các tài liệu đó. Tất cả nội dung này được thực hiện một cách riêng tư và an toàn, đảm bảo rằng tất cả dữ liệu nhạy cảm đều được truy cập với sự quản trị và biện pháp bảo vệ phù hợp.

Để bắt đầu, quản trị viên đám mây sẽ định cấu hình và điền Amazon Kendra lập chỉ mục với dữ liệu doanh nghiệp làm nguồn dữ liệu cho SageMaker Canvas. Người dùng canvas chọn chỉ mục chứa tài liệu của họ và có thể lên ý tưởng, nghiên cứu và khám phá khi biết rằng kết quả đầu ra sẽ luôn được hỗ trợ bởi nguồn thông tin xác thực của họ. SageMaker Canvas sử dụng FM hiện đại từ nền tảng AmazonKhởi động Amazon SageMaker. Các cuộc trò chuyện có thể được bắt đầu bằng nhiều đài FM cạnh nhau, so sánh kết quả đầu ra và thực sự giúp mọi người có thể tiếp cận AI tổng quát.

Trong bài đăng này, chúng tôi sẽ xem xét tính năng được phát hành gần đây, thảo luận về kiến ​​trúc và trình bày hướng dẫn từng bước để cho phép SageMaker Canvas truy vấn tài liệu từ cơ sở kiến ​​thức của bạn, như minh họa trong ảnh chụp màn hình sau.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Tổng quan về giải pháp

Các mô hình nền tảng có thể tạo ra ảo giác – những phản hồi chung chung, mơ hồ, không liên quan hoặc không chính xác về mặt thực tế. Truy xuất thế hệ tăng cường (RAG) là một phương pháp thường được sử dụng để giảm ảo giác. Kiến trúc RAG được sử dụng để truy xuất dữ liệu từ bên ngoài FM, sau đó được sử dụng để thực hiện việc học trong ngữ cảnh nhằm trả lời truy vấn của người dùng. Điều này đảm bảo rằng FM có thể sử dụng dữ liệu từ cơ sở kiến ​​thức đáng tin cậy và sử dụng kiến ​​thức đó để trả lời câu hỏi của người dùng, giảm nguy cơ ảo giác.

Với RAG, dữ liệu bên ngoài FM và được sử dụng để tăng cường lời nhắc của người dùng có thể đến từ nhiều nguồn dữ liệu khác nhau, chẳng hạn như kho tài liệu, cơ sở dữ liệu hoặc API. Bước đầu tiên là chuyển đổi tài liệu của bạn và mọi truy vấn của người dùng sang định dạng tương thích để thực hiện tìm kiếm ngữ nghĩa phù hợp. Để làm cho các định dạng tương thích, một bộ sưu tập tài liệu hoặc thư viện kiến ​​thức và các truy vấn do người dùng gửi được chuyển đổi thành các biểu diễn số bằng cách sử dụng các mô hình nhúng.

Với bản phát hành này, chức năng RAG được cung cấp một cách liền mạch và không cần mã. Doanh nghiệp có thể làm phong phú thêm trải nghiệm trò chuyện trong Canvas với Amazon Kendra làm hệ thống quản lý kiến ​​thức cơ bản. Sơ đồ sau minh họa kiến ​​trúc giải pháp.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Việc kết nối SageMaker Canvas với Amazon Kendra yêu cầu thiết lập một lần. Chúng tôi mô tả chi tiết quá trình thiết lập trong Thiết lập Canvas để truy vấn tài liệu. Nếu bạn chưa thiết lập Miền SageMaker của mình, hãy tham khảo Tích hợp vào Miền Amazon SageMaker.

Là một phần của cấu hình miền, quản trị viên đám mây có thể chọn một hoặc nhiều chỉ mục Kendra mà nhà phân tích kinh doanh có thể truy vấn khi tương tác với FM thông qua SageMaker Canvas.

Sau khi các chỉ mục Kendra được cố định và định cấu hình, các nhà phân tích kinh doanh sẽ sử dụng chúng với SageMaker Canvas bằng cách bắt đầu một cuộc trò chuyện mới và chọn chuyển đổi “Tài liệu truy vấn”. Sau đó, SageMaker Canvas sẽ quản lý hoạt động giao tiếp cơ bản giữa Amazon Kendra và FM được lựa chọn để thực hiện các thao tác sau:

  1. Truy vấn các chỉ số Kendra với câu hỏi đến từ người dùng.
  2. Truy xuất các đoạn mã (và nguồn) từ các chỉ mục của Kendra.
  3. Thiết kế lời nhắc bằng các đoạn mã có truy vấn ban đầu để mô hình nền tảng có thể tạo ra câu trả lời từ các tài liệu được truy xuất.
  4. Cung cấp câu trả lời được tạo cho người dùng, cùng với các tham chiếu đến các trang/tài liệu được sử dụng để hình thành câu trả lời.

Thiết lập Canvas để truy vấn tài liệu

Trong phần này, chúng tôi sẽ hướng dẫn bạn các bước thiết lập Canvas để truy vấn các tài liệu được cung cấp thông qua chỉ mục Kendra. Bạn nên có những điều kiện tiên quyết sau:

  • Thiết lập tên miền SageMaker – Tích hợp vào Miền Amazon SageMaker
  • Tạo ra một chỉ số Kendra (hoặc nhiều hơn một)
  • Thiết lập trình kết nối Kendra Amazon S3 – làm theo hướng dẫn Trình kết nối Amazon S3 – và tải các tệp PDF và các tài liệu khác lên bộ chứa Amazon S3 được liên kết với chỉ mục Kendra
  • Thiết lập IAM để Canvas có các quyền thích hợp, bao gồm cả những quyền cần thiết để gọi các điểm cuối Amazon Bedrock và/hoặc SageMaker – hãy làm theo Thiết lập trò chuyện Canvas tài liệu hướng dẫn

Bây giờ bạn có thể cập nhật Miền để nó có thể truy cập các chỉ mục mong muốn. Trên bảng điều khiển SageMaker, đối với Miền nhất định, hãy chọn Chỉnh sửa trong tab Cài đặt miền. Bạn có thể tìm thấy nút chuyển đổi “Bật tài liệu truy vấn bằng Amazon Kendra” ở bước Cài đặt Canvas. Sau khi được kích hoạt, hãy chọn một hoặc nhiều chỉ mục Kendra mà bạn muốn sử dụng với Canvas.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Đó là tất cả những gì cần thiết để định cấu hình tính năng tài liệu truy vấn Canvas. Giờ đây, người dùng có thể tham gia cuộc trò chuyện trong Canvas và bắt đầu sử dụng cơ sở kiến ​​thức đã được gắn vào Miền thông qua chỉ mục Kendra. Những người duy trì cơ sở tri thức có thể tiếp tục cập nhật nguồn sự thật và với khả năng đồng bộ hóa trong Kendra, người dùng trò chuyện sẽ tự động có thể sử dụng thông tin cập nhật một cách liền mạch.

Sử dụng tính năng Tài liệu truy vấn để trò chuyện

Là người dùng SageMaker Canvas, tính năng Tài liệu truy vấn có thể được truy cập từ trong cuộc trò chuyện. Để bắt đầu phiên trò chuyện, hãy nhấp hoặc tìm kiếm nút “Tạo, trích xuất và tóm tắt nội dung” từ tab Mô hình sẵn sàng sử dụng trong SageMaker Canvas.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Khi đó, bạn có thể bật và tắt Tài liệu truy vấn bằng nút chuyển đổi ở đầu màn hình. Kiểm tra lời nhắc thông tin để tìm hiểu thêm về tính năng này.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Khi Tài liệu truy vấn được bật, bạn có thể chọn trong số danh sách các chỉ mục Kendra được quản trị viên đám mây bật.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Bạn có thể chọn một chỉ mục khi bắt đầu một cuộc trò chuyện mới. Sau đó, bạn có thể đặt câu hỏi trong UX với kiến ​​thức được lấy tự động từ chỉ mục đã chọn. Lưu ý rằng sau khi cuộc trò chuyện bắt đầu dựa trên một chỉ mục cụ thể, bạn không thể chuyển sang chỉ mục khác.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Đối với các câu hỏi được hỏi, cuộc trò chuyện sẽ hiển thị câu trả lời do FM tạo ra cùng với các tài liệu nguồn góp phần tạo ra câu trả lời. Khi nhấp vào bất kỳ tài liệu nguồn nào, Canvas sẽ mở bản xem trước của tài liệu, đánh dấu đoạn trích được FM sử dụng.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Kết luận

AI đàm thoại có tiềm năng to lớn để thay đổi trải nghiệm của khách hàng và nhân viên bằng cách cung cấp cho trợ lý giống con người các tương tác tự nhiên và trực quan như:

  • Thực hiện nghiên cứu về một chủ đề hoặc tìm kiếm và duyệt qua cơ sở kiến ​​thức của tổ chức
  • Tóm tắt khối lượng nội dung để nhanh chóng thu thập thông tin chi tiết
  • Tìm kiếm Thực thể, Tình cảm, PII và dữ liệu hữu ích khác, đồng thời tăng giá trị kinh doanh của nội dung phi cấu trúc
  • Tạo bản thảo cho các tài liệu và thư từ kinh doanh
  • Tạo các bài viết kiến ​​thức từ các nguồn nội bộ khác nhau (sự cố, nhật ký trò chuyện, wiki)

Sự tích hợp sáng tạo của giao diện trò chuyện, truy xuất kiến ​​thức và FM cho phép doanh nghiệp cung cấp câu trả lời chính xác, phù hợp cho các câu hỏi của người dùng bằng cách sử dụng kiến ​​thức miền và nguồn sự thật của họ.

Bằng cách kết nối SageMaker Canvas với cơ sở kiến ​​thức trong Amazon Kendra, các tổ chức có thể lưu giữ dữ liệu độc quyền của mình trong môi trường riêng trong khi vẫn được hưởng lợi từ khả năng ngôn ngữ tự nhiên tiên tiến của FM. Với việc ra mắt tính năng Tài liệu truy vấn của SageMaker Canvas, chúng tôi đang giúp mọi doanh nghiệp dễ dàng sử dụng LLM và kiến ​​thức doanh nghiệp của họ làm nguồn thông tin xác thực để mang lại trải nghiệm trò chuyện an toàn. Tất cả chức năng này đều có sẵn ở định dạng không cần mã, cho phép doanh nghiệp tránh phải xử lý các tác vụ lặp đi lặp lại và không chuyên biệt.

Để tìm hiểu thêm về SageMaker Canvas và cách nó giúp mọi người bắt đầu với Machine Learning dễ dàng hơn, hãy xem phần Thông báo về SageMaker Canvas. Tìm hiểu thêm về cách SageMaker Canvas giúp thúc đẩy sự cộng tác giữa các nhà khoa học dữ liệu và nhà phân tích kinh doanh bằng cách đọc Xây dựng, chia sẻ và triển khai bài đăng. Cuối cùng, để tìm hiểu cách tạo quy trình làm việc Thế hệ tăng cường truy xuất của riêng bạn, hãy tham khảo SageMaker JumpStart RAG.

dự án

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Thế hệ tăng cường truy xuất cho các nhiệm vụ NLP chuyên sâu về tri thức. Những tiến bộ trong hệ thống xử lý thông tin thần kinh, 33, 9459-9474.


Về các tác giả

Ảnh của DavideDavide Gallitelli là Kiến trúc sư giải pháp chuyên môn cao cấp về AI/ML. Anh ấy có trụ sở tại Brussels và hợp tác chặt chẽ với các khách hàng trên toàn cầu đang muốn áp dụng các công nghệ Machine Learning Mã thấp/Không mã và AI sáng tạo. Anh ấy là một nhà phát triển từ khi còn rất nhỏ, bắt đầu viết mã từ năm 7 tuổi. Anh ấy bắt đầu học AI/ML ở trường đại học và yêu thích nó kể từ đó.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.song phương Alam là Kiến trúc sư giải pháp doanh nghiệp tại AWS, tập trung vào ngành Dịch vụ tài chính. Trong hầu hết các ngày, Bilal sẽ giúp khách hàng xây dựng, nâng cao và bảo mật môi trường AWS để triển khai khối lượng công việc quan trọng nhất của họ. Ông có nhiều kinh nghiệm trong lĩnh vực Telco, mạng và phát triển phần mềm. Gần đây hơn, anh ấy đang xem xét sử dụng AI/ML để giải quyết các vấn đề kinh doanh.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.Pashmeen là Giám đốc sản phẩm cấp cao tại AWS. Ngoài công việc, Pashmeen thích đi bộ mạo hiểm, chụp ảnh và dành thời gian cho gia đình.

Trao quyền cho người dùng doanh nghiệp của bạn để trích xuất thông tin chuyên sâu từ các tài liệu của công ty bằng cách sử dụng Amazon SageMaker Canvas Generative AI | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.Dan Sinnreich là Giám đốc sản phẩm cấp cao tại AWS, giúp dân chủ hóa việc học máy mã thấp/không mã. Trước AWS, Dan đã xây dựng và thương mại hóa các nền tảng SaaS dành cho doanh nghiệp cũng như các mô hình chuỗi thời gian được các nhà đầu tư tổ chức sử dụng để quản lý rủi ro và xây dựng danh mục đầu tư tối ưu. Ngoài công việc, người ta thấy anh ấy chơi khúc côn cầu, lặn biển và đọc khoa học viễn tưởng.

Dấu thời gian:

Thêm từ Học máy AWS