Bài đăng này được đồng viết với Anthony Medeiros, Giám đốc Giải pháp Kỹ thuật và Kiến trúc cho Trí tuệ nhân tạo Bắc Mỹ và Blake Santschi, Giám đốc Thông minh Kinh doanh của Schneider Electric. Các chuyên gia khác của Schneider Electric bao gồm Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson và Barbara Sleczkowski.
Hệ thống hoạch định nguồn lực doanh nghiệp (ERP) được các công ty sử dụng để quản lý một số chức năng kinh doanh như kế toán, bán hàng hoặc quản lý đơn hàng trong một hệ thống. Đặc biệt, chúng thường được sử dụng để lưu trữ thông tin liên quan đến tài khoản khách hàng. Các tổ chức khác nhau trong một công ty có thể sử dụng các hệ thống ERP khác nhau và việc hợp nhất chúng là một thách thức kỹ thuật phức tạp ở quy mô lớn, đòi hỏi kiến thức về miền cụ thể.
Schneider Electric là công ty đi đầu trong lĩnh vực chuyển đổi kỹ thuật số trong quản lý năng lượng và tự động hóa công nghiệp. Để phục vụ tốt nhất nhu cầu của khách hàng, Schneider Electric cần theo dõi các liên kết giữa các tài khoản của khách hàng có liên quan trong hệ thống ERP của họ. Khi cơ sở khách hàng của họ tăng lên, khách hàng mới được thêm hàng ngày và nhóm tài khoản của họ phải sắp xếp thủ công những khách hàng mới này và liên kết họ với thực thể chính phù hợp.
Quyết định liên kết dựa trên thông tin gần đây nhất được công bố công khai trên Internet hoặc trên các phương tiện truyền thông và có thể bị ảnh hưởng bởi các thương vụ mua lại, tin tức thị trường hoặc tái cơ cấu bộ phận gần đây. Một ví dụ về liên kết tài khoản là xác định mối quan hệ giữa Amazon và công ty con của nó, Whole Foods Market [nguồn].
Schneider Electric đang triển khai các mô hình ngôn ngữ lớn cho khả năng trả lời các câu hỏi trong nhiều lĩnh vực kiến thức cụ thể khác nhau, ngày đào tạo mô hình đang hạn chế kiến thức của nó. Họ đã giải quyết thách thức đó bằng cách sử dụng mô hình ngôn ngữ lớn nguồn mở thế hệ tăng cường Retriever có sẵn trên Khởi động Amazon SageMaker để xử lý một lượng lớn kiến thức bên ngoài được thu thập và thể hiện mối quan hệ công ty hoặc công cộng giữa các hồ sơ ERP.
Đầu năm 2023, khi Schneider Electric quyết định tự động hóa một phần quy trình liên kết tài khoản của mình bằng trí tuệ nhân tạo (AI), công ty đã hợp tác với Phòng thí nghiệm giải pháp máy học AWS (MLSL). Với chuyên môn của MLSL trong tư vấn và thực thi ML, Schneider Electric đã có thể phát triển kiến trúc AI giúp giảm bớt nỗ lực thủ công trong quy trình liên kết quy trình làm việc của họ và cung cấp khả năng truy cập dữ liệu nhanh hơn cho các nhóm phân tích tiếp theo của họ.
Trí tuệ nhân tạo
AI sáng tạo và các mô hình ngôn ngữ lớn (LLM) đang thay đổi cách các tổ chức kinh doanh có thể giải quyết các thách thức phức tạp truyền thống liên quan đến xử lý và hiểu ngôn ngữ tự nhiên. Một số lợi ích mà LLM mang lại bao gồm khả năng hiểu phần lớn văn bản và trả lời các câu hỏi liên quan bằng cách tạo ra các phản hồi giống con người. AWS giúp khách hàng dễ dàng thử nghiệm và sản xuất khối lượng công việc LLM bằng cách cung cấp nhiều tùy chọn thông qua Amazon SageMaker JumpStart, nền tảng Amazonvà người khổng lồ Amazon.
Thu thập kiến thức bên ngoài
LLM được biết đến với khả năng nén kiến thức của con người và đã thể hiện khả năng vượt trội trong việc trả lời các câu hỏi trong các lĩnh vực kiến thức cụ thể khác nhau, nhưng kiến thức của họ bị hạn chế theo ngày mô hình được đào tạo. Chúng tôi giải quyết vấn đề hạn chế thông tin đó bằng cách kết hợp LLM với API Google Tìm kiếm để cung cấp LLM tăng cường truy xuất (RAG) mạnh mẽ nhằm giải quyết các thách thức của Schneider Electric. RAG có thể xử lý lượng lớn kiến thức bên ngoài được lấy từ tìm kiếm của Google và thể hiện mối quan hệ công ty hoặc công cộng giữa các bản ghi ERP.
Xem ví dụ sau:
Câu hỏi: Công ty mẹ của One Medical là ai?
Truy vấn của Google: “One Medical parent company” → thông tin → LLM
Câu trả lời: One Medical, một công ty con của Amazon…
Ví dụ trước đó (lấy từ cơ sở dữ liệu khách hàng của Schneider Electric) liên quan đến một thương vụ mua lại diễn ra vào tháng 2023 năm XNUMX và do đó sẽ không bị LLM xử lý một mình do hạn chế về kiến thức. Việc tăng cường LLM bằng tìm kiếm của Google đảm bảo thông tin cập nhật nhất.
Mẫu bánh flan-T5
Trong dự án đó, chúng tôi đã sử dụng mô hình Flan-T5-XXL từ bánh flan-T5 gia đình người mẫu.
Các mẫu Flan-T5 được điều chỉnh theo hướng dẫn và do đó có khả năng thực hiện nhiều tác vụ NLP không cần bắn khác nhau. Trong nhiệm vụ tiếp theo của chúng tôi, không cần phải chứa một lượng lớn kiến thức thế giới mà thay vào đó là phải thực hiện tốt việc trả lời câu hỏi dựa trên bối cảnh văn bản được cung cấp thông qua kết quả tìm kiếm và do đó, mô hình T11 tham số 5B đã hoạt động tốt.
JumpStart cung cấp sự triển khai thuận tiện của họ mô hình này thông qua Xưởng sản xuất Amazon SageMaker và SDK SageMaker. Điều này bao gồm Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL và Flan-T5 XXL. Hơn nữa, JumpStart cung cấp một số phiên bản Flan-T5 XXL ở các mức độ lượng tử hóa khác nhau. Chúng tôi đã triển khai Flan-T5-XXL đến điểm cuối để suy luận bằng cách sử dụng Khởi động Amazon SageMaker Studio.
Truy xuất LLM tăng cường với LangChain
LangChain là framework phổ biến và phát triển nhanh chóng cho phép phát triển các ứng dụng được cung cấp bởi LLM. Nó dựa trên khái niệm về chuỗi, là sự kết hợp của các thành phần khác nhau được thiết kế để cải thiện chức năng của LLM cho một nhiệm vụ nhất định. Ví dụ, nó cho phép chúng ta tùy chỉnh nhắc nhở và tích hợp LLM với các công cụ khác nhau như công cụ tìm kiếm bên ngoài hoặc nguồn dữ liệu. Trong trường hợp sử dụng của chúng tôi, chúng tôi đã sử dụng Google Serper thành phần tìm kiếm trên web và triển khai mẫu Flan-T5-XXL có sẵn trên Khởi động Amazon SageMaker Studio. LangChain thực hiện việc điều phối tổng thể và cho phép các trang kết quả tìm kiếm được đưa vào phiên bản Flan-T5-XXL.
Thế hệ tăng cường truy xuất (RAG) bao gồm hai bước:
- Truy xuất các đoạn văn bản có liên quan từ các nguồn bên ngoài
- Mở rộng của các đoạn có ngữ cảnh trong lời nhắc được cung cấp cho LLM.
Đối với trường hợp sử dụng của Schneider Electric, RAG tiến hành như sau:
- Tên công ty đã cho được kết hợp với câu hỏi như “Ai là công ty mẹ của X”, trong đó X là công ty cụ thể) và được chuyển đến truy vấn Google bằng cách sử dụng Serper AI
- Thông tin được trích xuất được kết hợp với câu hỏi gợi ý và ban đầu và được chuyển đến LLM để có câu trả lời.
Sơ đồ sau đây minh họa quá trình này.
Sử dụng mã sau để tạo điểm cuối:
Khởi tạo công cụ tìm kiếm:
Trong đoạn mã sau, chúng ta xâu chuỗi các thành phần truy xuất và tăng cường lại với nhau:
Kỹ thuật nhanh chóng
Sự kết hợp giữa ngữ cảnh và câu hỏi được gọi là gợi ý. Chúng tôi nhận thấy rằng lời nhắc chung mà chúng tôi sử dụng (các biến thể xung quanh việc yêu cầu công ty mẹ) hoạt động tốt đối với hầu hết các khu vực công (tên miền) nhưng không khái quát hóa tốt cho giáo dục hoặc chăm sóc sức khỏe vì khái niệm công ty mẹ không có ý nghĩa ở đó. Đối với giáo dục, chúng tôi sử dụng “X” trong khi đối với chăm sóc sức khỏe, chúng tôi sử dụng “Y”.
Để kích hoạt tính năng lựa chọn lời nhắc dành riêng cho miền này, chúng tôi cũng phải xác định miền mà một tài khoản nhất định thuộc về. Để làm điều này, chúng tôi cũng đã sử dụng RAG trong đó có câu hỏi trắc nghiệm “Miền của {account} là gì?” là bước đầu tiên và dựa trên câu trả lời mà chúng tôi đã hỏi về nguồn gốc của tài khoản bằng cách sử dụng lời nhắc có liên quan ở bước thứ hai. Xem đoạn mã sau:
Các lời nhắc cụ thể theo ngành đã tăng hiệu suất tổng thể với độ chính xác từ 55% lên 71%. Nhìn chung, nỗ lực và thời gian đầu tư để phát triển hiệu quả nhắc nhở dường như cải thiện đáng kể chất lượng phản hồi LLM.
RAG với dữ liệu dạng bảng (SEC-10k)
Hồ sơ SEC 10K là một nguồn thông tin đáng tin cậy khác dành cho các công ty con và phân khu được các công ty giao dịch đại chúng nộp hàng năm. Những hồ sơ này có sẵn trực tiếp trên SEC EDGAR hay thông qua CorpXem API.
Chúng tôi giả định thông tin được đưa ra ở dạng bảng. Dưới đây là giả csv tập dữ liệu bắt chước định dạng ban đầu của tập dữ liệu SEC-10K. Có thể gộp nhiều csv nguồn dữ liệu vào khung dữ liệu gấu trúc kết hợp:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 1
- 10
- 100
- 10K
- 11
- 15 năm
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- có khả năng
- Có khả năng
- Giới thiệu
- ở trên
- sự trừu tượng
- đẩy nhanh tiến độ
- truy cập
- chứa
- Tài khoản
- Kế toán
- Trợ Lý Giám Đốc
- chính xác
- chính xác
- mua lại
- mua lại
- ngang qua
- Hoạt động
- thêm
- Ngoài ra
- thêm vào
- địa chỉ
- giải quyết
- địa chỉ
- lợi thế
- bị ảnh hưởng
- Đại lý
- AI
- AI / ML
- Cho phép
- cho phép
- cô đơn
- Ngoài ra
- đàn bà gan dạ
- Học máy Amazon
- Amazon SageMaker
- Khởi động Amazon SageMaker
- Amazon Web Services
- Mỹ
- trong số
- số lượng
- số lượng
- an
- phân tích
- và
- Hàng năm
- Một
- trả lời
- Anthony
- api
- xuất hiện
- các ứng dụng
- áp dụng
- Nộp đơn
- kiến trúc
- LÀ
- xung quanh
- nhân tạo
- trí tuệ nhân tạo
- Trí tuệ nhân tạo (AI)
- AS
- xin
- yêu cầu
- đảm đương
- At
- tăng
- tăng cường
- tự động hóa
- Tự động hóa
- có sẵn
- có sẵn trực tiếp
- AWS
- Học máy AWS
- Ngân hàng
- cơ sở
- dựa
- BE
- được
- trước
- thuộc
- phía dưới
- Lợi ích
- BEST
- giữa
- Khối
- Thúc đẩy mạnh mẽ
- Mang lại
- xây dựng
- Xây dựng
- kinh doanh
- chức năng kinh doanh
- kinh doanh thông minh
- nhưng
- by
- gọi là
- CAN
- khả năng
- có khả năng
- Carlson
- bị bắt
- chuỗi
- thách thức
- thách thức
- sự lựa chọn
- City
- Phân loại
- CNBC
- mã
- Cột
- kết hợp
- kết hợp
- kết hợp
- Các công ty
- công ty
- phức tạp
- thành phần
- các thành phần
- hiểu
- khái niệm
- Mối quan tâm
- bao gồm
- tư vấn
- người tiêu dùng
- bối cảnh
- Tiện lợi
- Doanh nghiệp
- tạo
- Tạo nên giá trị
- khách hàng
- khách hàng
- tiền thưởng
- dữ liệu
- truy cập dữ liệu
- hướng dữ liệu
- Cơ sở dữ liệu
- bộ dữ liệu
- Ngày
- David
- quyết định
- quyết định
- cung cấp
- phân phối
- chứng minh
- triển khai
- triển khai
- triển khai
- Thiết kế
- thiết kế
- chi tiết
- chi tiết
- phát triển
- phát triển
- Phát triển
- khác nhau
- kỹ thuật số
- chuyển đổi kỹ thuật số
- trực tiếp
- do
- tài liệu
- miền
- lĩnh vực
- hai
- Đầu
- dễ dàng
- Đào tạo
- nỗ lực
- Điện
- cho phép
- Điểm cuối
- năng lượng
- Kỹ Sư
- Động cơ
- đảm bảo
- vào
- doanh nghiệp
- thực thể
- ERP
- ví dụ
- thực hiện
- triển lãm
- kinh nghiệm
- thử nghiệm
- chuyên môn
- các chuyên gia
- thêm
- ngoài
- Exxon Mobil
- gia đình
- NHANH
- nhanh hơn
- Tháng Hai
- Fed
- vài
- nộp
- hồ sơ
- cuối cùng
- Tìm kiếm
- Tên
- Tập trung
- tập trung
- tiếp theo
- sau
- thực phẩm
- Trong
- định dạng
- Khung
- từ
- chức năng
- chức năng
- xa hơn
- Hơn nữa
- GAS
- thế hệ
- thế hệ
- Trí tuệ nhân tạo
- được
- Toàn cầu
- Tìm kiếm Google
- đồ thị
- Phát triển
- Phát triển
- bảo đảm
- có
- đã xảy ra
- Có
- he
- chăm sóc sức khỏe
- giúp
- cô
- cao hơn
- của mình
- Độ đáng tin của
- HTML
- http
- HTTPS
- Nhân loại
- i
- Xác định
- xác định
- minh họa
- nâng cao
- cải thiện
- in
- bao gồm
- bao gồm
- lồng ấp
- công nghiệp
- ngành công nghiệp
- thông tin
- ban đầu
- khả năng phán đoán
- đầu vào
- những hiểu biết
- ví dụ
- tích hợp
- Sự thông minh
- tương tác
- lợi ích
- Internet
- trong
- vốn đầu tư
- IT
- ITS
- joshua
- jpg
- Giữ
- Key
- Biết
- kiến thức
- nổi tiếng
- phòng thí nghiệm
- Ngôn ngữ
- lớn
- lớp
- lãnh đạo
- hàng đầu
- học tập
- niveaux
- đòn bẩy
- tiền
- Lượt thích
- Hạn chế
- hạn chế
- LINK
- liên kết
- liên kết
- LLM
- máy
- học máy
- duy trì
- LÀM CHO
- Làm
- quản lý
- quản lý
- giám đốc
- nhãn hiệu
- thủ công
- nhiều
- dấu
- thị trường
- Tin tức Thị trường
- có ý nghĩa
- Phương tiện truyền thông
- y khoa
- dữ liệu y tế
- đi
- sáp nhập
- phương pháp
- Might
- Chủ xưởng bột
- ML
- kiểu mẫu
- mô hình
- chi tiết
- hầu hết
- nhiều
- tên
- đặt tên
- Tự nhiên
- Xử lý ngôn ngữ tự nhiên
- Cần
- nhu cầu
- Mới
- Newyork
- thành phố new york
- tin tức
- nlp
- Không
- Bắc
- Bắc Mỹ
- Khái niệm
- tại
- quan sát
- of
- cung cấp
- Dầu
- Dầu khí
- on
- ONE
- Một y tế
- mở
- mã nguồn mở
- Các lựa chọn
- or
- dàn nhạc
- gọi món
- cơ quan
- tổ chức
- tổ chức
- nguyên
- Nền tảng khác
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- ra
- đầu ra
- tổng thể
- riêng
- trang
- gấu trúc
- thông số
- công ty mẹ
- một phần
- riêng
- hợp tác
- thông qua
- đam mê
- con đường
- Thực hiện
- hiệu suất
- thực hiện
- biểu diễn
- thực hiện
- Pharma
- Bằng tiến sĩ
- đường ống dẫn
- lập kế hoạch
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Phổ biến
- có thể
- Bài đăng
- -
- mạnh mẽ
- trước đây
- Hiệu trưởng
- vấn đề
- tiền thu được
- quá trình
- xử lý
- sản xuất
- dự án
- đúng
- cung cấp
- cung cấp
- công khai
- công khai
- chất lượng
- câu hỏi
- Câu hỏi
- hơn
- thời gian thực
- gần đây
- hồ sơ
- giảm
- liên quan
- mối quan hệ
- Mối quan hệ
- có liên quan
- đáng tin cậy
- đáng chú ý
- đòi hỏi
- nghiên cứu
- nhà nghiên cứu
- tài nguyên
- phản ứng
- phản ứng
- kết quả
- Kết quả
- trở lại
- mạnh mẽ
- thường xuyên
- HÀNG
- chạy
- nhà làm hiền triết
- bán hàng
- Quy mô
- Schneider Electric
- Khoa học
- Nhà khoa học
- sdk
- Tìm kiếm
- Công cụ tìm kiếm
- SEC
- Thứ hai
- ngành
- Ngành
- an toàn
- xem
- lựa chọn
- cao cấp
- phục vụ
- DỊCH VỤ
- một số
- chị ấy
- đáng kể
- tương tự
- kể từ khi
- nhỏ
- giải pháp
- Giải pháp
- động SOLVE
- một số
- nguồn
- nguồn
- chuyên
- riêng
- Quay
- quay
- nhà nước-of-the-art
- thống kê
- Bước
- Các bước
- hàng
- cấu trúc
- phòng thu
- sự chia nhỏ
- công ty con
- như vậy
- Hỗ trợ
- hệ thống
- hệ thống
- Lấy
- Nhiệm vụ
- nhiệm vụ
- nhóm
- đội
- Kỹ thuật
- văn bản
- hơn
- việc này
- Sản phẩm
- thông tin
- cung cấp their dịch
- Them
- lý thuyết
- Đó
- vì thế
- Kia là
- họ
- điều này
- nghĩ
- Thông qua
- Như vậy
- thời gian
- đến
- bên nhau
- công cụ
- công cụ
- hàng đầu
- theo dõi
- giao dịch
- theo truyền thống
- đào tạo
- Chuyển đổi
- biến đổi
- đáng tin cậy
- Twitch
- hai
- khám phá
- sự hiểu biết
- mở khóa
- up-to-date
- Cập nhật
- us
- sử dụng
- đã sử dụng
- sử dụng
- giá trị
- khác nhau
- Lớn
- phiên bản
- ngành dọc
- thông qua
- là
- Đường..
- cách
- we
- Wealth
- web
- các dịch vụ web
- TỐT
- Điều gì
- Là gì
- khi nào
- cái nào
- trong khi
- CHÚNG TÔI LÀ
- toàn bộ
- sẽ
- với
- ở trong
- quy trình làm việc
- Luồng công việc
- công trinh
- thế giới
- sẽ
- X
- năm
- york
- Bạn
- zephyrnet