Phản hồi chất lượng cao của con người dành cho các ứng dụng AI sáng tạo của bạn từ Amazon SageMaker Ground Truth Plus

Được xuất bản lại bởi Plato

Người theo dõi: 0

Amazon SageMaker Ground Truth Plus giúp bạn chuẩn bị các bộ dữ liệu đào tạo chất lượng cao bằng cách loại bỏ công việc nặng nhọc không phân biệt liên quan đến việc xây dựng các ứng dụng ghi nhãn dữ liệu và quản lý lực lượng lao động ghi nhãn. Tất cả những gì bạn làm là chia sẻ dữ liệu cùng với các yêu cầu ghi nhãn và Ground Truth Plus sẽ thiết lập và quản lý quy trình ghi nhãn dữ liệu của bạn dựa trên các yêu cầu này. Từ đó, một lực lượng chuyên gia được đào tạo về nhiều nhiệm vụ máy học (ML) sẽ gắn nhãn dữ liệu của bạn. Bạn thậm chí không cần có chuyên môn sâu về ML hoặc kiến thức về thiết kế quy trình làm việc và quản lý chất lượng để sử dụng Ground Truth Plus. Giờ đây, Ground Truth Plus đang phục vụ những khách hàng cần ghi nhãn dữ liệu và phản hồi của con người để tinh chỉnh các mô hình nền tảng cho các ứng dụng AI tổng quát.

Trong bài đăng này, bạn sẽ tìm hiểu về những tiến bộ gần đây trong phản hồi của con người đối với AI tổng quát có sẵn thông qua SageMaker Ground Truth Plus. Điều này bao gồm quy trình làm việc mới và giao diện người dùng (UI) có sẵn để chuẩn bị bộ dữ liệu trình diễn được sử dụng trong quá trình tinh chỉnh có giám sát, thu thập phản hồi chất lượng cao của con người để tạo bộ dữ liệu ưu tiên nhằm điều chỉnh các mô hình nền tảng AI tổng quát với sở thích của con người, cũng như tùy chỉnh các mô hình cho các nhà xây dựng ứng dụng ' yêu cầu về phong cách, nội dung và giọng nói.

Những thách thức khi bắt đầu với AI tổng quát

Các ứng dụng AI sáng tạo trên khắp thế giới kết hợp cả mô hình nền tảng đơn chế độ và đa chế độ để giải quyết cho nhiều trường hợp sử dụng khác nhau. Phổ biến trong số đó là chatbot, trình tạo hình ảnh và trình tạo video. Các mô hình ngôn ngữ lớn (LLM) đang được sử dụng trong chatbot để theo đuổi sáng tạo, trợ lý cá nhân và học tập, công cụ kinh doanh thông minh và công cụ năng suất. Bạn có thể sử dụng các mô hình chuyển văn bản thành hình ảnh để tạo tài sản tiếp thị và nghệ thuật AI trừu tượng hoặc chân thực. Các mô hình chuyển văn bản thành video đang được sử dụng để tạo video cho các dự án nghệ thuật, quảng cáo có tính hấp dẫn cao, phát triển trò chơi điện tử và thậm chí là phát triển phim.

Hai trong số các vấn đề quan trọng nhất cần giải quyết đối với cả nhà sản xuất mô hình tạo mô hình nền tảng và nhà xây dựng ứng dụng sử dụng các mô hình nền tảng tổng quát hiện có để xây dựng các công cụ và ứng dụng của riêng họ là:

Tinh chỉnh các mô hình nền tảng này để có thể thực hiện các nhiệm vụ cụ thể
Căn chỉnh chúng theo sở thích của con người để đảm bảo chúng đưa ra thông tin hữu ích, chính xác và vô hại

Các mô hình nền tảng thường được đào tạo trước trên khối dữ liệu lớn chưa được gắn nhãn và do đó không hoạt động tốt theo hướng dẫn ngôn ngữ tự nhiên. Đối với LLM, điều đó có nghĩa là họ có thể phân tích cú pháp và tạo ngôn ngữ nói chung, nhưng họ không thể trả lời câu hỏi một cách mạch lạc hoặc tóm tắt văn bản theo chất lượng yêu cầu của người dùng. Ví dụ: khi người dùng yêu cầu tóm tắt văn bản trong lời nhắc, một mô hình chưa được tinh chỉnh cách tóm tắt văn bản có thể chỉ đọc lại văn bản lời nhắc cho người dùng hoặc trả lời bằng nội dung không liên quan. Nếu người dùng đặt câu hỏi về một chủ đề, phản hồi từ mô hình có thể chỉ là phần đọc lại câu hỏi. Đối với các mô hình đa phương thức, chẳng hạn như mô hình văn bản thành hình ảnh hoặc văn bản thành video, các mô hình này có thể xuất ra nội dung không liên quan đến lời nhắc. Ví dụ: nếu một nhà thiết kế đồ họa của công ty nhắc mô hình chuyển văn bản thành hình ảnh để tạo logo hoặc hình ảnh mới cho quảng cáo, thì mô hình đó có thể không tạo ra đồ họa có liên quan đến lời nhắc nếu nó chỉ có một khái niệm chung về hình ảnh và các yếu tố của một hình ảnh. Trong một số trường hợp, một mô hình có thể xuất ra hình ảnh hoặc video có hại, gây rủi ro cho lòng tin của người dùng hoặc danh tiếng của công ty.

Ngay cả khi các mô hình được tinh chỉnh để thực hiện các tác vụ cụ thể, chúng có thể không phù hợp với sở thích của con người về ý nghĩa, phong cách hoặc nội dung của nội dung đầu ra của chúng. Trong LLM, điều này có thể tự biểu hiện là nội dung không chính xác hoặc thậm chí có hại do mô hình tạo ra. Ví dụ: một mô hình không phù hợp với sở thích của con người thông qua tinh chỉnh có thể đưa ra các hướng dẫn nguy hiểm, phi đạo đức hoặc thậm chí là bất hợp pháp khi được người dùng nhắc. Chúng tôi sẽ không quan tâm đến việc hạn chế nội dung do mô hình tạo ra để đảm bảo nội dung phù hợp với sở thích của con người để trở nên chính xác, phù hợp và hữu ích. Sự sai lệch này có thể là một vấn đề đối với các công ty dựa vào các mô hình AI tổng quát cho các ứng dụng của họ, chẳng hạn như chatbot và tạo đa phương tiện. Đối với các mô hình đa phương thức, điều này có thể ở dạng hình ảnh hoặc video độc hại, nguy hiểm hoặc lạm dụng được tạo ra. Đây là rủi ro khi các lời nhắc được nhập vào mô hình mà không có ý định tạo nội dung nhạy cảm và cả khi nhà sản xuất mô hình hoặc trình xây dựng ứng dụng không có ý định cho phép mô hình tạo loại nội dung đó, nhưng nó vẫn được tạo ra.

Để giải quyết các vấn đề về khả năng dành riêng cho nhiệm vụ và điều chỉnh các mô hình nền tảng tổng quát phù hợp với sở thích của con người, các nhà sản xuất mô hình và nhà xây dựng ứng dụng phải tinh chỉnh các mô hình với dữ liệu bằng cách sử dụng các trình diễn do con người chỉ đạo và phản hồi của con người về kết quả đầu ra của mô hình.

Dữ liệu và các loại đào tạo

Có một số loại phương pháp tinh chỉnh với các loại dữ liệu được dán nhãn khác nhau được phân loại là điều chỉnh hướng dẫn – hoặc dạy một mô hình cách làm theo hướng dẫn. Trong số đó có tinh chỉnh có giám sát (SFT) sử dụng dữ liệu trình diễn và học tăng cường từ phản hồi của con người (RLHF) sử dụng dữ liệu ưu tiên.

Dữ liệu trình diễn để tinh chỉnh có giám sát

Để tinh chỉnh các mô hình nền tảng nhằm thực hiện các tác vụ cụ thể như trả lời câu hỏi hoặc tóm tắt văn bản với chất lượng cao, các mô hình trải qua SFT với dữ liệu trình diễn. Mục đích của dữ liệu trình diễn là hướng dẫn mô hình bằng cách cung cấp cho mô hình các ví dụ (trình diễn) được gắn nhãn về các nhiệm vụ đã hoàn thành do con người thực hiện. Ví dụ: để dạy một LLM cách trả lời các câu hỏi, một người chú thích là con người sẽ tạo một bộ dữ liệu được gắn nhãn gồm các cặp câu hỏi và câu trả lời do con người tạo ra để chứng minh cách tương tác câu hỏi và câu trả lời hoạt động về mặt ngôn ngữ và ý nghĩa của nội dung về mặt ngữ nghĩa. Loại SFT này đào tạo mô hình để nhận ra các kiểu hành vi được con người thể hiện trong dữ liệu đào tạo trình diễn. Các nhà sản xuất mô hình cần thực hiện kiểu tinh chỉnh này để chứng tỏ rằng các mô hình của họ có khả năng thực hiện các nhiệm vụ như vậy đối với những người chấp nhận ở hạ lưu. Các nhà xây dựng ứng dụng sử dụng các mô hình nền tảng hiện có cho các ứng dụng AI tổng quát của họ có thể cần tinh chỉnh các mô hình của họ bằng dữ liệu trình diễn về các tác vụ này với dữ liệu dành riêng cho ngành hoặc dành riêng cho công ty để cải thiện mức độ liên quan và độ chính xác của ứng dụng của họ.

Dữ liệu ưu tiên để điều chỉnh lệnh chẳng hạn như RLHF

Để tiếp tục điều chỉnh các mô hình nền tảng với sở thích của con người, các nhà sản xuất mô hình—và đặc biệt là các nhà xây dựng ứng dụng—cần tạo các bộ dữ liệu sở thích để thực hiện điều chỉnh hướng dẫn. Dữ liệu ưu tiên trong bối cảnh điều chỉnh hướng dẫn là dữ liệu được gắn nhãn ghi lại phản hồi của con người đối với một tập hợp các tùy chọn đầu ra của mô hình nền tảng tổng quát. Nó thường bao gồm đánh giá hoặc xếp hạng một số suy luận hoặc so sánh theo cặp hai suy luận từ một mô hình nền tảng theo một số thuộc tính cụ thể. Đối với LLM, các thuộc tính này có thể là hữu ích, chính xác và vô hại. Đối với các mô hình văn bản thành hình ảnh, nó có thể là chất lượng thẩm mỹ hoặc căn chỉnh văn bản-hình ảnh. Sau đó, dữ liệu tùy chọn này dựa trên phản hồi của con người có thể được sử dụng trong các phương pháp điều chỉnh hướng dẫn khác nhau—bao gồm cả RLHF—để tinh chỉnh thêm một mô hình để phù hợp với sở thích của con người.

Điều chỉnh hướng dẫn sử dụng dữ liệu ưu tiên đóng một vai trò quan trọng trong việc tăng cường tính cá nhân hóa và hiệu quả của các mô hình nền tảng. Đây là một bước quan trọng trong việc xây dựng các ứng dụng tùy chỉnh trên các mô hình nền tảng được đào tạo trước và là một phương pháp hiệu quả để đảm bảo các mô hình đang tạo ra nội dung hữu ích, chính xác và vô hại. Một ví dụ phổ biến về điều chỉnh hướng dẫn là hướng dẫn một chatbot tạo ba phản hồi cho một truy vấn và yêu cầu con người đọc và xếp hạng cả ba theo một số thứ nguyên được chỉ định, chẳng hạn như độc tính, độ chính xác thực tế hoặc khả năng đọc. Ví dụ: một công ty có thể sử dụng chatbot cho bộ phận tiếp thị của mình và muốn đảm bảo rằng nội dung phù hợp với thông điệp thương hiệu của mình, không thể hiện thành kiến và có thể đọc được rõ ràng. Công ty sẽ nhắc chatbot trong quá trình điều chỉnh hướng dẫn để tạo ra ba ví dụ và yêu cầu các chuyên gia nội bộ của họ chọn những ví dụ phù hợp nhất với mục tiêu của họ. Theo thời gian, họ xây dựng một bộ dữ liệu được sử dụng để dạy mô hình về phong cách nội dung mà con người thích thông qua học tập củng cố. Điều này cho phép ứng dụng chatbot xuất ra nội dung phù hợp, dễ đọc và an toàn hơn.

SageMaker Ground Truth Plus

Ground Truth Plus giúp bạn giải quyết cả hai thách thức—tạo bộ dữ liệu trình diễn với các khả năng dành riêng cho nhiệm vụ, cũng như thu thập bộ dữ liệu ưu tiên từ phản hồi của con người để điều chỉnh các mô hình phù hợp với sở thích của con người. Bạn có thể yêu cầu các dự án cho LLM và các mô hình đa phương thức như chuyển văn bản thành hình ảnh và chuyển văn bản thành video. Đối với LLM, bộ dữ liệu trình diễn chính bao gồm tạo câu hỏi và câu trả lời (Q&A), tóm tắt văn bản, tạo văn bản và làm lại văn bản cho mục đích kiểm duyệt nội dung, thay đổi phong cách hoặc thay đổi độ dài. Bộ dữ liệu ưu tiên LLM chính bao gồm xếp hạng và phân loại đầu ra văn bản. Đối với các mô hình đa phương thức, các loại nhiệm vụ chính bao gồm tạo phụ đề cho hình ảnh hoặc video cũng như ghi lại dấu thời gian của các sự kiện trong video. Do đó, Ground Truth Plus có thể giúp cả nhà sản xuất mô hình và nhà xây dựng ứng dụng trên hành trình AI sáng tạo của họ.

Trong bài đăng này, chúng tôi đi sâu hơn vào hành trình phản hồi và chú thích của con người trong bốn trường hợp bao gồm cả dữ liệu trình diễn và dữ liệu ưu tiên cho cả LLM và mô hình đa phương thức: tạo cặp câu hỏi và câu trả lời và xếp hạng văn bản cho LLM, cũng như chú thích hình ảnh và phụ đề video cho các mô hình đa phương thức.

Các mô hình ngôn ngữ lớn

Trong phần này, chúng tôi thảo luận về các cặp câu hỏi và câu trả lời cũng như xếp hạng văn bản cho LLM, cùng với các tùy chỉnh mà bạn có thể muốn cho trường hợp sử dụng của mình.

Cặp câu hỏi và câu trả lời

Ảnh chụp màn hình sau đây hiển thị giao diện người dùng ghi nhãn trong đó người chú thích là con người sẽ đọc một đoạn văn bản và tạo cả câu hỏi và câu trả lời trong quá trình xây dựng tập dữ liệu minh họa Hỏi & Đáp.

Hãy xem qua một chuyến tham quan giao diện người dùng dưới tư cách của người chú thích. Ở phía bên trái của giao diện người dùng, hướng dẫn cụ thể của người yêu cầu công việc được trình bày cho người chú thích. Trong trường hợp này, người chú thích có nhiệm vụ đọc đoạn văn bản được trình bày ở trung tâm của giao diện người dùng và tạo câu hỏi và câu trả lời dựa trên văn bản. Ở phía bên phải, các câu hỏi và câu trả lời mà người chú thích đã viết được hiển thị. Đoạn văn bản cũng như loại, độ dài, số lượng câu hỏi và câu trả lời đều có thể được người yêu cầu công việc tùy chỉnh trong quá trình thiết lập dự án với nhóm Ground Truth Plus. Trong trường hợp này, người chú thích đã tạo ra một câu hỏi yêu cầu phải hiểu toàn bộ đoạn văn bản để trả lời và được đánh dấu bằng một Tài liệu tham khảo toàn bộ đoạn văn hộp kiểm. Hai câu hỏi và câu trả lời còn lại dựa trên các phần cụ thể của đoạn văn bản, như được hiển thị bởi phần chú thích nổi bật với kết hợp mã màu. Theo tùy chọn, bạn có thể muốn yêu cầu tạo câu hỏi và câu trả lời mà không cần cung cấp đoạn văn bản và cung cấp các hướng dẫn khác cho người chú thích con người—điều này cũng được Ground Truth Plus hỗ trợ.

Sau khi các câu hỏi và câu trả lời được gửi, chúng có thể chuyển sang quy trình làm việc vòng lặp kiểm soát chất lượng tùy chọn, nơi những người đánh giá khác của con người sẽ xác nhận rằng phân phối do khách hàng xác định và các loại câu hỏi và câu trả lời đã được tạo. Nếu có sự không phù hợp giữa các yêu cầu của khách hàng và những gì người chú thích con người đã tạo ra, công việc sẽ được chuyển trở lại con người để làm lại trước khi được xuất dưới dạng một phần của tập dữ liệu để phân phối cho khách hàng. Khi tập dữ liệu được gửi lại cho bạn, tập dữ liệu đó sẵn sàng được tích hợp vào quy trình tinh chỉnh được giám sát theo quyết định của bạn.

xếp hạng văn bản

Ảnh chụp màn hình sau đây hiển thị giao diện người dùng để xếp hạng các kết quả đầu ra từ LLM dựa trên lời nhắc.

Bạn có thể chỉ cần viết hướng dẫn cho người đánh giá và gửi lời nhắc cũng như phản hồi được tạo trước cho nhóm dự án Ground Truth Plus để bắt đầu công việc. Trong trường hợp này, chúng tôi đã yêu cầu một người đánh giá xếp hạng ba câu trả lời cho mỗi lời nhắc từ một LLM về khía cạnh độ rõ ràng của văn bản (khả năng đọc). Một lần nữa, khung bên trái hiển thị các hướng dẫn được người yêu cầu công việc đưa ra cho người đánh giá. Ở trung tâm, lời nhắc nằm ở đầu trang và ba phản hồi được tạo trước là phần chính để dễ sử dụng. Ở phía bên phải của giao diện người dùng, người đánh giá sẽ xếp hạng chúng theo thứ tự từ văn bản rõ ràng nhất đến kém rõ ràng nhất.

Khách hàng muốn tạo loại bộ dữ liệu ưu tiên này bao gồm các nhà xây dựng ứng dụng quan tâm đến việc xây dựng các chatbot giống con người và do đó muốn tùy chỉnh các hướng dẫn để sử dụng cho riêng họ. Độ dài của lời nhắc, số lượng phản hồi và thứ nguyên xếp hạng đều có thể được tùy chỉnh. Ví dụ: bạn có thể muốn xếp hạng năm câu trả lời theo thứ tự từ chính xác nhất đến kém nhất về mặt thực tế, sai lệch hoặc độc hại hoặc thậm chí xếp hạng và phân loại đồng thời nhiều thứ nguyên. Các tùy chỉnh này được hỗ trợ trong Ground Truth Plus.

Mô hình đa phương thức

Trong phần này, chúng tôi thảo luận về chú thích hình ảnh và video để đào tạo các mô hình đa phương thức, chẳng hạn như mô hình chuyển văn bản thành hình ảnh và văn bản thành video, cũng như các tùy chỉnh mà bạn có thể muốn thực hiện cho trường hợp sử dụng cụ thể của mình.

Chú thích hình ảnh

Ảnh chụp màn hình sau đây hiển thị giao diện người dùng ghi nhãn cho chú thích hình ảnh. Bạn có thể yêu cầu một dự án có chú thích hình ảnh để thu thập dữ liệu nhằm huấn luyện mô hình chuyển văn bản thành hình ảnh hoặc mô hình hình ảnh thành văn bản.

Trong trường hợp này, chúng tôi đã yêu cầu đào tạo mô hình chuyển văn bản thành hình ảnh và đã đặt ra các yêu cầu cụ thể đối với chú thích về độ dài và độ chi tiết. Giao diện người dùng được thiết kế để hướng dẫn những người chú thích con người thông qua quá trình nhận thức để tạo ra các chú thích phong phú bằng cách cung cấp một khuôn khổ tinh thần thông qua các công cụ hỗ trợ và mô tả. Chúng tôi nhận thấy rằng việc cung cấp khung tinh thần này cho người chú thích dẫn đến chú thích mô tả và chính xác hơn là chỉ cung cấp một hộp văn bản có thể chỉnh sửa.

Bước đầu tiên trong khuôn khổ là để người chú thích con người xác định các đối tượng chính trong hình ảnh. Khi người chú thích chọn một đối tượng trong hình ảnh, một dấu chấm được mã hóa màu sẽ xuất hiện trên đối tượng. Trong trường hợp này, người chú thích đã chọn cả con chó và con mèo, tạo hai trường có thể chỉnh sửa ở phía bên phải của giao diện người dùng, trong đó người chú thích sẽ nhập tên của các đối tượng—mèo và chó—cùng với mô tả chi tiết về từng đối tượng. Tiếp theo, người chú thích được hướng dẫn để xác định tất cả các mối quan hệ giữa tất cả các đối tượng trong ảnh. Trong trường hợp này, con mèo đang thư giãn bên cạnh con chó. Tiếp theo, người chú thích được yêu cầu xác định các thuộc tính cụ thể về hình ảnh, chẳng hạn như cài đặt, nền hoặc môi trường. Cuối cùng, trong hộp văn bản nhập chú thích, người chú thích được hướng dẫn kết hợp tất cả những gì họ đã viết trong các trường đối tượng, mối quan hệ và cài đặt hình ảnh thành một chú thích mô tả duy nhất hoàn chỉnh cho hình ảnh.

Theo tùy chọn, bạn có thể định cấu hình chú thích hình ảnh này để được chuyển qua vòng kiểm tra chất lượng dựa trên con người với các hướng dẫn cụ thể nhằm đảm bảo rằng chú thích đáp ứng các yêu cầu. Nếu có một vấn đề được xác định, chẳng hạn như một đối tượng khóa bị thiếu, chú thích đó có thể được gửi lại cho con người để khắc phục sự cố trước khi xuất dưới dạng một phần của tập dữ liệu huấn luyện.

Phụ đề video

Ảnh chụp màn hình sau đây hiển thị giao diện người dùng phụ đề video để tạo phụ đề video phong phú với thẻ dấu thời gian. Bạn có thể yêu cầu một dự án phụ đề video thu thập dữ liệu để xây dựng các mô hình chuyển văn bản thành video hoặc video thành văn bản.

Trong giao diện người dùng ghi nhãn này, chúng tôi đã xây dựng một khuôn khổ tinh thần tương tự để đảm bảo các phụ đề chất lượng cao được viết. Người chú thích con người có thể kiểm soát video ở phía bên trái và tạo mô tả cũng như dấu thời gian cho từng hoạt động được hiển thị trong video ở phía bên phải với các thành phần giao diện người dùng. Tương tự như giao diện người dùng chú thích hình ảnh, cũng có một nơi để người chú thích viết mô tả chi tiết về cài đặt, nền và môi trường video. Cuối cùng, người chú thích được hướng dẫn kết hợp tất cả các yếu tố thành một chú thích video mạch lạc.

Tương tự như trường hợp phụ đề hình ảnh, phụ đề video có thể tùy ý chuyển qua quy trình kiểm soát chất lượng dựa trên con người để xác định xem các yêu cầu của bạn có được đáp ứng hay không. Nếu có vấn đề với phụ đề video, nó sẽ được gửi để làm lại bởi lực lượng người chú thích con người.

Kết luận

Ground Truth Plus có thể giúp bạn chuẩn bị các bộ dữ liệu chất lượng cao để tinh chỉnh các mô hình nền tảng cho các tác vụ AI tổng quát, từ trả lời câu hỏi đến tạo hình ảnh và video. Nó cũng cho phép lực lượng lao động có kỹ năng của con người xem xét kết quả đầu ra của mô hình để đảm bảo rằng chúng phù hợp với sở thích của con người. Ngoài ra, nó cho phép các nhà xây dựng ứng dụng tùy chỉnh các mô hình bằng dữ liệu ngành hoặc công ty của họ để đảm bảo ứng dụng của họ thể hiện tiếng nói và phong cách ưa thích của họ. Đây là những cải tiến đầu tiên trong số nhiều cải tiến trong Ground Truth Plus và nhiều cải tiến khác đang được phát triển. Hãy theo dõi các bài viết trong tương lai.

Quan tâm đến việc bắt đầu một dự án để xây dựng hoặc cải thiện các mô hình và ứng dụng AI tổng quát của bạn? Bắt đầu với Ground Truth Plus bằng cách kết nối với nhóm của chúng tôi hôm nay.

Giới thiệu về tác giả

Phản hồi chất lượng cao của con người dành cho các ứng dụng AI tổng hợp của bạn từ Amazon SageMaker Ground Truth Plus | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái. Jesse Manders là Giám đốc sản phẩm cấp cao về con người AWS AI/ML trong nhóm dịch vụ vòng lặp. Anh ấy làm việc tại nơi giao thoa giữa AI và tương tác của con người với mục tiêu tạo ra và cải thiện các sản phẩm và dịch vụ AI/ML để đáp ứng nhu cầu của chúng ta. Trước đây, Jesse giữ vai trò lãnh đạo về kỹ thuật tại Apple và Lumileds, đồng thời là nhà khoa học cấp cao của một công ty khởi nghiệp ở Thung lũng Silicon. Ông có bằng ThS và Ph.D. từ Đại học Florida và bằng MBA của Đại học California, Berkeley, Trường Kinh doanh Haas.

Romi Datta là Giám đốc cấp cao về Quản lý sản phẩm trong nhóm Amazon SageMaker chịu trách nhiệm về các dịch vụ Human in the Loop. Anh ấy đã làm việc tại AWS hơn 4 năm, giữ nhiều vai trò lãnh đạo quản lý sản phẩm trong SageMaker, S3 và IoT. Trước AWS, anh ấy đã làm việc với nhiều vai trò quản lý sản phẩm, kỹ thuật và lãnh đạo vận hành khác nhau tại IBM, Texas Instruments và Nvidia. Ông có bằng ThS và Ph.D. về Kỹ thuật Điện và Máy tính của Đại học Texas ở Austin và bằng Thạc sĩ Quản trị Kinh doanh của Trường Kinh doanh Booth thuộc Đại học Chicago.

Phản hồi chất lượng cao của con người dành cho các ứng dụng AI tổng hợp của bạn từ Amazon SageMaker Ground Truth Plus | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái. Jonathan Buck là một Kỹ sư phần mềm tại Amazon Web Services làm việc tại giao điểm của máy học và hệ thống phân tán. Công việc của anh liên quan đến việc sản xuất các mô hình máy học và phát triển các ứng dụng phần mềm mới được hỗ trợ bởi máy học để đưa các khả năng mới nhất đến tay khách hàng.

Phản hồi chất lượng cao của con người dành cho các ứng dụng AI tổng hợp của bạn từ Amazon SageMaker Ground Truth Plus | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái. Alex William là một nhà khoa học ứng dụng trong nhóm khoa học con người trong vòng lặp tại AWS AI, nơi ông tiến hành nghiên cứu các hệ thống tương tác ở điểm giao nhau giữa tương tác giữa con người và máy tính (HCI) và máy học. Trước khi gia nhập Amazon, ông là giáo sư tại Khoa Kỹ thuật Điện và Khoa học Máy tính tại Đại học Tennessee, nơi ông đồng chỉ đạo phòng thí nghiệm nghiên cứu Con người, Tác nhân, Tương tác và Hệ thống (PAIRS). Ông cũng đã từng giữ các vị trí nghiên cứu tại Microsoft Research, Mozilla Research và Đại học Oxford. Anh ấy thường xuyên xuất bản tác phẩm của mình tại các địa điểm xuất bản hàng đầu cho HCI, chẳng hạn như CHI, CSCW và UIST. Ông có bằng tiến sĩ của Đại học Waterloo.

Phản hồi chất lượng cao của con người dành cho các ứng dụng AI tổng hợp của bạn từ Amazon SageMaker Ground Truth Plus | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái. Sarah Cao là Giám đốc phát triển phần mềm ở Amazon SageMaker Human In the Loop (HIL) chịu trách nhiệm xây dựng nền tảng ghi nhãn dựa trên ML. Sarah đã làm việc tại AWS hơn 4 năm, giữ nhiều vai trò lãnh đạo quản lý phần mềm trong bảo mật EC2 và SageMaker. Trước AWS, cô đã làm việc với nhiều vai trò quản lý kỹ thuật khác nhau tại Oracle và Sun Microsystem.

Phản hồi chất lượng cao của con người dành cho các ứng dụng AI tổng hợp của bạn từ Amazon SageMaker Ground Truth Plus | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái. Lý Erran là người quản lý khoa học ứng dụng tại các dịch vụ con người trong vòng lặp, AWS AI, Amazon. Mối quan tâm nghiên cứu của anh ấy là học sâu 3D, và học biểu diễn ngôn ngữ và hình ảnh. Trước đây, ông là nhà khoa học cấp cao tại Alexa AI, trưởng bộ phận học máy tại Scale AI và nhà khoa học trưởng tại Pony.ai. Trước đó, anh ấy đã làm việc với nhóm nhận thức tại Uber ATG và nhóm nền tảng máy học tại Uber làm việc về máy học cho lái xe tự động, hệ thống máy học và các sáng kiến chiến lược của AI. Ông bắt đầu sự nghiệp của mình tại Bell Labs và là trợ giảng tại Đại học Columbia. Anh ấy đã đồng giảng dạy các buổi hướng dẫn tại ICML'17 và ICCV'19, đồng thời đồng tổ chức một số hội thảo tại NeurIPS, ICML, CVPR, ICCV về học máy cho lái xe tự động, tầm nhìn 3D và người máy, hệ thống học máy và học máy đối nghịch. Ông có bằng tiến sĩ về khoa học máy tính tại Đại học Cornell. Anh ấy là thành viên của ACM và thành viên của IEEE.

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoAiStream. Thông minh dữ liệu Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Đúc kết tương lai với Adryenn Ashley. Truy cập Tại đây.
Mua và bán cổ phần trong các công ty PRE-IPO với PREIPO®. Truy cập Tại đây.
nguồn: https://aws.amazon.com/blogs/machine-learning/high-quality-human-feedback-for-your-generative-ai-applications-from-amazon-sagemaker-ground-truth-plus/

Dấu thời gian: 30 Tháng Năm, 2023

Dấu thời gian: Tháng Sáu 13, 2023

Được xuất bản lại bởi Plato

Cách United Airlines xây dựng quy trình học tập tích cực Nhận dạng ký tự quang học tiết kiệm chi phí | Dịch vụ web của Amazon

Đào tạo và triển khai các mô hình ML trong môi trường nhiều đám mây bằng Amazon SageMaker | Dịch vụ web của Amazon

Xác định những hiểu biết chính từ tài liệu văn bản thông qua tinh chỉnh và HPO với Amazon SageMaker JumpStart

Tùy chỉnh vùng chứa thuật toán Amazon SageMaker XGBoost

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản