Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian

Amazon SageMaker Tự động lái tự động xây dựng, đào tạo và điều chỉnh các mô hình máy học (ML) tốt nhất dựa trên dữ liệu của bạn, đồng thời cho phép bạn duy trì toàn quyền kiểm soát và khả năng hiển thị. Gần đây chúng tôi đã công bố hỗ trợ cho dữ liệu chuỗi thời gian trong Autopilot. Bạn có thể sử dụng Autopilot để giải quyết các tác vụ hồi quy và phân loại trên dữ liệu chuỗi thời gian hoặc dữ liệu chuỗi nói chung. Dữ liệu chuỗi thời gian là một loại dữ liệu chuỗi đặc biệt trong đó các điểm dữ liệu được thu thập tại các khoảng thời gian chẵn.

Chuẩn bị dữ liệu theo cách thủ công, chọn mô hình ML phù hợp và tối ưu hóa các tham số của nó là một công việc phức tạp, ngay cả đối với một chuyên gia thực hành. Mặc dù tồn tại các phương pháp tiếp cận tự động có thể tìm ra các mô hình tốt nhất và các thông số của chúng, nhưng các phương pháp này thường không thể xử lý dữ liệu xuất hiện dưới dạng chuỗi, chẳng hạn như lưu lượng mạng, mức tiêu thụ điện hoặc chi phí gia đình được ghi lại theo thời gian. Bởi vì dữ liệu này ở dạng các quan sát thu được tại các thời điểm khác nhau, các quan sát liên tiếp không thể được coi là độc lập với nhau và cần được xử lý tổng thể. Bạn có thể sử dụng Autopilot cho một loạt các vấn đề liên quan đến dữ liệu tuần tự. Ví dụ: bạn có thể phân loại lưu lượng mạng được ghi lại theo thời gian để xác định các hoạt động độc hại hoặc xác định xem các cá nhân có đủ điều kiện để được thế chấp hay không dựa trên lịch sử tín dụng của họ. Bạn cung cấp tập dữ liệu chứa dữ liệu chuỗi thời gian và Autopilot xử lý phần còn lại, xử lý dữ liệu tuần tự thông qua các chuyển đổi tính năng chuyên biệt và thay mặt bạn tìm kiếm mô hình tốt nhất.

Autopilot giúp loại bỏ sự nặng nhọc của việc xây dựng mô hình ML và giúp bạn tự động xây dựng, đào tạo và điều chỉnh mô hình ML tốt nhất dựa trên dữ liệu của bạn. Autopilot chạy một số thuật toán trên dữ liệu của bạn và điều chỉnh các siêu tham số của chúng trên cơ sở hạ tầng máy tính được quản lý hoàn toàn. Trong bài đăng này, chúng tôi trình bày cách bạn có thể sử dụng Máy bay tự động để giải quyết các vấn đề phân loại và hồi quy trên dữ liệu chuỗi thời gian. Để biết hướng dẫn về cách tạo và đào tạo mô hình Autopilot, hãy xem Dự đoán chuyển nhượng của khách hàng với tính năng Autopilot của Amazon SageMaker.

Phân loại dữ liệu chuỗi thời gian bằng Autopilot

Như một ví dụ đang chạy, chúng tôi xem xét một vấn đề nhiều lớp trên chuỗi thời gian tập dữ liệu UWaveCử chỉThư việnX, chứa các giá trị đọc cách đều của cảm biến gia tốc trong khi thực hiện một trong tám cử chỉ tay được xác định trước. Để đơn giản, chúng tôi chỉ xem xét thứ nguyên X của gia tốc kế. Nhiệm vụ là xây dựng một mô hình phân loại để ánh xạ dữ liệu chuỗi thời gian từ các lần đọc cảm biến đến các cử chỉ được xác định trước. Hình sau cho thấy các hàng đầu tiên của tập dữ liệu ở định dạng CSV. Toàn bộ bảng bao gồm 896 hàng và hai cột: cột đầu tiên là nhãn cử chỉ và cột thứ hai là chuỗi thời gian của các số đọc cảm biến.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Chuyển đổi dữ liệu sang định dạng phù hợp với Amazon SageMaker Data Wrangler

Ngoài việc chấp nhận các cột văn bản số, phân loại và tiêu chuẩn, Autopilot giờ đây cũng chấp nhận một cột đầu vào theo trình tự. Nếu dữ liệu chuỗi thời gian của bạn không tuân theo định dạng này, bạn có thể dễ dàng chuyển đổi nó qua Trình sắp xếp dữ liệu Amazon SageMaker. Data Wrangler giảm thời gian tổng hợp và chuẩn bị dữ liệu cho ML từ vài tuần xuống còn vài phút. Với Data Wrangler, bạn có thể đơn giản hóa quá trình chuẩn bị dữ liệu và kỹ thuật tính năng, đồng thời hoàn thành từng bước của quy trình chuẩn bị dữ liệu, bao gồm lựa chọn, làm sạch, thăm dò và trực quan hóa dữ liệu từ một giao diện trực quan duy nhất. Ví dụ: hãy xem xét cùng một tập dữ liệu nhưng ở định dạng đầu vào khác: mỗi cử chỉ (do ID chỉ định) là một chuỗi các phép đo cách đều nhau của gia tốc kế. Khi được lưu trữ theo chiều dọc, mỗi hàng chứa một dấu thời gian và một giá trị. Hình sau so sánh dữ liệu này ở định dạng ban đầu và định dạng chuỗi.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Để chuyển đổi tập dữ liệu này sang định dạng được mô tả trước đó bằng cách sử dụng Data Wrangler, hãy tải tập dữ liệu từ Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3). Sau đó sử dụng chuỗi thời gian Nhóm bằng cách biến đổi, như được hiển thị trong ảnh chụp màn hình sau và xuất dữ liệu trở lại Amazon S3 ở định dạng CSV.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Khi tập dữ liệu ở định dạng được chỉ định, bạn có thể tiến hành Autopilot. Để xem các máy biến áp chuỗi thời gian khác của Data Wrangler, hãy tham khảo Chuẩn bị dữ liệu chuỗi thời gian với Amazon SageMaker Data Wrangler.

Khởi chạy một công việc AutoML

Cũng như các kiểu đầu vào khác được Autopilot hỗ trợ, mỗi hàng của tập dữ liệu là một quan sát khác nhau và mỗi cột là một đặc điểm. Trong ví dụ này, chúng tôi có một cột duy nhất chứa dữ liệu chuỗi thời gian, nhưng bạn có thể có nhiều cột chuỗi thời gian. Bạn cũng có thể có nhiều cột với các kiểu nhập khác nhau, chẳng hạn như chuỗi thời gian, văn bản và số.

Đến tạo một thử nghiệm Autopilot, đặt tập dữ liệu trong nhóm S3 và tạo một thử nghiệm mới trong Xưởng sản xuất Amazon SageMaker. Như được hiển thị trong ảnh chụp màn hình sau, bạn phải chỉ định tên thử nghiệm, vị trí S3 của tập dữ liệu, vị trí S3 cho các tạo tác đầu ra và tên cột để dự đoán.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Autopilot phân tích dữ liệu, tạo đường ống ML và chạy 250 lần lặp lại mặc định của tối ưu hóa siêu tham số trên nhiệm vụ phân loại này. Như được hiển thị trong bảng xếp hạng mô hình sau, Autopilot đạt độ chính xác 0.821 và bạn có thể triển khai mô hình tốt nhất chỉ trong một cú nhấp chuột.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Ngoài ra, Autopilot tạo ra một báo cáo thăm dò dữ liệu, nơi bạn có thể hình dung và khám phá dữ liệu của mình.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Tính minh bạch là nền tảng cho Autopilot. Bạn có thể kiểm tra và sửa đổi các đường ống ML đã tạo trong sổ ghi chép định nghĩa ứng viên. Ảnh chụp màn hình sau đây trình bày cách Autopilot đề xuất một loạt các đường ống, kết hợp biến chuỗi thời gian TSFeatureExtractor với các thuật toán ML khác nhau, chẳng hạn như cây quyết định tăng cường độ dốc và mô hình tuyến tính. Các TSFeatureExtractor trích xuất hàng trăm tính năng của chuỗi thời gian cho bạn, sau đó được cung cấp cho các thuật toán hạ nguồn để đưa ra dự đoán. Để biết danh sách đầy đủ các tính năng của chuỗi thời gian, hãy tham khảo Tổng quan về các tính năng được trích xuất.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Kết luận

Trong bài đăng này, chúng tôi đã trình bày cách sử dụng SageMaker Autopilot để giải quyết các vấn đề phân loại và hồi quy chuỗi thời gian chỉ trong một vài cú nhấp chuột.

Để biết thêm thông tin về Autopilot, hãy xem Amazon SageMaker Tự động lái. Để khám phá các tính năng liên quan của SageMaker, hãy xem Trình sắp xếp dữ liệu Amazon SageMaker.


Về các tác giả

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Nikita Ivkin là một Nhà Khoa học Ứng dụng, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Anne Milbert là một kỹ sư Phát triển Phần mềm làm việc trên Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Valerio Perrone là một Giám đốc Khoa học Ứng dụng làm việc trên Amazon SageMaker Automatic Model Tuning và Autopilot.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Meghana Satish là một kỹ sư Phát triển Phần mềm làm việc trên Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot hiện hỗ trợ dữ liệu chuỗi thời gian PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái. Ali Takbiri là một Kiến trúc sư giải pháp chuyên gia về AI / ML và giúp khách hàng bằng cách sử dụng Học máy để giải quyết các thách thức kinh doanh của họ trên Đám mây AWS.

Dấu thời gian:

Thêm từ Học máy AWS