Trình sắp xếp dữ liệu Amazon SageMaker giảm thời gian tổng hợp và chuẩn bị dữ liệu cho machine learning (ML) từ hàng tuần xuống còn vài phút trong Amazon SageMaker Studio. Data Wrangler cho phép bạn truy cập dữ liệu từ nhiều nguồn phổ biến (Amazon S3, amazon Athena, Amazon RedShift, Amazon EMR và Snowflake) và hơn 40 nguồn bên thứ ba khác. Bắt đầu từ hôm nay, bạn có thể kết nối với Amazon EMR Hive như một công cụ truy vấn dữ liệu lớn để mang lại các bộ dữ liệu lớn cho ML.
Tổng hợp và chuẩn bị một lượng lớn dữ liệu là một phần quan trọng của quy trình ML. Các nhà khoa học dữ liệu và kỹ sư dữ liệu sử dụng Apache Spark, Apache Hive và Presto chạy trên Amazon EMR để xử lý dữ liệu quy mô lớn. Bài đăng trên blog này sẽ trình bày cách các chuyên gia dữ liệu có thể sử dụng giao diện trực quan của SageMaker Data Wrangler để định vị và kết nối với các cụm Amazon EMR hiện có bằng các điểm cuối Hive. Để sẵn sàng lập mô hình hoặc báo cáo, họ có thể phân tích trực quan cơ sở dữ liệu, bảng, lược đồ và truy vấn Hive của tác giả để tạo tập dữ liệu ML. Sau đó, họ có thể nhanh chóng lập hồ sơ dữ liệu bằng giao diện trực quan Data Wrangler để đánh giá chất lượng dữ liệu, phát hiện điểm bất thường và dữ liệu bị thiếu hoặc không chính xác, đồng thời nhận lời khuyên về cách xử lý những sự cố này. Họ có thể tận dụng các phân tích tích hợp phổ biến hơn và được hỗ trợ bởi ML cũng như hơn 300 phép biến đổi tích hợp được Spark hỗ trợ để phân tích, dọn dẹp và thiết kế các tính năng mà không cần viết một dòng mã nào. Cuối cùng, họ cũng có thể đào tạo và triển khai các mô hình với Máy lái tự động SageMaker, lên lịch công việc hoặc vận hành quá trình chuẩn bị dữ liệu trong Đường ống SageMaker từ giao diện trực quan của Data Wrangler.
Tổng quan về giải pháp
Với các thiết lập SageMaker Studio, các chuyên gia dữ liệu có thể nhanh chóng xác định và kết nối với các cụm EMR hiện có. Ngoài ra, các chuyên gia dữ liệu có thể khám phá các cụm EMR từ SageMaker Studio sử dụng các mẫu được xác định trước theo yêu cầu chỉ trong một vài cú nhấp chuột. Khách hàng có thể sử dụng máy tính xách tay phổ quát SageMaker Studio và viết mã trong Apache Spark, Tổ ong, Mau or PySpark để thực hiện chuẩn bị dữ liệu ở quy mô. Tuy nhiên, không phải tất cả các chuyên gia dữ liệu đều quen thuộc với việc viết mã Spark để chuẩn bị dữ liệu vì có liên quan đến quá trình học tập dốc. Giờ đây, họ có thể kết nối nhanh chóng và đơn giản với Amazon EMR mà không cần viết một dòng mã nào, nhờ Amazon EMR là nguồn dữ liệu cho Amazon SageMaker Data Wrangler.
Sơ đồ sau đại diện cho các thành phần khác nhau được sử dụng trong giải pháp này.
Chúng tôi trình bày hai tùy chọn xác thực có thể được sử dụng để thiết lập kết nối với cụm EMR. Đối với mỗi tùy chọn, chúng tôi triển khai một ngăn xếp duy nhất của Hình thành đám mây AWS mẫu.
Mẫu CloudFormation thực hiện các hành động sau khi mỗi tùy chọn được chọn:
- Tạo miền Studio ở chế độ chỉ dành cho VPC, cùng với hồ sơ người dùng có tên
studio-user
. - Tạo các khối xây dựng, bao gồm VPC, điểm cuối, mạng con, nhóm bảo mật, cụm EMR và các tài nguyên cần thiết khác để chạy thành công các ví dụ.
- Đối với cụm EMR, hãy kết nối Danh mục dữ liệu AWS Glue dưới dạng kho dữ liệu di động cho EMR Hive và Presto, tạo bảng Hive trong EMR và điền vào đó dữ liệu từ một Bộ dữ liệu sân bay Hoa Kỳ.
- Đối với mẫu LDAP CloudFormation, hãy tạo một Đám mây điện toán đàn hồi Amazon (Amazon EC2) để lưu trữ máy chủ LDAP nhằm xác thực người dùng Hive và Presto LDAP.
Tùy chọn 1: Giao thức thư mục truy cập nhẹ
Đối với mẫu CloudFormation xác thực LDAP, chúng tôi cung cấp một phiên bản Amazon EC2 với máy chủ LDAP và định cấu hình cụm EMR để sử dụng máy chủ này để xác thực. Đây là TLS được kích hoạt.
Tùy chọn 2: Không xác thực
Trong mẫu CloudFormation xác thực No-Auth, chúng tôi sử dụng cụm EMR tiêu chuẩn không kích hoạt xác thực.
Triển khai tài nguyên với AWS CloudFormation
Hoàn thành các bước sau để triển khai môi trường:
- Đăng nhập vào Bảng điều khiển quản lý AWS như một Quản lý truy cập và nhận dạng AWS (IAM) người dùng, tốt nhất là người dùng quản trị.
- Chọn Khởi chạy Stack để khởi chạy mẫu CloudFormation cho kịch bản xác thực phù hợp. Đảm bảo Khu vực được sử dụng để triển khai ngăn xếp CloudFormation không có Miền Studio hiện có. Nếu bạn đã có Miền studio trong một Khu vực, thì bạn có thể chọn một Khu vực khác.
LDAP Không xác thực - Chọn Sau.
- Trong Tên ngăn xếp, nhập tên cho ngăn xếp (ví dụ:
dw-emr-hive-blog
). - Để các giá trị khác làm mặc định.
- Để tiếp tục, hãy chọn Sau từ trang chi tiết ngăn xếp và tùy chọn ngăn xếp.
Ngăn xếp LDAP sử dụng thông tin xác thực sau.- tên người dùng:
david
- mật khẩu:
welcome123
- tên người dùng:
- Trên trang đánh giá, hãy chọn hộp kiểm để xác nhận rằng AWS CloudFormation có thể tạo tài nguyên.
- Chọn Tạo ngăn xếp. Đợi cho đến khi trạng thái của ngăn xếp thay đổi từ
CREATE_IN_PROGRESS
đếnCREATE_COMPLETE
. Quá trình này thường mất 10-15 phút.
Thiết lập Amazon EMR làm nguồn dữ liệu trong Data Wrangler
Trong phần này, chúng tôi đề cập đến việc kết nối với cụm Amazon EMR hiện có được tạo thông qua mẫu CloudFormation dưới dạng nguồn dữ liệu trong Data Wrangler.
Tạo luồng dữ liệu mới
Để tạo luồng dữ liệu của bạn, hãy hoàn thành các bước sau:
- Trên bảng điều khiển SageMaker, nhấp vào Tên miền, sau đó nhấp vào StudioMiền được tạo bằng cách chạy mẫu CloudFormation phía trên.
- Chọn người dùng phòng thu hồ sơ người dùng và khởi chạy Studio.
- Chọn mở studio.
- Trong bảng điều khiển Studio Home, chọn Nhập và chuẩn bị dữ liệu trực quan. Ngoài ra, trên Tập tin thả xuống, chọn Mới, sau đó chọn Luồng trình xử lý dữ liệu.
- Việc tạo một luồng mới có thể mất vài phút. Sau khi dòng đã được tạo, bạn sẽ thấy Nhập dữ liệu .
- Thêm Amazon EMR làm nguồn dữ liệu trong Data Wrangler. trên Thêm nguồn dữ liệu menu, chọn Amazon EMR.
Bạn có thể duyệt qua tất cả các cụm EMR mà vai trò thực thi Studio của bạn có quyền xem. Bạn có hai tùy chọn để kết nối với một cụm; một là thông qua giao diện người dùng tương tác và hai là trước tiên tạo bí mật bằng AWS Secrets Manager với URL JDBC, bao gồm thông tin cụm EMR, sau đó cung cấp ARN bí mật AWS được lưu trữ trong giao diện người dùng để kết nối với Hive. Trong blog này, chúng tôi làm theo tùy chọn đầu tiên.
- Chọn một trong các cụm sau mà bạn muốn sử dụng. Nhấp vào Sauvà chọn điểm cuối.
- Chọn tổ ong, kết nối với Amazon EMR, tạo tên để xác định kết nối của bạn và nhấp vào Sau.
- Chọn loại xác thực, hoặc Giao thức truy cập thư mục nhẹ (LDAP) or Không có chứng thực.
Đối với Giao thức truy cập thư mục nhẹ (LDAP), hãy chọn tùy chọn và nhấp vào Tiếp theo, đăng nhập vào cụmr, sau đó cung cấp tên người dùng và mật khẩu để được xác thực và nhấp vào Kết nối.
Đối với Không xác thực, bạn sẽ được kết nối với EMR Hive mà không cung cấp thông tin xác thực người dùng trong VPC. Nhập trang trình khám phá SQL của Data Wrangler cho EMR.
- Sau khi kết nối, bạn có thể xem một cây cơ sở dữ liệu và xem trước bảng hoặc lược đồ một cách tương tác. Bạn cũng có thể truy vấn, khám phá và trực quan hóa dữ liệu từ EMR. Để xem trước, bạn sẽ thấy giới hạn 100 bản ghi theo mặc định. Sau khi bạn cung cấp một câu lệnh SQL trong hộp soạn thảo truy vấn và nhấp vào chạy nút, truy vấn sẽ được thực hiện trên công cụ Hive của EMR để xem trước dữ liệu.
Sản phẩm Hủy truy vấn nút cho phép hủy các truy vấn đang diễn ra nếu chúng mất nhiều thời gian bất thường.
- Bước cuối cùng là nhập khẩu. Khi bạn đã sẵn sàng với dữ liệu được truy vấn, bạn có các tùy chọn để cập nhật cài đặt lấy mẫu cho lựa chọn dữ liệu theo loại lấy mẫu (FirstK, Ngẫu nhiên hoặc Phân tầng) và kích thước lấy mẫu để nhập dữ liệu vào Data Wrangler.
Nhấp chuột Nhập khẩu. Trang chuẩn bị sẽ được tải, cho phép bạn thêm các phép biến đổi khác nhau và phân tích cơ bản vào tập dữ liệu.
- Hướng đến Dòng dữ liệu từ màn hình trên cùng và thêm các bước khác vào quy trình nếu cần để chuyển đổi và phân tích. Bạn có thể chạy một báo cáo thông tin chuyên sâu về dữ liệu để xác định các vấn đề về chất lượng dữ liệu và nhận các đề xuất để khắc phục những vấn đề đó. Hãy xem xét một số biến đổi ví dụ.
- Trong tạp chí Dòng dữ liệu xem, bạn sẽ thấy rằng chúng tôi đang sử dụng EMR làm nguồn dữ liệu bằng trình kết nối Hive.
- Hãy bấm vào + nút bên phải Loại dữ liệu và chọn Thêm biến đổi. Khi bạn làm điều đó, bạn sẽ quay trở lại Ngày lượt xem.
Hãy khám phá dữ liệu. Chúng tôi thấy rằng nó có nhiều tính năng như iata_code, sân bay, thành phố, nhà nước, đất nước, vĩ độvà kinh độ. Chúng ta có thể thấy rằng toàn bộ tập dữ liệu dựa trên một quốc gia, đó là Hoa Kỳ và có các giá trị bị thiếu trong vĩ độ và kinh độ. Dữ liệu bị thiếu có thể gây sai lệch trong ước lượng các tham số và có thể làm giảm tính đại diện của các mẫu, vì vậy chúng ta cần thực hiện một số sự áp đặt và xử lý các giá trị còn thiếu trong tập dữ liệu của chúng tôi.
- Hãy bấm vào Thêm bước trên thanh điều hướng ở bên phải. Lựa chọn Xử lý thiếu. Các cấu hình có thể được nhìn thấy trong các ảnh chụp màn hình sau.
Theo Biến đổi, chọn quy tội. Chọn Loại cột as Numeric và Cột đầu vào tên vĩ độ và kinh độ. Chúng tôi sẽ quy các giá trị còn thiếu bằng cách sử dụng giá trị trung bình gần đúng.
Lần đầu tiên nhấp vào Xem trước để xem giá trị còn thiếu và sau đó nhấp vào cập nhật để thêm biến đổi.
- Bây giờ chúng ta hãy xem xét một ví dụ biến đổi khác. Khi xây dựng mô hình ML, các cột sẽ bị xóa nếu chúng dư thừa hoặc không hỗ trợ mô hình của bạn. Cách phổ biến nhất để loại bỏ một cột là bỏ nó. Trong tập dữ liệu của chúng tôi, tính năng đất nước có thể bị loại bỏ do tập dữ liệu dành riêng cho dữ liệu sân bay của Hoa Kỳ. Để quản lý các cột, hãy nhấp vào Thêm bước trên thanh điều hướng ở bên phải và chọn Quản lý các cột. Các cấu hình có thể được nhìn thấy trong các ảnh chụp màn hình sau. Dưới Chuyển đổi, lựa chọn Thả cột, và dưới Các cột để thả, lựa chọn đất nước.
- Nhấp vào Xem trước và sau đó Cập nhật để thả cột.
- Feature Store là kho lưu trữ, chia sẻ và quản lý các tính năng cho các mô hình ML. Hãy bấm vào + nút bên phải Thả cột. Chọn Xuất khẩu sang Và chọn Cửa hàng tính năng SageMaker (thông qua máy tính xách tay Jupyter).
- Bằng việc lựa chọn Cửa hàng tính năng SageMaker làm đích, bạn có thể lưu các tính năng vào một nhóm tính năng hiện có hoặc tạo một nhóm tính năng mới.
Hiện chúng tôi đã tạo các tính năng bằng Data Wrangler và dễ dàng lưu trữ các tính năng đó trong Cửa hàng tính năng. Chúng tôi đã trình bày một quy trình làm việc mẫu cho kỹ thuật tính năng trong giao diện người dùng Data Wrangler. Sau đó, chúng tôi đã lưu các tính năng đó vào Cửa hàng tính năng trực tiếp từ Data Wrangler bằng cách tạo một nhóm tính năng mới. Cuối cùng, chúng tôi đã chạy một công việc xử lý để nhập các tính năng đó vào Cửa hàng tính năng. Data Wrangler và Feature Store đã cùng nhau giúp chúng tôi xây dựng các quy trình tự động và có thể lặp lại để hợp lý hóa các tác vụ chuẩn bị dữ liệu của chúng tôi với yêu cầu mã hóa tối thiểu. Data Wrangler cũng cung cấp cho chúng tôi tính linh hoạt để tự động hóa quy trình chuẩn bị dữ liệu tương tự bằng cách sử dụng công việc theo lịch trình. Chúng tôi cũng có thể tự động đào tạo và triển khai các mô hình bằng SageMaker Autopilot từ giao diện trực quan của Data Wrangler hoặc tạo quy trình đào tạo hoặc kỹ thuật tính năng với Quy trình SageMaker (thông qua Jupyter Notebook) và triển khai đến điểm cuối suy luận bằng quy trình suy luận SageMaker (thông qua Jupyter Notebook).
Làm sạch
Nếu công việc của bạn với Data Wrangler đã hoàn tất, các bước sau đây sẽ giúp bạn xóa các tài nguyên đã tạo để tránh phát sinh thêm phí.
- Tắt SageMaker Studio.
Từ trong SageMaker Studio, đóng tất cả các tab, sau đó chọn Tập tin sau đó Shut Down. Sau khi được nhắc chọn tắt máy tất cả.
Quá trình tắt máy có thể mất vài phút tùy thuộc vào loại phiên bản. Đảm bảo rằng tất cả các ứng dụng được liên kết với hồ sơ người dùng đã bị xóa. Nếu chúng không bị xóa, hãy xóa thủ công ứng dụng được liên kết trong hồ sơ người dùng.
- Dọn sạch mọi bộ chứa S3 được tạo từ quá trình khởi chạy CloudFormation.
Mở trang Amazon S3 bằng cách tìm kiếm S3 trong tìm kiếm bảng điều khiển AWS. Dọn sạch mọi bộ chứa S3 đã được tạo khi cung cấp cụm. Xô sẽ có định dạng dw-emr-hive-blog-
.
- Xóa SageMaker Studio EFS.
Mở trang EFS bằng cách tìm kiếm EFS trong tìm kiếm bảng điều khiển AWS.
Xác định vị trí hệ thống tệp được tạo bởi SageMaker. Bạn có thể xác nhận điều này bằng cách nhấp vào ID hệ thống tệp và xác nhận thẻ ManagedByAmazonSageMakerResource
trên Tag tab.
- Xóa ngăn xếp CloudFormation. Mở CloudFormation bằng cách tìm kiếm và mở dịch vụ CloudFormation từ bảng điều khiển AWS.
Chọn mẫu bắt đầu bằng dw- như hiển thị trong màn hình sau và xóa ngăn xếp như được hiển thị bằng cách nhấp vào Xóa bỏ .
Điều này được mong đợi và chúng tôi sẽ quay lại vấn đề này và làm sạch nó trong các bước tiếp theo.
- Xóa VPC sau khi ngăn xếp CloudFormation không hoàn thành. Đầu tiên hãy mở VPC từ bảng điều khiển AWS.
- Tiếp theo, xác định VPC được tạo bởi SageMaker Studio CloudFormation, có tiêu đề
dw-emr-
, rồi làm theo lời nhắc để xóa VPC. - Xóa ngăn xếp CloudFormation.
Quay lại CloudFormation và thử xóa lại ngăn xếp cho dw-emr-hive-blog
.
Hoàn thành! Giờ đây, tất cả các tài nguyên được cung cấp bởi mẫu CloudFormation được mô tả trong bài đăng trên blog này sẽ bị xóa khỏi tài khoản của bạn.
Kết luận
Trong bài đăng này, chúng tôi đã giới thiệu cách thiết lập Amazon EMR làm nguồn dữ liệu trong Data Wrangler, cách chuyển đổi và phân tích tập dữ liệu cũng như cách xuất kết quả sang luồng dữ liệu để sử dụng trong sổ ghi chép Jupyter. Sau khi trực quan hóa tập dữ liệu của mình bằng các tính năng phân tích tích hợp sẵn của Data Wrangler, chúng tôi đã nâng cao hơn nữa luồng dữ liệu của mình. Việc chúng tôi tạo ra một quy trình chuẩn bị dữ liệu mà không cần viết một dòng mã nào là rất quan trọng.
Để bắt đầu với Data Wrangler, hãy xem Chuẩn bị dữ liệu ML với Amazon SageMaker Data Wrangler và xem thông tin mới nhất về Trang sản phẩm Data Wrangler và Tài liệu kỹ thuật AWS.
Về các tác giả
Ajjay Govindaram là Kiến trúc sư giải pháp cấp cao tại AWS. Anh ấy làm việc với các khách hàng chiến lược đang sử dụng AI/ML để giải quyết các vấn đề kinh doanh phức tạp. Kinh nghiệm của anh ấy là cung cấp định hướng kỹ thuật cũng như hỗ trợ thiết kế cho các triển khai ứng dụng AI/ML quy mô nhỏ đến quy mô lớn. Kiến thức của anh bao gồm từ kiến trúc ứng dụng đến dữ liệu lớn, phân tích và máy học. Anh ấy thích nghe nhạc khi nghỉ ngơi, trải nghiệm ngoài trời và dành thời gian cho những người thân yêu của mình.
Isha Dua là Kiến trúc sư Giải pháp Cấp cao có trụ sở tại Khu vực Vịnh San Francisco. Cô giúp các khách hàng doanh nghiệp của AWS phát triển bằng cách hiểu mục tiêu và thách thức của họ, đồng thời hướng dẫn họ cách có thể kiến trúc ứng dụng của mình theo cách gốc trên đám mây trong khi vẫn đảm bảo khả năng phục hồi và khả năng mở rộng. Cô ấy đam mê công nghệ học máy và tính bền vững của môi trường.
Varun Mehta là Kiến trúc sư giải pháp tại AWS. Anh ấy đam mê giúp khách hàng xây dựng các giải pháp Kiến trúc tối ưu quy mô doanh nghiệp trên Đám mây AWS. Anh ấy làm việc với các khách hàng chiến lược đang sử dụng AI/ML để giải quyết các vấn đề kinh doanh phức tạp.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/accelerate-time-to-insight-with-amazon-sagemaker-data-wrangler-and-the-power-of-apache-hive/
- :là
- $ LÊN
- 1
- 10
- 100
- 11
- 7
- a
- Giới thiệu
- đẩy nhanh tiến độ
- truy cập
- Giao thức truy cập
- Theo
- Tài khoản
- hành động
- Ngoài ra
- thêm vào
- quản trị viên
- tư vấn
- Sau
- AI / ML
- sân bay
- Tất cả
- Cho phép
- cho phép
- Đã
- đàn bà gan dạ
- Amazon EC2
- Amazon EMR
- Amazon SageMaker
- Trình sắp xếp dữ liệu Amazon SageMaker
- Xưởng sản xuất Amazon SageMaker
- số lượng
- phân tích
- phân tích
- Phân tích
- phân tích
- phân tích
- và
- Một
- Apache
- ứng dụng
- Các Ứng Dụng
- các ứng dụng
- thích hợp
- ứng dụng
- kiến trúc
- LÀ
- KHU VỰC
- AS
- Hỗ trợ
- liên kết
- At
- xác nhận
- chứng thực
- Xác thực
- tác giả
- tự động hóa
- Tự động
- tự động
- AWS
- Hình thành đám mây AWS
- Keo AWS
- trở lại
- thanh
- dựa
- vịnh
- BE
- bởi vì
- được
- thiên vị
- lớn
- Dữ Liệu Lớn.
- Khối
- Blog
- Hộp
- mang lại
- xây dựng
- Xây dựng
- được xây dựng trong
- kinh doanh
- nút
- by
- CAN
- Danh mục hàng
- Nguyên nhân
- thách thức
- Những thay đổi
- kiểm tra
- Chọn
- Nhấp chuột
- Đóng
- đám mây
- cụm
- mã
- Lập trình
- Cột
- Cột
- Đến
- Chung
- hoàn thành
- phức tạp
- các thành phần
- Tính
- Xác nhận
- Kết nối
- kết nối
- Kết nối
- liên quan
- connect
- An ủi
- tiếp tục
- đất nước
- che
- tạo
- tạo ra
- tạo ra
- Tạo
- Credentials
- quan trọng
- đường cong
- khách hàng
- dữ liệu
- Chuẩn bị dữ liệu
- xử lý dữ liệu
- Cơ sở dữ liệu
- bộ dữ liệu
- nhiều
- Mặc định
- Nhu cầu
- chứng minh
- triển khai
- triển khai
- mô tả
- Thiết kế
- điểm đến
- chi tiết
- khác nhau
- hướng
- trực tiếp
- khám phá
- miền
- dont
- xuống
- Rơi
- hủy bỏ
- mỗi
- dễ dàng
- biên tập viên
- hay
- kích hoạt
- cho phép
- Điểm cuối
- Động cơ
- ky sư
- Kỹ Sư
- Kỹ sư
- nâng cao
- đảm bảo
- đăng ký hạng mục thi
- Doanh nghiệp
- Toàn bộ
- Môi trường
- môi trường
- thiết yếu
- thành lập
- đánh giá
- ví dụ
- ví dụ
- thực hiện
- hiện tại
- dự kiến
- kinh nghiệm
- trải qua
- khám phá
- người khám phá
- xuất khẩu
- không
- quen
- Đặc tính
- Tính năng
- Lệ Phí
- vài
- Cuối cùng
- Tên
- Sửa chữa
- dòng chảy
- theo
- tiếp theo
- Trong
- Francisco
- từ
- xa hơn
- được
- Go
- Các mục tiêu
- Nhóm
- Các nhóm
- Phát triển
- Hướng dẫn
- xử lý
- Có
- giúp đỡ
- đã giúp
- giúp đỡ
- giúp
- Tổ ong
- Trang Chủ
- chủ nhà
- Độ đáng tin của
- Hướng dẫn
- Tuy nhiên
- HTML
- http
- HTTPS
- xác định
- Bản sắc
- nhập khẩu
- nhập khẩu
- in
- Bao gồm
- thông tin
- cái nhìn sâu sắc
- ví dụ
- tương tác
- Giao thức
- tham gia
- các vấn đề
- IT
- Việc làm
- việc làm
- jpg
- kiến thức
- lớn
- quy mô lớn
- Họ
- mới nhất
- phóng
- học tập
- Tỉ lệ đòn bẩy
- nằm
- trọng lượng nhẹ
- LIMIT
- Dòng
- Listening
- dài
- thời gian dài
- Xem
- yêu
- máy
- học máy
- làm cho
- quản lý
- quản lý
- cách thức
- thủ công
- Menu
- Might
- tối thiểu
- Phút
- mất tích
- ML
- Chế độ
- kiểu mẫu
- mô hình
- chi tiết
- hầu hết
- nhiều
- Âm nhạc
- tên
- Được đặt theo tên
- tên
- THÔNG TIN
- Cần
- Mới
- máy tính xách tay
- of
- on
- ONE
- đang diễn ra
- mở
- mở
- Tùy chọn
- Các lựa chọn
- Nền tảng khác
- ngoài trời
- trang
- thông số
- một phần
- đam mê
- Mật khẩu
- Thực hiện
- thực hiện
- quyền
- đường ống dẫn
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Phổ biến
- Bài đăng
- quyền lực
- Chuẩn bị
- chuẩn bị
- Xem trước
- vấn đề
- quá trình
- Quy trình
- xử lý
- Sản phẩm
- chuyên gia
- Hồ sơ
- giao thức
- cho
- cung cấp
- cung cấp
- cung cấp
- chất lượng
- Mau
- ngẫu nhiên
- sẵn sàng
- khuyến nghị
- hồ sơ
- giảm
- làm giảm
- khu
- tẩy
- Đã loại bỏ
- có thể lặp lại
- Báo cáo
- kho
- đại diện cho
- cần phải
- khả năng phục hồi
- Thông tin
- Kết quả
- xem xét
- Vai trò
- chạy
- chạy
- nhà làm hiền triết
- Suy luận của SageMaker
- Đường ống SageMaker
- tương tự
- San
- San Francisco
- Lưu
- khả năng mở rộng
- Quy mô
- kịch bản
- lịch trình
- các nhà khoa học
- Màn
- ảnh chụp màn hình
- Tìm kiếm
- tìm kiếm
- Bí mật
- Phần
- an ninh
- chọn
- lựa chọn
- lựa chọn
- cao cấp
- dịch vụ
- định
- thiết lập
- Chia sẻ
- nên
- thể hiện
- có ý nghĩa
- đơn giản
- kể từ khi
- duy nhất
- Kích thước máy
- So
- giải pháp
- Giải pháp
- động SOLVE
- một số
- nguồn
- nguồn
- Spark
- đặc biệt
- Chi
- Spot
- ngăn xếp
- Stacks
- Tiêu chuẩn
- bắt đầu
- Bắt đầu
- Tuyên bố
- số liệu thống kê
- Trạng thái
- Bước
- Các bước
- hàng
- lưu trữ
- Chiến lược
- hợp lý hóa
- phòng thu
- mạng con
- tiếp theo
- Thành công
- như vậy
- Hỗ trợ
- Tính bền vững
- hệ thống
- bàn
- TAG
- Hãy
- mất
- dùng
- nhiệm vụ
- Kỹ thuật
- Công nghệ
- mẫu
- mẫu
- Cảm ơn
- việc này
- Sản phẩm
- cung cấp their dịch
- Them
- Kia là
- của bên thứ ba
- Thông qua
- thời gian
- đến
- bây giờ
- bên nhau
- hàng đầu
- Train
- Hội thảo
- Chuyển đổi
- biến đổi
- ui
- Dưới
- sự hiểu biết
- độc đáo
- phổ cập
- Cập nhật
- URL
- us
- sử dụng
- người sử dang
- thường
- giá trị
- Các giá trị
- nhiều
- khác nhau
- thông qua
- Xem
- chờ đợi
- Đường..
- tuần
- TỐT
- cái nào
- trong khi
- CHÚNG TÔI LÀ
- rộng
- Wikipedia
- sẽ
- với
- ở trong
- không có
- Công việc
- công trinh
- sẽ
- viết
- viết mã
- viết
- khoai mỡ
- Bạn
- trên màn hình
- zephyrnet