การเตรียมข้อมูลเป็นขั้นตอนสำคัญในโครงการที่ขับเคลื่อนด้วยข้อมูล และการมีเครื่องมือที่เหมาะสมจะช่วยเพิ่มประสิทธิภาพในการปฏิบัติงานได้อย่างมาก Amazon SageMaker ข้อมูล Wrangler ลดเวลาที่ใช้ในการรวบรวมและเตรียมข้อมูลแบบตารางและรูปภาพสำหรับแมชชีนเลิร์นนิง (ML) จากหลายสัปดาห์เหลือเป็นนาที ด้วย SageMaker Data Wrangler คุณสามารถลดความซับซ้อนของกระบวนการเตรียมข้อมูลและวิศวกรรมคุณลักษณะ และทำแต่ละขั้นตอนของเวิร์กโฟลว์การเตรียมข้อมูลให้เสร็จสมบูรณ์ ซึ่งรวมถึงการเลือกข้อมูล การล้างข้อมูล การสำรวจ และการสร้างภาพข้อมูลจากอินเทอร์เฟซภาพเดียว
ในโพสต์นี้ เราจะสำรวจคุณสมบัติล่าสุดของ SageMaker Data Wrangler ที่ออกแบบมาโดยเฉพาะเพื่อปรับปรุงประสบการณ์การปฏิบัติงาน เราเจาะลึกถึงการสนับสนุนของ บริการจัดเก็บอย่างง่าย (อเมซอน เอส3) ประจักษ์ ไฟล์ การอนุมานสิ่งประดิษฐ์ในการไหลของข้อมูลแบบโต้ตอบ และการผสานรวมที่ไร้รอยต่อกับ JSON (สัญกรณ์วัตถุ JavaScript) รูปแบบสำหรับการอนุมาน โดยเน้นว่าการปรับปรุงเหล่านี้ทำให้การเตรียมข้อมูลง่ายขึ้นและมีประสิทธิภาพมากขึ้นได้อย่างไร
ขอแนะนำคุณสมบัติใหม่
ในส่วนนี้ เราจะพูดถึงคุณสมบัติใหม่ของ SageMaker Data Wrangler เพื่อการเตรียมข้อมูลที่เหมาะสมที่สุด
รองรับไฟล์รายการ S3 ด้วย SageMaker Autopilot สำหรับการอนุมาน ML
SageMaker Data Wrangler เปิดใช้งาน การเตรียมข้อมูลแบบครบวงจรและการฝึกอบรมแบบจำลอง ประสบการณ์กับ ระบบนำร่องอัตโนมัติของ Amazon SageMaker ในไม่กี่คลิก คุณสามารถใช้ SageMaker Autopilot เพื่อฝึก ปรับแต่ง และปรับใช้โมเดลโดยอัตโนมัติกับข้อมูลที่คุณแปลงในโฟลว์ข้อมูลของคุณ
ประสบการณ์นี้ทำให้ง่ายขึ้นด้วยการสนับสนุนไฟล์รายการ S3 ไฟล์รายการ S3 คือไฟล์ข้อความที่แสดงรายการออบเจกต์ (ไฟล์) ที่จัดเก็บไว้ในบัคเก็ต S3 หากชุดข้อมูลที่ส่งออกของคุณใน SageMaker Data Wrangler ค่อนข้างใหญ่และแยกเป็นไฟล์ข้อมูลหลายส่วนใน Amazon S3 ตอนนี้ SageMaker Data Wrangler จะสร้างไฟล์รายการใน S3 แทนไฟล์ข้อมูลเหล่านี้ทั้งหมดโดยอัตโนมัติ ตอนนี้ไฟล์รายการที่สร้างขึ้นนี้สามารถใช้กับ SageMaker Autopilot UI ใน SageMaker Data Wrangler เพื่อรับข้อมูลที่แบ่งพาร์ติชันทั้งหมดสำหรับการฝึกอบรม
ก่อนเปิดตัวฟีเจอร์นี้ เมื่อใช้โมเดล SageMaker Autopilot ที่ฝึกกับข้อมูลที่เตรียมไว้จาก SageMaker Data Wrangler คุณสามารถเลือกไฟล์ข้อมูลได้เพียงไฟล์เดียว ซึ่งอาจไม่ได้แสดงถึงชุดข้อมูลทั้งหมด โดยเฉพาะอย่างยิ่งหากชุดข้อมูลมีขนาดใหญ่มาก ด้วยประสบการณ์ไฟล์รายการใหม่นี้ คุณจะไม่จำกัดเฉพาะชุดย่อยของชุดข้อมูลของคุณ คุณสามารถสร้างแบบจำลอง ML ด้วย SageMaker Autopilot ซึ่งแสดงข้อมูลทั้งหมดของคุณโดยใช้ไฟล์รายการ และใช้สิ่งนั้นสำหรับการอนุมาน ML และการปรับใช้การผลิต คุณลักษณะนี้ช่วยเพิ่มประสิทธิภาพการดำเนินงานโดยทำให้โมเดล ML การฝึกอบรมง่ายขึ้นด้วย SageMaker Autopilot และเพิ่มความคล่องตัวให้กับเวิร์กโฟลว์การประมวลผลข้อมูล
เพิ่มการรองรับโฟลว์การอนุมานในสิ่งประดิษฐ์ที่สร้างขึ้น
ลูกค้าต้องการนำการแปลงข้อมูลไปใช้กับข้อมูลการฝึกโมเดล เช่น การเข้ารหัสแบบ one-hot, PCA และการป้อนค่าที่ขาดหายไป และใช้การแปลงข้อมูลเหล่านั้นกับการอนุมานแบบเรียลไทม์หรือการอนุมานแบบกลุ่มในการผลิต ในการทำเช่นนั้น คุณต้องมีส่วนอนุมานของ SageMaker Data Wrangler ซึ่งใช้โดยโมเดล SageMaker
ก่อนหน้านี้ สิ่งประดิษฐ์การอนุมานสามารถสร้างได้จาก UI เมื่อส่งออกไปยังการฝึกอบรม SageMaker Autopilot หรือส่งออกสมุดบันทึกไปป์ไลน์การอนุมานเท่านั้น การดำเนินการนี้ไม่ได้ให้ความยืดหยุ่นหากคุณต้องการนำโฟลว์ SageMaker Data Wrangler ของคุณไปใช้ภายนอก สตูดิโอ Amazon SageMaker สิ่งแวดล้อม. ตอนนี้ คุณสามารถสร้างสิ่งประดิษฐ์อนุมานสำหรับไฟล์โฟลว์ที่เข้ากันได้ผ่านงานประมวลผล SageMaker Data Wrangler ซึ่งช่วยให้ MLOps แบบเป็นโปรแกรมตั้งแต่ต้นจนจบด้วยโฟลว์ SageMaker Data Wrangler สำหรับ MLOps ที่ใช้โค้ดเป็นตัวแรก เช่นเดียวกับเส้นทางที่ใช้งานง่ายและไม่ต้องใช้โค้ดเพื่อรับสิ่งประดิษฐ์อนุมานโดยการสร้างงานจาก UI
การเตรียมข้อมูลที่คล่องตัว
JSON ได้กลายเป็นรูปแบบที่ใช้กันอย่างแพร่หลายสำหรับการแลกเปลี่ยนข้อมูลในระบบนิเวศข้อมูลสมัยใหม่ การผสานรวม SageMaker Data Wrangler กับรูปแบบ JSON ช่วยให้คุณจัดการข้อมูล JSON ได้อย่างราบรื่นสำหรับการแปลงและล้างข้อมูล ด้วยการให้การสนับสนุนแบบเนทีฟสำหรับ JSON ทำให้ SageMaker Data Wrangler ลดความซับซ้อนของกระบวนการทำงานกับข้อมูลที่มีโครงสร้างและกึ่งโครงสร้าง ทำให้คุณสามารถดึงข้อมูลเชิงลึกอันมีค่าและเตรียมข้อมูลได้อย่างมีประสิทธิภาพ ขณะนี้ SageMaker Data Wrangler รองรับรูปแบบ JSON สำหรับการปรับใช้จุดสิ้นสุดแบบอนุมานทั้งแบบกลุ่มและแบบเรียลไทม์
ภาพรวมโซลูชัน
สำหรับกรณีการใช้งานของเรา เราใช้ตัวอย่าง ชุดข้อมูลรีวิวลูกค้าของ Amazon เพื่อแสดงให้เห็นว่า SageMaker Data Wrangler สามารถลดความซับซ้อนของการดำเนินการในการสร้างโมเดล ML ใหม่โดยใช้ SageMaker Autopilot ได้อย่างไร ชุดข้อมูลรีวิวลูกค้าของ Amazon ประกอบด้วยรีวิวผลิตภัณฑ์และข้อมูลเมตาจาก Amazon รวมถึงรีวิว 142.8 ล้านรายการในช่วงเดือนพฤษภาคม 1996 ถึงกรกฎาคม 2014
ในระดับสูง เราใช้ SageMaker Data Wrangler เพื่อจัดการชุดข้อมูลขนาดใหญ่นี้และดำเนินการต่อไปนี้:
- พัฒนาโมเดล ML ใน SageMaker Autopilot โดยใช้ชุดข้อมูลทั้งหมด ไม่ใช่แค่ตัวอย่าง
- สร้างไปป์ไลน์การอนุมานแบบเรียลไทม์ด้วยสิ่งประดิษฐ์การอนุมานที่สร้างโดย SageMaker Data Wrangler และใช้การจัดรูปแบบ JSON สำหรับอินพุตและเอาต์พุต
รองรับไฟล์รายการ S3 ด้วย SageMaker Autopilot
เมื่อสร้างการทดสอบ SageMaker Autopilot โดยใช้ SageMaker Data Wrangler ก่อนหน้านี้ คุณสามารถระบุไฟล์ CSV หรือ Parquet ไฟล์เดียวเท่านั้น ตอนนี้ คุณยังสามารถใช้ไฟล์รายการ S3 ซึ่งช่วยให้คุณใช้ข้อมูลจำนวนมากสำหรับการทดลอง SageMaker Autopilot SageMaker Data Wrangler จะแบ่งไฟล์ข้อมูลอินพุตออกเป็นไฟล์ขนาดเล็กหลายไฟล์โดยอัตโนมัติ และสร้างรายการที่สามารถใช้ในการทดลอง SageMaker Autopilot เพื่อดึงข้อมูลทั้งหมดจากเซสชันแบบโต้ตอบ ไม่ใช่แค่ตัวอย่างเล็กๆ
ทำตามขั้นตอนต่อไปนี้:
- นำเข้าข้อมูลรีวิวจากลูกค้าของ Amazon จากไฟล์ CSV ไปยัง SageMaker Data Wrangler ตรวจสอบให้แน่ใจว่าได้ปิดใช้งานการสุ่มตัวอย่างเมื่อนำเข้าข้อมูล
- ระบุการแปลงที่ทำให้ข้อมูลเป็นปกติ สำหรับตัวอย่างนี้ ลบสัญลักษณ์และแปลงทุกอย่างเป็นตัวพิมพ์เล็กโดยใช้การแปลงในตัวของ SageMaker Data Wrangler
- Choose โมเดลรถไฟ เพื่อเริ่มการฝึก
ในการฝึกโมเดลด้วย SageMaker Autopilot นั้น SageMaker จะส่งออกข้อมูลไปยังบัคเก็ต S3 โดยอัตโนมัติ สำหรับชุดข้อมูลขนาดใหญ่เช่นนี้ ชุดข้อมูลจะแบ่งไฟล์ออกเป็นไฟล์ขนาดเล็กโดยอัตโนมัติ และสร้างรายการที่มีตำแหน่งของไฟล์ขนาดเล็ก
- ขั้นแรก เลือกข้อมูลที่คุณป้อน
ก่อนหน้านี้ SageMaker Data Wrangler ไม่มีตัวเลือกในการสร้างไฟล์รายการเพื่อใช้กับ SageMaker Autopilot วันนี้ ด้วยการเปิดตัวการรองรับไฟล์รายการ SageMaker Data Wrangler จะส่งออกไฟล์รายการไปยัง Amazon S3 โดยอัตโนมัติ เติมตำแหน่ง S3 ล่วงหน้าของการฝึกอบรม SageMaker Autopilot ด้วยตำแหน่งไฟล์รายการ S3 และสลับตัวเลือกไฟล์รายการเป็น ใช่. ไม่จำเป็นต้องดำเนินการใดๆ ในการสร้างหรือใช้ไฟล์รายการ
- กำหนดค่าการทดสอบของคุณโดยเลือกเป้าหมายสำหรับแบบจำลองที่จะทำนาย
- จากนั้น เลือกวิธีการฝึกอบรม ในกรณีนี้ เราเลือก รถยนต์ และให้ SageMaker Autopilot ตัดสินใจเลือกวิธีการฝึกอบรมที่ดีที่สุดตามขนาดชุดข้อมูล
- ระบุการตั้งค่าการปรับใช้
- สุดท้าย ตรวจสอบการกำหนดค่างานและส่งการทดสอบ SageMaker Autopilot สำหรับการฝึกอบรม เมื่อ SageMaker Autopilot เสร็จสิ้นการทดสอบ คุณสามารถดูผลการฝึกอบรมและสำรวจแบบจำลองที่ดีที่สุดได้
ด้วยการสนับสนุนสำหรับไฟล์รายการ คุณสามารถใช้ชุดข้อมูลทั้งหมดของคุณสำหรับการทดลอง SageMaker Autopilot ไม่ใช่เพียงชุดย่อยของข้อมูลของคุณ
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการใช้ SageMaker Autopilot กับ SageMaker Data Wrangler โปรดดู การเตรียมข้อมูลแบบรวมและการฝึกโมเดลด้วย Amazon SageMaker Data Wrangler และ Amazon SageMaker Autopilot
สร้างการอนุมานจากงาน SageMaker Processing
ตอนนี้ มาดูกันว่าเราสามารถสร้างสิ่งประดิษฐ์อนุมานผ่านทั้ง SageMaker Data Wrangler UI และโน้ตบุ๊ก SageMaker Data Wrangler ได้อย่างไร
UI ของ Wrangler ข้อมูล SageMaker
สำหรับกรณีการใช้งานของเรา เราต้องการประมวลผลข้อมูลของเราผ่าน UI จากนั้นใช้ข้อมูลผลลัพธ์เพื่อฝึกและปรับใช้โมเดลผ่านคอนโซล SageMaker ทำตามขั้นตอนต่อไปนี้:
- เปิดโฟลว์ข้อมูลที่คุณสร้างขึ้นในส่วนก่อนหน้านี้
- เลือกเครื่องหมายบวกถัดจากการแปลงครั้งล่าสุด เลือก เพิ่มปลายทางและเลือก Amazon S3. นี่จะเป็นที่เก็บข้อมูลที่ประมวลผลแล้ว
- Choose สร้างงาน.
- เลือก สร้างสิ่งประดิษฐ์อนุมาน ในส่วนพารามิเตอร์การอนุมานเพื่อสร้างสิ่งประดิษฐ์การอนุมาน
- สำหรับชื่อสิ่งประดิษฐ์อนุมาน ให้ป้อนชื่อสิ่งประดิษฐ์อนุมานของคุณ (โดยมีนามสกุลไฟล์เป็น .tar.gz)
- สำหรับโหนดเอาต์พุตการอนุมาน ให้ป้อนโหนดปลายทางที่สอดคล้องกับการแปลงที่ใช้กับข้อมูลการฝึกอบรมของคุณ
- Choose กำหนดค่างาน.
- ภายใต้ การกำหนดค่างานป้อนเส้นทางสำหรับ ตำแหน่งไฟล์โฟลว์ S3. โฟลเดอร์ที่เรียกว่า
data_wrangler_flows
จะถูกสร้างขึ้นภายใต้ตำแหน่งนี้ และอาร์ติแฟกต์การอนุมานจะถูกอัปโหลดไปยังโฟลเดอร์นี้ หากต้องการเปลี่ยนตำแหน่งอัปโหลด ให้ตั้งค่าตำแหน่ง S3 อื่น - ปล่อยค่าเริ่มต้นสำหรับตัวเลือกอื่นๆ ทั้งหมดแล้วเลือก สร้างบัญชีตัวแทน เพื่อสร้างงานการประมวลผล
งานประมวลผลจะสร้างtarball (.tar.gz)
มีไฟล์โฟลว์ข้อมูลที่แก้ไขพร้อมส่วนการอนุมานที่เพิ่มเข้ามาใหม่ ซึ่งอนุญาตให้คุณใช้สำหรับการอนุมาน คุณต้องมี S3 Uniform Resource Identifier (URI) ของสิ่งประดิษฐ์เพื่อการอนุมานเพื่อจัดเตรียมสิ่งประดิษฐ์ให้กับโมเดล SageMaker เมื่อปรับใช้โซลูชันการอนุมานของคุณ URI จะอยู่ในรูปแบบ{Flow file S3 location}/data_wrangler_flows/{inference artifact name}.tar.gz
. - หากคุณไม่ได้จดบันทึกค่าเหล่านี้ไว้ก่อนหน้านี้ คุณสามารถเลือกลิงก์ไปยังงานการประมวลผลเพื่อดูรายละเอียดที่เกี่ยวข้องได้ ในตัวอย่างของเรา URI คือ
s3://sagemaker-us-east-1-43257985977/data_wrangler_flows/example-2023-05-30T12-20-18.tar.gz.
- คัดลอกค่าของ ประมวลภาพ; เราต้องการ URI นี้เมื่อสร้างโมเดลของเราด้วย
- ขณะนี้เราสามารถใช้ URI นี้เพื่อสร้างโมเดล SageMaker บนคอนโซล SageMaker ซึ่งเราสามารถนำไปใช้กับตำแหน่งข้อมูลหรืองานการแปลงเป็นชุดได้ในภายหลัง
- ภายใต้ การตั้งค่าโมเดล¸ ป้อนชื่อรุ่นและระบุบทบาท IAM ของคุณ
- สำหรับ ตัวเลือกอินพุตคอนเทนเนอร์ให้เลือก จัดเตรียมสิ่งประดิษฐ์แบบจำลองและตำแหน่งภาพการอนุมาน.
- สำหรับ ตำแหน่งของภาพรหัสอนุมานป้อน URI ของรูปภาพที่กำลังประมวลผล
- สำหรับ ที่ตั้งของสิ่งประดิษฐ์แบบจำลองป้อน URI สิ่งประดิษฐ์อนุมาน
- นอกจากนี้ หากข้อมูลของคุณมีคอลัมน์เป้าหมายที่โมเดล ML ที่ผ่านการฝึกอบรมจะคาดการณ์ไว้ ให้ระบุชื่อของคอลัมน์นั้นภายใต้ ตัวแปรสภาพแวดล้อมมี
INFERENCE_TARGET_COLUMN_NAME
as คีย์ และชื่อคอลัมน์ว่า ความคุ้มค่า. - สร้างแบบจำลองของคุณให้เสร็จโดยเลือก สร้างแบบจำลอง.
ตอนนี้เรามีโมเดลที่เราปรับใช้กับจุดสิ้นสุดหรืองานการแปลงเป็นชุดได้
สมุดบันทึก SageMaker Data Wrangler
สำหรับวิธีการใช้โค้ดเป็นอันดับแรกเพื่อสร้างสิ่งประดิษฐ์อนุมานจากงานการประมวลผล เราสามารถค้นหาโค้ดตัวอย่างได้โดยเลือก ส่งออกไปที่ บนเมนูโหนดและเลือกอย่างใดอย่างหนึ่ง Amazon S3, ท่อส่ง SageMaker,หรือ ไปป์ไลน์การอนุมานของ SageMaker. พวกเราเลือก ไปป์ไลน์การอนุมานของ SageMaker ในตัวอย่างนี้
ในสมุดบันทึกนี้มีหัวข้อ สร้างโปรเซสเซอร์ (ซึ่งเหมือนกันในโน้ตบุ๊ก SageMaker Pipelines แต่ในโน้ตบุ๊ก Amazon S3 รหัสที่เทียบเท่าจะอยู่ภายใต้ การกำหนดค่างาน ส่วน). ที่ด้านล่างของส่วนนี้คือการกำหนดค่าสำหรับสิ่งประดิษฐ์อนุมานของเราที่เรียกว่า inference_params
. มันมีข้อมูลเดียวกันกับที่เราเห็นใน UI นั่นคือชื่อสิ่งประดิษฐ์การอนุมานและโหนดเอาต์พุตการอนุมาน ค่าเหล่านี้จะถูกเติมไว้ล่วงหน้า แต่สามารถแก้ไขได้ นอกจากนี้ยังมีพารามิเตอร์ที่เรียกว่า use_inference_params
ซึ่งจำเป็นต้องตั้งค่าเป็น True
เพื่อใช้การกำหนดค่านี้ในงานการประมวลผล
ถัดลงมาคือหัวข้อ กำหนดขั้นตอนไปป์ไลน์ที่นี่มี inference_params
การกำหนดค่าจะถูกผนวกเข้ากับรายการอาร์กิวเมนต์งานและส่งผ่านไปยังคำจำกัดความสำหรับขั้นตอนการประมวลผล SageMaker Data Wrangler ในสมุดบันทึก Amazon S3 job_arguments
ถูกกำหนดทันทีหลังจาก การกำหนดค่างาน มาตรา.
ด้วยการกำหนดค่าอย่างง่ายเหล่านี้ งานการประมวลผลที่สร้างโดยสมุดบันทึกนี้จะสร้างสิ่งประดิษฐ์อนุมานในตำแหน่ง S3 เดียวกันกับไฟล์โฟลว์ของเรา (กำหนดไว้ก่อนหน้านี้ในสมุดบันทึกของเรา) เราสามารถระบุตำแหน่ง S3 นี้ทางโปรแกรมและใช้สิ่งประดิษฐ์นี้เพื่อสร้างแบบจำลอง SageMaker โดยใช้ SageMaker Python SDKซึ่งแสดงให้เห็นในสมุดบันทึก SageMaker Inference Pipeline
วิธีการเดียวกันนี้สามารถนำไปใช้กับโค้ด Python ใดๆ ที่สร้างงานประมวลผล SageMaker Data Wrangler
รองรับรูปแบบไฟล์ JSON สำหรับอินพุตและเอาต์พุตระหว่างการอนุมาน
เป็นเรื่องปกติที่เว็บไซต์และแอปพลิเคชันจะใช้ JSON เป็นคำขอ/ตอบกลับสำหรับ API เพื่อให้แยกวิเคราะห์ข้อมูลได้ง่ายด้วยภาษาโปรแกรมต่างๆ
ก่อนหน้านี้ หลังจากที่คุณมีโมเดลที่ผ่านการฝึกอบรมแล้ว คุณสามารถโต้ตอบกับโมเดลผ่าน CSV เป็นรูปแบบอินพุตในไปป์ไลน์การอนุมานของ SageMaker Data Wrangler เท่านั้น วันนี้ คุณสามารถใช้ JSON เป็นรูปแบบอินพุตและเอาต์พุต ซึ่งให้ความยืดหยุ่นมากขึ้นเมื่อโต้ตอบกับคอนเทนเนอร์การอนุมานของ SageMaker Data Wrangler
หากต้องการเริ่มต้นใช้งาน JSON สำหรับอินพุตและเอาต์พุตในโน้ตบุ๊กไปป์ไลน์การอนุมาน ให้ทำตามขั้นตอนต่อไปนี้:
- กำหนดเพย์โหลด
สำหรับเพย์โหลดแต่ละรายการ โมเดลต้องการอินสแตนซ์ชื่อคีย์ ค่าคือรายการของวัตถุ แต่ละรายการเป็นจุดข้อมูลของตัวเอง อ็อบเจกต์ต้องการคีย์ที่เรียกว่าฟีเจอร์ และค่าควรเป็นฟีเจอร์ของจุดข้อมูลเดียวที่ตั้งใจส่งไปยังโมเดล สามารถส่งจุดข้อมูลหลายจุดในคำขอเดียว โดยมีขนาดรวมสูงสุด 6 MB ต่อคำขอ
ดูรหัสต่อไปนี้:
- ระบุ
ContentType
asapplication/json
. - ให้ข้อมูลกับโมเดลและรับการอนุมานในรูปแบบ JSON
ดู รูปแบบข้อมูลทั่วไปสำหรับการอนุมาน สำหรับตัวอย่างอินพุตและเอาต์พุต JSON ตัวอย่าง
ทำความสะอาด
เมื่อคุณใช้งาน SageMaker Data Wrangler เสร็จแล้ว เราขอแนะนำให้คุณปิดอินสแตนซ์ที่เรียกใช้เพื่อหลีกเลี่ยงการเรียกเก็บเงินเพิ่มเติม สำหรับคำแนะนำเกี่ยวกับวิธีปิดแอป SageMaker Data Wrangler และอินสแตนซ์ที่เกี่ยวข้อง โปรดดูที่ ปิด Data Wrangler.
สรุป
คุณลักษณะใหม่ของ SageMaker Data Wrangler รวมถึงการรองรับไฟล์รายการ S3, ความสามารถในการอนุมาน และการรวมรูปแบบ JSON จะเปลี่ยนประสบการณ์การดำเนินงานของการเตรียมข้อมูล การปรับปรุงเหล่านี้ช่วยเพิ่มความคล่องตัวในการนำเข้าข้อมูล ทำการแปลงข้อมูลโดยอัตโนมัติ และทำให้การทำงานกับข้อมูล JSON ง่ายขึ้น ด้วยคุณสมบัติเหล่านี้ คุณสามารถปรับปรุงประสิทธิภาพการดำเนินงาน ลดความพยายามด้วยตนเอง และดึงข้อมูลเชิงลึกอันมีค่าจากข้อมูลของคุณได้อย่างง่ายดาย น้อมรับพลังของคุณสมบัติใหม่ของ SageMaker Data Wrangler และปลดล็อกศักยภาพทั้งหมดของเวิร์กโฟลว์การเตรียมข้อมูลของคุณ
หากต้องการเริ่มต้นใช้งาน SageMaker Data Wrangler โปรดดูข้อมูลล่าสุดเกี่ยวกับ หน้าผลิตภัณฑ์ SageMaker Data Wrangler.
เกี่ยวกับผู้แต่ง
มูนิช ดาบรา เป็น Principal Solutions Architect ที่ Amazon Web Services (AWS) ประเด็นที่เขาสนใจในปัจจุบันคือ AI/ML และความสามารถในการสังเกต เขามีภูมิหลังที่แข็งแกร่งในการออกแบบและสร้างระบบกระจายที่ปรับขนาดได้ เขาชอบช่วยเหลือลูกค้าในการคิดค้นและเปลี่ยนแปลงธุรกิจของพวกเขาใน AWS ลิงค์อิน: /mdabra
แพทริค ลิน เป็นวิศวกรพัฒนาซอฟต์แวร์ของ Amazon SageMaker Data Wrangler เขามุ่งมั่นที่จะทำให้ Amazon SageMaker Data Wrangler เป็นเครื่องมือเตรียมข้อมูลอันดับหนึ่งสำหรับเวิร์กโฟลว์ ML ที่ใช้งานจริง นอกที่ทำงาน คุณสามารถหาเขาได้อ่านหนังสือ ฟังเพลง สนทนากับเพื่อนๆ และรับใช้ที่โบสถ์ของเขา
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. ยานยนต์ / EVs, คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- BlockOffsets การปรับปรุงการเป็นเจ้าของออฟเซ็ตด้านสิ่งแวดล้อมให้ทันสมัย เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/optimize-data-preparation-with-new-features-in-aws-sagemaker-data-wrangler/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 100
- 1996
- 2014
- 7
- 8
- 9
- a
- การปฏิบัติ
- ที่เพิ่ม
- เพิ่มเติม
- นอกจากนี้
- บุญธรรม
- หลังจาก
- AI / ML
- ทั้งหมด
- การอนุญาต
- ช่วยให้
- ด้วย
- อเมซอน
- อเมซอน SageMaker
- ระบบนำร่องอัตโนมัติของ Amazon SageMaker
- Amazon SageMaker ข้อมูล Wrangler
- Amazon Web Services
- Amazon Web Services (AWS)
- จำนวน
- an
- และ
- ใด
- APIs
- app
- การใช้งาน
- ประยุกต์
- ใช้
- เข้าใกล้
- เป็น
- พื้นที่
- ข้อโต้แย้ง
- AS
- ที่เกี่ยวข้อง
- At
- โดยอัตโนมัติ
- อัตโนมัติ
- หลีกเลี่ยง
- AWS
- พื้นหลัง
- ตาม
- BE
- กลายเป็น
- กำลัง
- ที่ดีที่สุด
- ใหญ่
- ทั้งสอง
- ด้านล่าง
- ทำลาย
- สร้าง
- การก่อสร้าง
- built-in
- ธุรกิจ
- แต่
- by
- ที่เรียกว่า
- CAN
- ความสามารถในการ
- กรณี
- เปลี่ยนแปลง
- โหลด
- ตรวจสอบ
- Choose
- เลือก
- โบสถ์
- การทำความสะอาด
- รหัส
- คอลัมน์
- มุ่งมั่น
- ร่วมกัน
- เข้ากันได้
- สมบูรณ์
- เสร็จสิ้น
- องค์ประกอบ
- ปลอบใจ
- ถูกใช้
- ภาชนะบรรจุ
- มี
- การสนทนา
- ตรงกัน
- ได้
- สร้าง
- ที่สร้างขึ้น
- สร้าง
- การสร้าง
- วิกฤติ
- ปัจจุบัน
- ลูกค้า
- ลูกค้า
- ข้อมูล
- การแลกเปลี่ยนข้อมูล
- จุดข้อมูล
- การเตรียมข้อมูล
- การประมวลผล
- ที่ขับเคลื่อนด้วยข้อมูล
- ชุดข้อมูล
- วัน
- ตัดสินใจ
- ค่าเริ่มต้น
- กำหนด
- คำนิยาม
- คุ้ย
- แสดงให้เห็นถึง
- ปรับใช้
- ปรับใช้
- การใช้งาน
- ได้รับการออกแบบ
- การออกแบบ
- ปลายทาง
- รายละเอียด
- กำหนด
- พัฒนาการ
- ต่าง
- สนทนา
- กระจาย
- ระบบกระจาย
- do
- ลง
- ในระหว่าง
- แต่ละ
- ก่อน
- ความสะดวก
- ง่ายดาย
- ง่าย
- ระบบนิเวศ
- อย่างมีประสิทธิภาพ
- ที่มีประสิทธิภาพ
- อย่างมีประสิทธิภาพ
- ความพยายาม
- ทั้ง
- โอบกอด
- ช่วยให้
- การเปิดใช้งาน
- จบสิ้น
- ปลายทาง
- วิศวกร
- ชั้นเยี่ยม
- เสริม
- ปรับปรุง
- ช่วย
- เข้าสู่
- ทั้งหมด
- สิ่งแวดล้อม
- เท่ากัน
- โดยเฉพาะอย่างยิ่ง
- เคย
- ทุกๆ
- ทุกวัน
- ทุกอย่าง
- ตัวอย่าง
- ตัวอย่าง
- ตลาดแลกเปลี่ยน
- คาดหวังว่า
- ประสบการณ์
- การทดลอง
- การทดลอง
- การสำรวจ
- สำรวจ
- ส่งออก
- การส่งออก
- นามสกุล
- สารสกัด
- ลักษณะ
- คุณสมบัติ
- สองสาม
- เนื้อไม่มีมัน
- ไฟล์
- หา
- ความยืดหยุ่น
- ไหล
- กระแส
- โฟกัส
- ปฏิบัติตาม
- ดังต่อไปนี้
- สำหรับ
- ฟอร์ม
- รูป
- เพื่อน
- ราคาเริ่มต้นที่
- เต็ม
- ต่อไป
- สร้าง
- สร้าง
- ได้รับ
- อย่างมาก
- มี
- จัดการ
- มี
- มี
- he
- การช่วยเหลือ
- จุดสูง
- ไฮไลต์
- พระองค์
- ของเขา
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTML
- HTTPS
- i
- identiques
- ระบุ
- if
- ภาพ
- ทันที
- นำเข้า
- การนำเข้า
- ปรับปรุง
- in
- รวมถึง
- รวมทั้ง
- ข้อมูล
- เราสร้างสรรค์สิ่งใหม่ ๆ
- อินพุต
- ข้อมูลเชิงลึก
- ตัวอย่าง
- คำแนะนำการใช้
- บูรณาการ
- ตั้งใจว่า
- โต้ตอบ
- การมีปฏิสัมพันธ์
- การโต้ตอบ
- อินเตอร์เฟซ
- เข้าไป
- ใช้งานง่าย
- IT
- ITS
- JavaScript
- การสัมภาษณ์
- jpg
- JSON
- กรกฎาคม
- เพียงแค่
- คีย์
- ภาษา
- ใหญ่
- ชื่อสกุล
- ต่อมา
- ล่าสุด
- เปิดตัว
- การเรียนรู้
- ให้
- ชั้น
- กดไลก์
- ถูก จำกัด
- LINK
- รายการ
- การฟัง
- รายการ
- ที่ตั้ง
- ดู
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- การทำ
- จัดการ
- คู่มือ
- อาจ..
- เมนู
- เมตาดาต้า
- วิธี
- อาจ
- ล้าน
- นาที
- หายไป
- ML
- ม.ป.ป
- แบบ
- โมเดล
- ทันสมัย
- การแก้ไข
- ข้อมูลเพิ่มเติม
- มีประสิทธิภาพมากขึ้น
- หลาย
- ดนตรี
- ต้อง
- ชื่อ
- ที่มีชื่อ
- คือ
- พื้นเมือง
- จำเป็น
- จำเป็นต้อง
- ความต้องการ
- ใหม่
- คุณสมบัติใหม่
- ใหม่
- ถัดไป
- ไม่
- ปม
- สมุดบันทึก
- ตอนนี้
- จำนวน
- วัตถุ
- วัตถุ
- of
- on
- ONE
- เพียง
- การดำเนินงาน
- ดีที่สุด
- เพิ่มประสิทธิภาพ
- ตัวเลือกเสริม (Option)
- Options
- or
- อื่นๆ
- ของเรา
- ออก
- เอาท์พุต
- ด้านนอก
- ของตนเอง
- พารามิเตอร์
- พารามิเตอร์
- ผ่าน
- เส้นทาง
- ต่อ
- ดำเนินการ
- เลือก
- ท่อ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- บวก
- จุด
- จุด
- โพสต์
- ที่มีศักยภาพ
- อำนาจ
- คาดการณ์
- ที่คาดการณ์
- การจัดเตรียม
- เตรียมการ
- เตรียม
- สวย
- ก่อนหน้านี้
- หลัก
- กระบวนการ
- แปรรูปแล้ว
- การประมวลผล
- ผลิตภัณฑ์
- รีวิวสินค้า
- การผลิต
- การเขียนโปรแกรม
- การเขียนโปรแกรม
- การเขียนโปรแกรมภาษา
- โครงการ
- ให้
- การให้
- หลาม
- การอ่าน
- เรียลไทม์
- รับ
- แนะนำ
- ลด
- ลด
- ปล่อย
- ตรงประเด็น
- เอาออก
- แสดง
- เป็นตัวแทนของ
- ขอ
- ต้องการ
- ทรัพยากร
- ส่งผลให้
- ผลสอบ
- ทบทวน
- รีวิว
- ขวา
- บทบาท
- ทำงาน
- s
- sagemaker
- การอนุมาน SageMaker
- ท่อส่ง SageMaker
- เดียวกัน
- เห็น
- ที่ปรับขนาดได้
- ไร้รอยต่อ
- ได้อย่างลงตัว
- Section
- เห็น
- การเลือก
- การเลือก
- บริการ
- การให้บริการ
- เซสชั่น
- ชุด
- การตั้งค่า
- หลาย
- น่า
- โชว์
- ปิดตัวลง
- ลงชื่อ
- ง่าย
- ที่เรียบง่าย
- ลดความซับซ้อน
- ลดความซับซ้อน
- เดียว
- ขนาด
- เล็ก
- มีขนาดเล็กกว่า
- So
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- ทางออก
- โซลูชัน
- เฉพาะ
- แยก
- เริ่มต้น
- ข้อความที่เริ่ม
- ขั้นตอน
- ขั้นตอน
- การเก็บรักษา
- เก็บไว้
- เพรียวลม
- การทำให้เพรียวลม
- แข็งแรง
- โครงสร้าง
- ส่ง
- ส่ง
- อย่างเช่น
- สนับสนุน
- รองรับ
- แน่ใจ
- ระบบ
- เอา
- ใช้เวลา
- เป้า
- ที่
- พื้นที่
- ข้อมูล
- ของพวกเขา
- แล้วก็
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- เหล่านั้น
- ตลอด
- เวลา
- หัวข้อ
- ไปยัง
- ในวันนี้
- เกินไป
- เครื่องมือ
- เครื่องมือ
- รวม
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- แปลง
- การแปลง
- การแปลง
- เปลี่ยน
- การแปลง
- สองครั้ง
- ui
- ภายใต้
- ปลดล็อก
- อัปโหลด
- ใช้
- ใช้กรณี
- มือสอง
- การใช้
- มีคุณค่า
- ความคุ้มค่า
- ความคุ้มค่า
- มาก
- ผ่านทาง
- รายละเอียด
- การสร้างภาพ
- ต้องการ
- อยาก
- we
- เว็บ
- บริการเว็บ
- เว็บไซต์
- สัปดาห์ที่ผ่านมา
- ดี
- เมื่อ
- ที่
- อย่างกว้างขวาง
- จะ
- กับ
- งาน
- เวิร์กโฟลว์
- ขั้นตอนการทำงาน
- การทำงาน
- คุณ
- ของคุณ
- ลมทะเล