ระบบนำร่องอัตโนมัติของ Amazon SageMaker สร้าง ฝึกฝน และปรับแต่งโมเดลแมชชีนเลิร์นนิง (ML) ที่ดีที่สุดโดยอัตโนมัติโดยอิงตามข้อมูลของคุณ ในขณะเดียวกันก็ช่วยให้คุณรักษาการควบคุมและการมองเห็นได้อย่างเต็มที่ เราเพิ่งประกาศ รองรับข้อมูลอนุกรมเวลาใน Autopilot. คุณสามารถใช้ Autopilot เพื่อจัดการกับงานการถดถอยและการจัดประเภทในข้อมูลอนุกรมเวลา หรือลำดับข้อมูลโดยทั่วไป ข้อมูลอนุกรมเวลาเป็นข้อมูลลำดับประเภทพิเศษที่จุดข้อมูลจะถูกรวบรวมในช่วงเวลาที่เท่ากัน
การเตรียมข้อมูลด้วยตนเอง การเลือกแบบจำลอง ML ที่เหมาะสม และการปรับพารามิเตอร์ให้เหมาะสมนั้นเป็นงานที่ซับซ้อน แม้แต่ผู้ปฏิบัติงานที่เชี่ยวชาญ แม้ว่าจะมีวิธีการอัตโนมัติที่สามารถค้นหาแบบจำลองที่ดีที่สุดและพารามิเตอร์ได้ แต่โดยทั่วไปแล้วสิ่งเหล่านี้ไม่สามารถจัดการข้อมูลที่มาเป็นลำดับได้ เช่น ปริมาณการใช้เครือข่าย ปริมาณการใช้ไฟฟ้า หรือค่าใช้จ่ายในครัวเรือนที่บันทึกไว้เมื่อเวลาผ่านไป เนื่องจากข้อมูลนี้อยู่ในรูปแบบการสังเกตที่ได้รับในช่วงเวลาต่างๆ กัน การสังเกตที่ต่อเนื่องกันจึงไม่ถือว่าเป็นอิสระจากกัน และจำเป็นต้องได้รับการประมวลผลโดยรวม คุณสามารถใช้ Autopilot สำหรับปัญหาต่างๆ ที่เกี่ยวข้องกับข้อมูลตามลำดับ ตัวอย่างเช่น คุณสามารถจำแนกทราฟฟิกเครือข่ายที่บันทึกไว้ในช่วงเวลาหนึ่งเพื่อระบุกิจกรรมที่เป็นอันตราย หรือพิจารณาว่าบุคคลมีคุณสมบัติสำหรับการจำนองตามประวัติเครดิตของพวกเขาหรือไม่ คุณจัดเตรียมชุดข้อมูลที่มีข้อมูลอนุกรมเวลา และ Autopilot จะจัดการส่วนที่เหลือ ประมวลผลข้อมูลตามลำดับผ่านการแปลงคุณลักษณะเฉพาะและค้นหาแบบจำลองที่ดีที่สุดในนามของคุณ
Autopilot ขจัดการยกของหนักของโมเดล ML ของอาคาร และช่วยให้คุณสร้าง ฝึกฝน และปรับแต่งโมเดล ML ที่ดีที่สุดโดยอัตโนมัติตามข้อมูลของคุณ Autopilot รันหลายอัลกอริธึมกับข้อมูลของคุณ และปรับแต่งไฮเปอร์พารามิเตอร์บนโครงสร้างพื้นฐานการประมวลผลที่มีการจัดการเต็มรูปแบบ ในโพสต์นี้ เราจะสาธิตวิธีการใช้งานของคุณ หม้อแปลงไฟฟ้า เพื่อแก้ปัญหาการจำแนกและการถดถอยของข้อมูลอนุกรมเวลา สำหรับคำแนะนำในการสร้างและฝึกโมเดล Autopilot โปรดดูที่ การคาดคะเนลูกค้าด้วย Amazon SageMaker Autopilot.
การจัดประเภทข้อมูลอนุกรมเวลาโดยใช้ Autopilot
เป็นตัวอย่างการทำงาน เราพิจารณาปัญหาหลายคลาสในอนุกรมเวลา ชุด UWaveGestureLibraryXซึ่งประกอบด้วยการอ่านค่าเซ็นเซอร์ความเร่งที่เท่ากันในขณะที่ใช้ท่าทางมือที่กำหนดไว้ล่วงหน้าอย่างใดอย่างหนึ่งจากทั้งหมดแปดแบบ เพื่อความง่าย เราพิจารณาเฉพาะขนาด X ของมาตรความเร่ง ภารกิจคือการสร้างแบบจำลองการจัดหมวดหมู่เพื่อแมปข้อมูลอนุกรมเวลาจากการอ่านเซ็นเซอร์กับท่าทางที่กำหนดไว้ล่วงหน้า รูปต่อไปนี้แสดงแถวแรกของชุดข้อมูลในรูปแบบ CSV ตารางทั้งหมดประกอบด้วย 896 แถวและสองคอลัมน์: คอลัมน์แรกเป็นป้ายกำกับท่าทางสัมผัส และคอลัมน์ที่สองคือชุดเวลาของการอ่านเซ็นเซอร์
แปลงข้อมูลให้อยู่ในรูปแบบที่ถูกต้องด้วย Amazon SageMaker Data Wrangler
นอกจากจะยอมรับคอลัมน์ข้อความที่เป็นตัวเลข หมวดหมู่ และข้อความมาตรฐานแล้ว Autopilot ยังยอมรับคอลัมน์อินพุตตามลำดับอีกด้วย หากข้อมูลอนุกรมเวลาของคุณไม่เป็นไปตามรูปแบบนี้ คุณสามารถแปลงผ่าน Amazon SageMaker ข้อมูล Wrangler. Data Wrangler ช่วยลดเวลาในการรวบรวมและเตรียมข้อมูลสำหรับ ML จากสัปดาห์เหลือเป็นนาที ด้วย Data Wrangler คุณสามารถลดความซับซ้อนของกระบวนการเตรียมข้อมูลและวิศวกรรมคุณลักษณะ และดำเนินการแต่ละขั้นตอนของเวิร์กโฟลว์การเตรียมข้อมูล ซึ่งรวมถึงการเลือกข้อมูล การล้าง การสำรวจ และการแสดงภาพด้วยอินเทอร์เฟซภาพเดียว ตัวอย่างเช่น พิจารณาชุดข้อมูลเดียวกันแต่อยู่ในรูปแบบอินพุตที่ต่างกัน: แต่ละท่าทาง (ระบุโดย ID) เป็นลำดับของการวัดระยะเท่ากันของมาตรความเร่ง เมื่อจัดเก็บในแนวตั้ง แต่ละแถวจะมีการประทับเวลาและค่าหนึ่งค่า รูปภาพต่อไปนี้เปรียบเทียบข้อมูลนี้ในรูปแบบดั้งเดิมและรูปแบบลำดับ
ในการแปลงชุดข้อมูลนี้เป็นรูปแบบที่อธิบายไว้ก่อนหน้านี้โดยใช้ Data Wrangler ให้โหลดชุดข้อมูลจาก บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน เอส3). จากนั้นใช้ อนุกรมเวลา จัดกลุ่มตามการแปลงดังที่แสดงในภาพหน้าจอต่อไปนี้ และส่งออกข้อมูลกลับไปยัง Amazon S3 ในรูปแบบ CSV
เมื่อชุดข้อมูลอยู่ในรูปแบบที่กำหนด คุณสามารถดำเนินการกับ Autopilot ได้ ตรวจสอบหม้อแปลงอนุกรมเวลาอื่น ๆ ของ Data Wrangler อ้างถึง เตรียมข้อมูลอนุกรมเวลาด้วย Amazon SageMaker Data Wrangler.
เปิดงาน AutoML
เช่นเดียวกับอินพุตประเภทอื่นๆ ที่รองรับโดย Autopilot แต่ละแถวของชุดข้อมูลเป็นการสังเกตที่แตกต่างกัน และแต่ละคอลัมน์เป็นคุณลักษณะ ในตัวอย่างนี้ เรามีคอลัมน์เดียวที่มีข้อมูลอนุกรมเวลา แต่คุณสามารถมีคอลัมน์อนุกรมเวลาได้หลายคอลัมน์ คุณยังสามารถมีหลายคอลัมน์ที่มีประเภทการป้อนข้อมูลต่างกันได้ เช่น อนุกรมเวลา ข้อความ และตัวเลข
ไปยัง สร้างการทดลองออโตไพลอตวางชุดข้อมูลในบัคเก็ต S3 และสร้างการทดสอบใหม่ภายใน สตูดิโอ Amazon SageMaker. ตามที่แสดงในภาพหน้าจอต่อไปนี้ คุณต้องระบุชื่อของการทดสอบ ตำแหน่ง S3 ของชุดข้อมูล ตำแหน่ง S3 สำหรับสิ่งประดิษฐ์เอาต์พุต และชื่อคอลัมน์ที่จะคาดการณ์
Autopilot วิเคราะห์ข้อมูล สร้างไพพ์ไลน์ ML และรันค่าดีฟอลต์ 250 ซ้ำของการปรับให้เหมาะสมไฮเปอร์พารามิเตอร์ในงานการจัดหมวดหมู่นี้ ตามที่แสดงในลีดเดอร์บอร์ดของรุ่นต่อไปนี้ Autopilot มีความแม่นยำถึง 0.821 และคุณสามารถปรับใช้โมเดลที่ดีที่สุดได้ในคลิกเดียว
นอกจากนี้ Autopilot ยังสร้าง a รายงานการสำรวจข้อมูลที่ซึ่งคุณสามารถแสดงภาพและสำรวจข้อมูลของคุณได้
ความโปร่งใสเป็นพื้นฐานสำหรับออโตไพลอต คุณสามารถตรวจสอบและแก้ไขไปป์ไลน์ ML ที่สร้างขึ้นภายในสมุดบันทึกข้อกำหนดของผู้สมัคร ภาพหน้าจอต่อไปนี้แสดงให้เห็นว่า Autopilot แนะนำช่วงของไปป์ไลน์อย่างไร ที่รวมหม้อแปลงอนุกรมเวลาเข้าด้วยกัน TSFeatureExtractor
ด้วยอัลกอริธึม ML ที่แตกต่างกัน เช่น ต้นไม้การตัดสินใจที่เพิ่มการไล่ระดับสีและโมเดลเชิงเส้น ดิ TSFeatureExtractor
แยกคุณลักษณะอนุกรมเวลาหลายร้อยรายการให้คุณ จากนั้นจะป้อนไปยังอัลกอริทึมดาวน์สตรีมเพื่อทำการคาดการณ์ สำหรับรายการคุณสมบัติอนุกรมเวลาทั้งหมด โปรดดูที่ ภาพรวมเกี่ยวกับคุณสมบัติที่แยกออกมา.
สรุป
ในโพสต์นี้ เราสาธิตวิธีใช้ SageMaker Autopilot เพื่อแก้ปัญหาการจำแนกอนุกรมเวลาและปัญหาการถดถอยด้วยการคลิกเพียงไม่กี่ครั้ง
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับออโตไพลอต โปรดดูที่ ระบบนำร่องอัตโนมัติของ Amazon SageMaker. หากต้องการสำรวจคุณสมบัติที่เกี่ยวข้องของ SageMaker โปรดดูที่ Amazon SageMaker ข้อมูล Wrangler.
เกี่ยวกับผู้เขียน
นิกิต้า อิฟคิน เป็นนักวิทยาศาสตร์ประยุกต์ Amazon SageMaker Data Wrangler
แอน มิลเบิร์ต เป็นวิศวกรพัฒนาซอฟต์แวร์ที่ทำงานเกี่ยวกับ Amazon SageMaker Automatic Model Tuning
วาเลริโอ เปโรเน เป็น Applied Science Manager ที่ทำงานเกี่ยวกับ Amazon SageMaker Automatic Model Tuning และ Autopilot
เมกานา สาทิส เป็นวิศวกรพัฒนาซอฟต์แวร์ที่ทำงานเกี่ยวกับ Amazon SageMaker Automatic Model Tuning
อาลี ตักบีรี เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญ AI/ML และช่วยเหลือลูกค้าโดยใช้การเรียนรู้ของเครื่องเพื่อแก้ปัญหาความท้าทายทางธุรกิจบน AWS Cloud
- "
- 100
- เกี่ยวกับเรา
- ที่ได้มา
- กิจกรรม
- อัลกอริทึม
- การอนุญาต
- แม้ว่า
- อเมซอน
- ประกาศ
- อัตโนมัติ
- AWS
- ที่ดีที่สุด
- เพิ่มขึ้น
- สร้าง
- การก่อสร้าง
- สร้าง
- ธุรกิจ
- ความท้าทาย
- การจัดหมวดหมู่
- เมฆ
- คอลัมน์
- ซับซ้อน
- คำนวณ
- ติดต่อกัน
- การบริโภค
- มี
- ควบคุม
- การสร้าง
- เครดิต
- ลูกค้า
- ข้อมูล
- การซื้อขาย
- ปรับใช้
- พัฒนาการ
- ต่าง
- Dimension
- ไม่
- อย่างง่ายดาย
- กระแสไฟฟ้า
- วิศวกร
- ชั้นเยี่ยม
- ตัวอย่าง
- รายจ่าย
- การทดลอง
- การสำรวจ
- สารสกัดจาก
- ลักษณะ
- คุณสมบัติ
- เฟด
- รูป
- ชื่อจริง
- ปฏิบัติตาม
- ดังต่อไปนี้
- ฟอร์ม
- รูป
- เต็ม
- General
- บัญชีกลุ่ม
- จะช่วยให้
- ประวัติ
- ครัวเรือน
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ร้อย
- แยกแยะ
- รวมทั้ง
- ข้อมูล
- โครงสร้างพื้นฐาน
- อินเตอร์เฟซ
- IT
- การเรียนรู้
- รายการ
- โหลด
- ที่ตั้ง
- เครื่อง
- เรียนรู้เครื่อง
- ผู้จัดการ
- แผนที่
- ML
- แบบ
- โมเดล
- เครือข่าย
- การรับส่งข้อมูลเครือข่าย
- สมุดบันทึก
- การเพิ่มประสิทธิภาพ
- อื่นๆ
- คำทำนาย
- การคาดการณ์
- ปัญหา
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- ให้
- พิสัย
- แนะนำ
- REST
- วิ่ง
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ชุด
- ง่าย
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- โซลูชัน
- แก้
- เฉพาะ
- การเก็บรักษา
- ที่สนับสนุน
- รองรับ
- งาน
- ตลอด
- เวลา
- ด้านบน
- การจราจร
- การฝึกอบรม
- รถไฟ
- ใช้
- ความคุ้มค่า
- ความชัดเจน
- การสร้างภาพ
- ภายใน
- การทำงาน
- X