ไม่ว่าคุณจะจัดสรรทรัพยากรอย่างมีประสิทธิภาพมากขึ้นสำหรับการเข้าชมเว็บ การคาดการณ์ความต้องการของผู้ป่วยสำหรับความต้องการพนักงาน หรือคาดการณ์การขายผลิตภัณฑ์ของบริษัท การคาดการณ์เป็นเครื่องมือสำคัญในธุรกิจจำนวนมาก กรณีการใช้งานหนึ่งๆ เรียกว่า พยากรณ์การเริ่มต้นเย็นสร้างการคาดการณ์สำหรับอนุกรมเวลาที่มีข้อมูลในอดีตเพียงเล็กน้อยหรือไม่มีเลย เช่น ผลิตภัณฑ์ใหม่ที่เพิ่งเข้าสู่ตลาดในอุตสาหกรรมค้าปลีก วิธีการพยากรณ์อนุกรมเวลาแบบดั้งเดิม เช่น ค่าเฉลี่ยเคลื่อนที่แบบถดถอยอัตโนมัติ (ARIMA) หรือการปรับให้เรียบแบบเอ็กซ์โพเนนเชียล (ES) อาศัยอนุกรมเวลาในอดีตของแต่ละผลิตภัณฑ์เป็นอย่างมาก ดังนั้นจึงไม่มีประสิทธิภาพสำหรับการคาดการณ์การเริ่มเย็น
ในโพสต์นี้ เราสาธิตวิธีสร้างเครื่องมือพยากรณ์การสตาร์ทขณะเย็นโดยใช้ AutoGluon AutoML สำหรับการคาดการณ์อนุกรมเวลา, แพ็คเกจ Python แบบโอเพ่นซอร์สเพื่อทำให้แมชชีนเลิร์นนิง (ML) ทำงานอัตโนมัติในข้อมูลรูปภาพ ข้อความ ตาราง และอนุกรมเวลา AutoGluon นำเสนอไปป์ไลน์การเรียนรู้ของเครื่องอัตโนมัติ (AutoML) แบบ end-to-end สำหรับผู้เริ่มต้นจนถึงนักพัฒนา ML ที่มีประสบการณ์ ทำให้เป็นโซลูชันอัตโนมัติเต็มรูปแบบที่แม่นยำและใช้งานง่ายที่สุด เราใช้ฟรี ห้องปฏิบัติการ Amazon SageMaker Studio บริการสำหรับการสาธิตนี้
ข้อมูลเบื้องต้นเกี่ยวกับอนุกรมเวลาของ AutoGluon
ออโต้กลูออน เป็นไลบรารีโอเพนซอร์สชั้นนำสำหรับ AutoML สำหรับข้อความ รูปภาพ และข้อมูลแบบตาราง ช่วยให้คุณสร้างแบบจำลองที่มีความแม่นยำสูงจากข้อมูลดิบด้วยโค้ดเพียงบรรทัดเดียว เมื่อเร็ว ๆ นี้ ทีมงานได้ทำงานเพื่อขยายความสามารถเหล่านี้ไปยังข้อมูลอนุกรมเวลา และได้พัฒนาโมดูลการคาดการณ์อัตโนมัติที่เผยแพร่ต่อสาธารณะบน GitHub. autogluon.forecasting
โมดูลจะประมวลผลข้อมูลอนุกรมเวลาดิบโดยอัตโนมัติในรูปแบบที่เหมาะสม จากนั้นจึงฝึกและปรับแต่งโมเดลการเรียนรู้เชิงลึกที่ล้ำสมัยต่างๆ เพื่อสร้างการคาดการณ์ที่แม่นยำ ในโพสต์นี้เราจะสาธิตวิธีการใช้งาน autogluon.forecasting
และนำไปใช้กับงานพยากรณ์การเริ่มต้นเย็น
ภาพรวมโซลูชัน
เนื่องจาก AutoGluon เป็นแพ็คเกจ Python แบบโอเพ่นซอร์ส คุณจึงสามารถใช้โซลูชันนี้ได้ ในท้องถิ่น บนแล็ปท็อปของคุณหรือบน Amazon SageMaker Studio Lab เราทำตามขั้นตอนต่อไปนี้:
- ตั้งค่า AutoGluon สำหรับ Amazon SageMaker Studio Lab
- เตรียมชุดข้อมูล
- กำหนดพารามิเตอร์การฝึกอบรมโดยใช้ AutoGluon
- ฝึกเครื่องมือพยากรณ์การสตาร์ทเย็นสำหรับการพยากรณ์อนุกรมเวลา
- เห็นภาพการคาดคะเนการเริ่มเย็น
สมมติฐานหลักของการพยากรณ์การเริ่มต้นช่วงเย็นคือรายการที่มีลักษณะคล้ายกันควรมีเส้นทางอนุกรมเวลาที่คล้ายคลึงกัน ซึ่งช่วยให้การคาดการณ์การสตาร์ทขณะเย็นสามารถคาดการณ์รายการที่ไม่มีข้อมูลในอดีตได้ ดังที่แสดงในรูปต่อไปนี้
ในคำแนะนำของเรา เราใช้ชุดข้อมูลสังเคราะห์ตามปริมาณการใช้ไฟฟ้า ซึ่งประกอบด้วยอนุกรมเวลารายชั่วโมงสำหรับ 370 รายการ โดยแต่ละรายการมี item_id
ตั้งแต่ 0–369 ภายในชุดข้อมูลสังเคราะห์นี้ แต่ละ item_id
ยังเชื่อมโยงกับคุณลักษณะคงที่ (คุณลักษณะที่ไม่เปลี่ยนแปลงเมื่อเวลาผ่านไป) เราฝึก ดีเออาร์ จำลองโดยใช้ AutoGluon เพื่อเรียนรู้พฤติกรรมทั่วไปของรายการที่คล้ายกัน และโอนพฤติกรรมดังกล่าวเพื่อคาดการณ์รายการใหม่ (item_id
370–373) ที่ไม่มีข้อมูลอนุกรมเวลาในอดีต แม้ว่าเราจะสาธิตวิธีการพยากรณ์การเริ่มเย็นโดยใช้คุณลักษณะคงที่เพียงคุณลักษณะเดียว แต่ในทางปฏิบัติ การมีคุณลักษณะคงที่ที่ให้ข้อมูลและมีคุณภาพสูงเป็นกุญแจสำคัญในการพยากรณ์การเริ่มต้นช่วงเย็นที่ดี
ไดอะแกรมต่อไปนี้แสดงภาพรวมระดับสูงของโซลูชันของเรา รหัสโอเพนซอร์ซมีอยู่ใน repo GitHub.
เบื้องต้น
สำหรับคำแนะนำนี้ คุณควรมีข้อกำหนดเบื้องต้นต่อไปนี้:
- An บัญชี Amazon SageMaker Studio Lab
- GitHub การเข้าถึงบัญชี
เข้าสู่ระบบบัญชี Amazon SageMaker Studio Lab ของคุณและตั้งค่าสภาพแวดล้อมโดยใช้เทอร์มินัล:
คำแนะนำเหล่านี้ควรใช้งานได้จากแล็ปท็อปของคุณ หากคุณไม่มีสิทธิ์เข้าถึง Amazon SageMaker Studio Lab (เราแนะนำให้ติดตั้ง Anaconda บนแล็ปท็อปของคุณก่อน)
เมื่อคุณตั้งค่าสภาพแวดล้อมเสมือนอย่างสมบูรณ์แล้ว ให้เปิดโน้ตบุ๊ก AutoGluon-cold-start-demo.ipynb
และเลือกสภาพแวดล้อมที่กำหนดเอง .conda-autogluon:Python
เมล็ด
เตรียมอนุกรมเวลาเป้าหมายและชุดข้อมูลเมตาของรายการ
ดาวน์โหลดชุดข้อมูลต่อไปนี้ไปยังอินสแตนซ์โน้ตบุ๊กของคุณหากไม่ได้รวมไว้ และบันทึกไว้ในไดเร็กทอรี data/
. คุณสามารถค้นหาชุดข้อมูลเหล่านี้ได้ใน repo GitHub:
- Test.csv.gz
- coldStartTargetData.csv
- รายการMetaData.csv
เรียกใช้ข้อมูลโค้ดต่อไปนี้เพื่อโหลดชุดข้อมูลอนุกรมเวลาเป้าหมายลงในเคอร์เนล:
อนุกรมเวลาของ AutoGluon ต้องใช้คุณสมบัติคงที่เพื่อแสดงในรูปแบบตัวเลข สามารถทำได้โดยการสมัคร LabelEncoder()
บนคุณสมบัติคงที่ของเรา type
ที่เราเข้ารหัส A=0, B=1, C=2, D=3 (ดูรหัสต่อไปนี้) โดยค่าเริ่มต้น AutoGluon จะอนุมานคุณลักษณะสแตติกเป็นลำดับหรือตามหมวดหมู่ คุณยังสามารถเขียนทับสิ่งนี้ได้ด้วยการแปลงคอลัมน์คุณสมบัติสแตติกให้เป็นชนิดข้อมูลอ็อบเจ็กต์/สตริงสำหรับคุณสมบัติตามหมวดหมู่ หรือประเภทข้อมูลจำนวนเต็ม/โฟลตสำหรับฟีเจอร์ลำดับ
ตั้งค่าและเริ่มการฝึกโมเดล AutoGluon
เราต้องระบุ save_path = ‘autogluon-coldstart-demo’
เป็นชื่อโฟลเดอร์สิ่งประดิษฐ์รุ่น (ดูรหัสต่อไปนี้) นอกจากนี้เรายังตั้งค่าของเรา eval_metric
as หมายถึงข้อผิดพลาดร้อยละแน่นอน,หรือ ‘MAPE’
สั้น ๆ ที่เรากำหนด prediction_length
เป็น 24 ชม. หากไม่ระบุไว้ AutoGluon จะสร้างการคาดการณ์ความน่าจะเป็นและให้คะแนนผ่าน การสูญเสียน้ำหนักเชิงปริมาณ. เรามองแต่ที่ รุ่น DeepAR ในการสาธิตของเรา เนื่องจากเราทราบดีว่าอัลกอริทึม DeepAR ช่วยให้สามารถคาดการณ์การเริ่มต้นแบบเย็นได้ด้วยการออกแบบ เราตั้งค่าไฮเปอร์พารามิเตอร์ DeepAR ตัวใดตัวหนึ่งโดยพลการ และส่งไฮเปอร์พารามิเตอร์นั้นไปที่ ForecastingPredictor().fit()
เรียก. ซึ่งช่วยให้ AutoGluon ดูเฉพาะในรุ่นที่ระบุเท่านั้น สำหรับรายการทั้งหมดของไฮเปอร์พารามิเตอร์ที่ปรับได้ โปรดดูที่ แพ็คเกจ gluonts.model.depar.
การฝึกอบรมใช้เวลา 30–45 นาที คุณสามารถรับข้อมูลสรุปแบบจำลองได้โดยการเรียกใช้ฟังก์ชันต่อไปนี้:
พยากรณ์รายการเริ่มเย็น
ตอนนี้เราพร้อมที่จะสร้างการคาดการณ์สำหรับรายการ Cold Start แล้ว เราขอแนะนำให้มีอย่างน้อยห้าแถวสำหรับแต่ละแถว item_id
. ดังนั้น สำหรับ item_id
ที่มีการสังเกตน้อยกว่า XNUMX ครั้ง เราเติม NaNs ในการสาธิตของเราทั้ง item_id
370 และ 372 ไม่มีการสังเกต เป็นปัญหาการสตาร์ทเย็นอย่างแท้จริง ในขณะที่อีก XNUMX รายการมีค่าเป้าหมายห้าค่า
โหลดชุดข้อมูลอนุกรมเวลาเป้าหมายเริ่มเย็นด้วยรหัสต่อไปนี้:
เราป้อนอนุกรมเวลาเป้าหมายการเริ่มเย็นลงในแบบจำลอง AutoGluon ของเรา พร้อมกับชุดข้อมูลเมตาของรายการสำหรับการเริ่มเย็น item_id
:
เห็นภาพคำทำนาย
เราสามารถสร้างฟังก์ชันการพล็อตเพื่อสร้างภาพข้อมูลในการพยากรณ์การเริ่มต้นช่วงเย็นได้ ดังแสดงในกราฟต่อไปนี้
ทำความสะอาด
ในการเพิ่มประสิทธิภาพการใช้ทรัพยากร ให้ลองหยุดรันไทม์บน Amazon SageMaker Studio Lab หลังจากที่คุณได้สำรวจโน้ตบุ๊กอย่างครบถ้วนแล้ว
สรุป
ในโพสต์นี้ เราแสดงวิธีสร้างเครื่องมือคาดการณ์การสตาร์ทขณะเย็นโดยใช้ AutoGluon AutoML สำหรับข้อมูลอนุกรมเวลาบน Amazon SageMaker Studio Lab สำหรับคนที่สงสัยความแตกต่างระหว่าง พยากรณ์อเมซอน และ AutoGluon (อนุกรมเวลา) Amazon Forecast เป็นบริการที่ได้รับการจัดการและสนับสนุนอย่างเต็มรูปแบบซึ่งใช้การเรียนรู้ของเครื่อง (ML) เพื่อสร้างการคาดการณ์ที่แม่นยำสูงโดยไม่ต้องมีประสบการณ์ ML มาก่อน ในขณะที่ AutoGluon เป็นโครงการโอเพ่นซอร์สที่ได้รับการสนับสนุนจากชุมชนด้วยผลงานวิจัยล่าสุด เราได้ดำเนินการตัวอย่างแบบ end-to-end เพื่อแสดงให้เห็นว่า AutoGluon สำหรับอนุกรมเวลาสามารถทำอะไรได้บ้าง และจัดเตรียมชุดข้อมูลและกรณีการใช้งาน
AutoGluon สำหรับข้อมูลอนุกรมเวลาเป็นแพ็คเกจ Python แบบโอเพ่นซอร์ส และเราหวังว่าโพสต์นี้ พร้อมด้วยตัวอย่างโค้ดของเรา จะช่วยให้คุณมีวิธีแก้ปัญหาที่ตรงไปตรงมาเพื่อจัดการกับปัญหาการพยากรณ์การเริ่มต้นเย็นที่ท้าทาย คุณสามารถเข้าถึงตัวอย่างทั้งหมดได้ที่ .ของเรา repo GitHub. ลองใช้งานและแจ้งให้เราทราบว่าคุณคิดอย่างไร!
เกี่ยวกับผู้เขียน
อีวาน ชุย เป็นนักวิทยาศาสตร์ข้อมูลด้วย AWS Professional Services ซึ่งเขาช่วยลูกค้าสร้างและปรับใช้โซลูชันโดยใช้การเรียนรู้ของเครื่องบน AWS เขาได้ทำงานร่วมกับลูกค้าในอุตสาหกรรมที่หลากหลาย รวมทั้งซอฟต์แวร์ การเงิน เภสัชกรรม และการดูแลสุขภาพ ในเวลาว่าง เขาชอบอ่านหนังสือ ใช้เวลาอยู่กับครอบครัว และเพิ่มพอร์ตหุ้น
โจนัส มูลเลอร์ เป็นนักวิทยาศาสตร์ประยุกต์อาวุโสในกลุ่มการวิจัยและการศึกษา AI ที่ AWS ซึ่งเขาพัฒนาอัลกอริทึมใหม่เพื่อปรับปรุงการเรียนรู้เชิงลึกและพัฒนาแมชชีนเลิร์นนิงอัตโนมัติ ก่อนร่วมงานกับ AWS เพื่อทำให้ ML เป็นประชาธิปไตย เขาสำเร็จการศึกษาระดับปริญญาเอกที่ MIT Computer Science and Artificial Intelligence Lab ในเวลาว่าง เขาชอบสำรวจภูเขาและกิจกรรมกลางแจ้ง
เวินหมิงเย่ เป็นผู้จัดการผลิตภัณฑ์การวิจัยที่ AWS AI เขาหลงใหลในการช่วยเหลือนักวิจัยและลูกค้าองค์กรในการขยายขนาดนวัตกรรมอย่างรวดเร็วผ่านเทคโนโลยีโอเพนซอร์สและเทคโนโลยีแมชชีนเลิร์นนิงที่ล้ำสมัย Wenming มีประสบการณ์ด้านการวิจัยและพัฒนาที่หลากหลายจาก Microsoft Research ทีมวิศวกรรม SQL และการเริ่มต้นที่ประสบความสำเร็จ
- "
- 100
- 9
- เกี่ยวกับเรา
- แน่นอน
- เข้า
- ลงชื่อเข้าใช้
- ถูกต้อง
- ประสบความสำเร็จ
- ข้าม
- AI
- วิจัยไอ
- ขั้นตอนวิธี
- อัลกอริทึม
- การอนุญาต
- แม้ว่า
- อเมซอน
- การประยุกต์ใช้
- เข้าใกล้
- เทียม
- ปัญญาประดิษฐ์
- อัตโนมัติ
- ใช้ได้
- เฉลี่ย
- AWS
- สร้าง
- สร้าง
- ธุรกิจ
- โทรศัพท์
- สามารถรับ
- ความสามารถในการ
- CD
- เปลี่ยนแปลง
- Checkout
- รหัส
- คอลัมน์
- ชุมชน
- บริษัท
- วิทยาการคอมพิวเตอร์
- การบริโภค
- ลูกค้า
- ข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- ความต้องการ
- ปรับใช้
- ออกแบบ
- พัฒนา
- พัฒนา
- นักพัฒนา
- ไม่
- การศึกษา
- มีประสิทธิภาพ
- กระแสไฟฟ้า
- ชั้นเยี่ยม
- เข้า
- Enterprise
- สิ่งแวดล้อม
- จำเป็น
- ตัวอย่าง
- ประสบการณ์
- มีประสบการณ์
- ขยายออก
- ครอบครัว
- ลักษณะ
- คุณสมบัติ
- รูป
- เงินทุน
- ชื่อจริง
- ดังต่อไปนี้
- รูป
- ฟรี
- เต็ม
- ฟังก์ชัน
- อนาคต
- สร้าง
- ไป
- ดี
- บัญชีกลุ่ม
- มี
- การดูแลสุขภาพ
- จะช่วยให้
- อย่างสูง
- ทางประวัติศาสตร์
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ภาพ
- การดำเนินการ
- ปรับปรุง
- รวม
- รวมทั้ง
- เป็นรายบุคคล
- อุตสาหกรรม
- อุตสาหกรรม
- แบบบูรณาการ
- Intelligence
- IT
- คีย์
- ที่รู้จักกัน
- แล็ปท็อป
- ล่าสุด
- เปิดตัว
- ชั้นนำ
- เรียนรู้
- การเรียนรู้
- ห้องสมุด
- Line
- รายการ
- น้อย
- โหลด
- เครื่อง
- เรียนรู้เครื่อง
- การทำ
- ผู้จัดการ
- ตลาด
- Meta
- ไมโครซอฟท์
- เอ็มไอที
- ML
- แบบ
- โมเดล
- มากที่สุด
- การย้าย
- ผลิตภัณฑ์ใหม่
- สมุดบันทึก
- รหัสโอเพนซอร์ซ
- อื่นๆ
- กลางแจ้ง
- เปอร์เซ็นต์
- เภสัชกรรม
- ผลงาน
- การคาดการณ์
- ปัญหา
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- ก่อ
- ผลิตภัณฑ์
- ผลิตภัณฑ์
- มืออาชีพ
- โครงการ
- ให้
- วิจัยและพัฒนา
- ดิบ
- การอ่าน
- แนะนำ
- การวิจัย
- ทรัพยากร
- แหล่งข้อมูล
- ค้าปลีก
- ขาย
- ขนาด
- ปรับ
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ชุด
- บริการ
- บริการ
- ชุด
- สั้น
- คล้ายคลึงกัน
- ซอฟต์แวร์
- โซลูชัน
- การใช้จ่าย
- เริ่มต้น
- startups
- สต็อก
- สตูดิโอ
- ที่ประสบความสำเร็จ
- ที่สนับสนุน
- เป้า
- งาน
- ทีม
- เทคโนโลยี
- สถานีปลายทาง
- ตลอด
- เวลา
- ร่วมกัน
- แบบดั้งเดิม
- การจราจร
- การฝึกอบรม
- รถไฟ
- us
- ใช้
- เสมือน
- การสร้างภาพ
- เว็บ
- อะไร
- WHO
- ภายใน
- ไม่มี
- งาน
- ทำงาน
- การทำงาน
- เป็นศูนย์