Amazon SageMaker ฟีเจอร์สโตร์ เป็นบริการที่สร้างขึ้นตามวัตถุประสงค์เพื่อจัดเก็บและดึงข้อมูลฟีเจอร์เพื่อใช้โดยโมเดลการเรียนรู้ของเครื่อง (ML) Feature Store มอบร้านค้าออนไลน์ที่มีความหน่วงต่ำ การอ่านและเขียนความเร็วสูง และร้านค้าออฟไลน์ที่ให้การเข้าถึงข้อมูลบันทึกประวัติทั้งหมดจำนวนมาก Feature Store จัดการการซิงโครไนซ์ข้อมูลระหว่างร้านค้าออนไลน์และออฟไลน์
เนื่องจากการพัฒนาโมเดลเป็นกระบวนการที่ต้องทำซ้ำๆ ลูกค้ามักจะสืบค้นร้านค้าออฟไลน์และสร้างชุดข้อมูลต่างๆ สำหรับการฝึกโมเดล ปัจจุบันมีหลายวิธีในการเข้าถึงคุณสมบัติในร้านค้าออฟไลน์ รวมถึงการเรียกใช้คำสั่ง SQL ด้วย อเมซอน อาเธน่า หรือใช้ Spark SQL ใน Apache Spark อย่างไรก็ตาม รูปแบบเหล่านี้จำเป็นต้องเขียนคำสั่ง SQL เฉพาะกิจ (และบางครั้งก็ซับซ้อน) ซึ่งไม่เหมาะกับบุคลิกของนักวิทยาศาสตร์ข้อมูลเสมอไป
ฟีเจอร์สโตร์ ขยายเมื่อเร็ว ๆ นี้ SageMaker Python SDK เพื่อให้สร้างชุดข้อมูลจากร้านค้าออฟไลน์ได้ง่ายขึ้น ในรุ่นนี้ คุณสามารถใช้ชุดวิธีการใหม่ใน SDK เพื่อสร้างชุดข้อมูลโดยไม่ต้องเขียนคำสั่ง SQL วิธีการใหม่เหล่านี้สนับสนุนการดำเนินงานทั่วไป เช่น การเดินทางข้ามเวลา การกรองบันทึกที่ซ้ำกัน และการเข้าร่วมกลุ่มคุณสมบัติหลายกลุ่ม ในขณะเดียวกันก็รับประกันความถูกต้อง ณ เวลาหนึ่งๆ
ในโพสต์นี้ เราจะสาธิตวิธีใช้ SageMaker Python SDK เพื่อสร้างชุดข้อมูลที่พร้อมสำหรับ ML โดยไม่ต้องเขียนคำสั่ง SQL ใดๆ
ภาพรวมโซลูชัน
เพื่อสาธิตฟังก์ชันการทำงานใหม่นี้ เราทำงานร่วมกับชุดข้อมูลสองชุด: ตัวชี้วัดลูกค้าเป้าหมายและการตลาดบนเว็บ ชุดข้อมูลเหล่านี้สามารถใช้สร้างแบบจำลองที่คาดการณ์ว่าลูกค้าเป้าหมายจะแปลงเป็นการขายตามกิจกรรมทางการตลาดและตัวชี้วัดที่บันทึกสำหรับลูกค้าเป้าหมายนั้นหรือไม่
ข้อมูลลูกค้าเป้าหมายประกอบด้วยข้อมูลเกี่ยวกับลูกค้าเป้าหมายที่ถูกระบุโดยใช้ Lead_ProspectID
. คุณสมบัติสำหรับลูกค้าเป้าหมาย (เช่น LeadSource
) สามารถอัปเดตได้เมื่อเวลาผ่านไป ซึ่งส่งผลให้เกิดบันทึกใหม่สำหรับลูกค้าเป้าหมายนั้น ที่ Lead_EventTime
แสดงถึงเวลาที่แต่ละเรคคอร์ดถูกสร้างขึ้น ภาพหน้าจอต่อไปนี้แสดงตัวอย่างของข้อมูลนี้
ข้อมูลตัวชี้วัดการตลาดบนเว็บติดตามตัวชี้วัดการมีส่วนร่วมของลูกค้าเป้าหมาย โดยที่ลูกค้าเป้าหมายแต่ละรายจะถูกระบุโดยใช้ Web_ProspectID
. Web_EventTime
แสดงถึงเวลาที่สร้างบันทึก แตกต่างจากกลุ่มคุณลักษณะลูกค้าเป้าหมาย มีเพียงหนึ่งเรกคอร์ดต่อลูกค้าเป้าหมายในกลุ่มคุณลักษณะนี้ ภาพหน้าจอต่อไปนี้แสดงตัวอย่างของข้อมูลนี้
เราเดินผ่านส่วนสำคัญของ sagemaker-feature-store-offline-sdk.ipynb
สมุดบันทึกซึ่งสาธิตขั้นตอนต่อไปนี้:
- สร้างชุดข้อมูลจากกลุ่มคุณลักษณะ
- เข้าร่วมกลุ่มคุณสมบัติหลายกลุ่ม
- สร้างการรวมช่วงเวลาระหว่างกลุ่มคุณลักษณะและชุดข้อมูลโดยอิงตามชุดของเหตุการณ์ ณ เวลาประทับที่ระบุ
- ดึงข้อมูลประวัติฟีเจอร์ภายในช่วงเวลาที่กำหนด
- ดึงข้อมูลคุณลักษณะตามเวลาประทับที่ระบุ
เบื้องต้น
คุณต้องมีข้อกำหนดเบื้องต้นต่อไปนี้:
เราถือว่ากลุ่มคุณลักษณะสำหรับข้อมูลลูกค้าเป้าหมายได้ถูกสร้างขึ้นโดยใช้ข้อมูลที่มีอยู่ FeatureGroup.create
วิธีการและสามารถอ้างอิงได้โดยใช้ตัวแปร base_fg
. สำหรับข้อมูลเพิ่มเติมเกี่ยวกับกลุ่มคุณลักษณะ โปรดดูที่ สร้างกลุ่มคุณลักษณะ.
สร้างชุดข้อมูลจากกลุ่มคุณลักษณะ
ในการสร้างชุดข้อมูลโดยใช้ SageMaker SDK เราจะใช้ชุดข้อมูลใหม่ FeatureStore
คลาสซึ่งประกอบด้วย create_dataset
วิธี. วิธีการนี้ยอมรับกลุ่มคุณลักษณะพื้นฐานที่อาจเข้าร่วมกับกลุ่มคุณลักษณะอื่นหรือ DataFrames เราเริ่มต้นด้วยการให้กลุ่มคุณลักษณะลูกค้าเป้าหมายเป็นฐานและ บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon เส้นทาง (Amazon S3) เพื่อจัดเก็บชุดข้อมูล:
พื้นที่ create_dataset
วิธีการคืนค่า a DatasetBuilder
วัตถุ ซึ่งสามารถใช้เพื่อสร้างชุดข้อมูลจากกลุ่มคุณลักษณะหนึ่งหรือหลายกลุ่ม (ซึ่งเราจะสาธิตในส่วนถัดไป) ในการสร้างชุดข้อมูลอย่างง่ายที่ประกอบด้วยเฉพาะคุณสมบัติลูกค้าเป้าหมายเท่านั้น เราจะเรียกใช้ to_csv_file
วิธี. ซึ่งจะเรียกใช้การสืบค้นใน Athena เพื่อดึงคุณสมบัติจากร้านค้าออฟไลน์ และบันทึกผลลัพธ์ลงในเส้นทาง S3 ที่ระบุ
เข้าร่วมกลุ่มคุณสมบัติหลายกลุ่ม
ด้วย SageMaker SDK คุณสามารถเข้าร่วมกลุ่มคุณสมบัติหลายกลุ่มเพื่อสร้างชุดข้อมูลได้อย่างง่ายดาย คุณยังสามารถดำเนินการรวมระหว่าง Pandas DataFrame ที่มีอยู่กับกลุ่มคุณสมบัติเดียวหรือหลายกลุ่มได้ ที่ กลุ่มคุณสมบัติพื้นฐาน เป็นแนวคิดที่สำคัญในการเข้าร่วม กลุ่มคุณลักษณะพื้นฐานคือกลุ่มคุณลักษณะที่มีกลุ่มคุณลักษณะอื่นหรือ Pandas DataFrame เข้าร่วมด้วย
ในขณะที่สร้างชุดข้อมูลโดยใช้ create_dataset
ฟังก์ชันเราใช้ with_feature_group
วิธีการ ซึ่งดำเนินการรวมภายในระหว่างกลุ่มคุณลักษณะพื้นฐานและกลุ่มคุณลักษณะอื่นโดยใช้ตัวระบุบันทึกและชื่อคุณลักษณะเป้าหมายในกลุ่มคุณลักษณะพื้นฐาน ในตัวอย่างของเรา กลุ่มคุณลักษณะพื้นฐานคือกลุ่มคุณลักษณะลูกค้าเป้าหมาย และกลุ่มคุณลักษณะเป้าหมายคือกลุ่มคุณลักษณะการตลาดบนเว็บ ที่ with_feature_group
วิธีการยอมรับข้อโต้แย้งต่อไปนี้:
- คุณลักษณะ_กลุ่ม – นี่คือกลุ่มฟีเจอร์ที่เราเข้าร่วมด้วย ในตัวอย่างโค้ดของเรา กลุ่มคุณลักษณะเป้าหมายจะถูกสร้างขึ้นโดยใช้ชุดข้อมูลการตลาดบนเว็บ
- target_feature_name_in_base – ชื่อของคุณลักษณะในกลุ่มคุณลักษณะพื้นฐานที่เราใช้เป็นคีย์ในการรวม เราใช้
Lead_ProspectID
เป็นตัวระบุบันทึกสำหรับกลุ่มคุณลักษณะพื้นฐาน - รวม_คุณลักษณะ_ชื่อ – นี่คือรายการชื่อคุณลักษณะของกลุ่มคุณลักษณะพื้นฐาน เราใช้ฟิลด์นี้เพื่อระบุคุณลักษณะที่เราต้องการรวมไว้ในชุดข้อมูล
รหัสต่อไปนี้แสดงตัวอย่างการสร้างชุดข้อมูลโดยการเข้าร่วมกลุ่มคุณลักษณะพื้นฐานกับกลุ่มคุณลักษณะเป้าหมาย:
คุณสามารถขยายการดำเนินการรวมเพื่อรวมกลุ่มคุณลักษณะหลายกลุ่มได้โดยการเพิ่ม with_feature_group
วิธีการในตอนท้ายของตัวอย่างโค้ดก่อนหน้าและการกำหนดอาร์กิวเมนต์ที่จำเป็นสำหรับกลุ่มคุณลักษณะใหม่ คุณยังสามารถดำเนินการเข้าร่วมกับ DataFrame ที่มีอยู่ได้โดยการกำหนดฐานให้เป็น Pandas DataFrame ที่มีอยู่ของคุณและเข้าร่วมกับกลุ่มฟีเจอร์ที่สนใจ ตัวอย่างโค้ดต่อไปนี้แสดงวิธีสร้างชุดข้อมูลด้วย Pandas DataFrame ที่มีอยู่และกลุ่มฟีเจอร์ที่มีอยู่:
สำหรับตัวอย่างเพิ่มเติมเกี่ยวกับการกำหนดค่าต่างๆ เหล่านี้ โปรดดูที่ สร้างชุดข้อมูลจากกลุ่มคุณลักษณะของคุณ.
สร้างการเข้าร่วม ณ เวลาใดเวลาหนึ่ง
ความสามารถที่ทรงพลังที่สุดประการหนึ่งของการปรับปรุงนี้คือการดำเนินการรวมแบบจุดต่อเวลาอย่างง่ายดายและไม่จำเป็นต้องเขียนโค้ด SQL ที่ซับซ้อน เมื่อสร้างโมเดล ML นักวิทยาศาสตร์ข้อมูลจำเป็นต้องหลีกเลี่ยง การรั่วไหลของข้อมูล หรือการรั่วไหลของเป้าหมาย ซึ่งเป็นการใช้ข้อมูลโดยไม่ได้ตั้งใจในระหว่างการฝึกโมเดลซึ่งไม่สามารถใช้งานได้ในขณะที่คาดการณ์ ตัวอย่างเช่น หากเราพยายามคาดการณ์การฉ้อโกงบัตรเครดิต เราควรยกเว้นธุรกรรมที่มาถึงหลังจากการเรียกเก็บเงินจากการฉ้อโกงที่เราพยายามคาดการณ์ มิฉะนั้น โมเดลที่ผ่านการฝึกอบรมอาจใช้ข้อมูลหลังการฉ้อโกงนี้เพื่อเปลี่ยนแปลงโมเดล ทำให้เป็นแบบทั่วไป ไม่ค่อยดี
การดึงข้อมูลคุณลักษณะที่แม่นยำ ณ เวลาใดเวลาหนึ่งกำหนดให้คุณต้องระบุ DataFrame เอนทิตีที่ให้ชุดรหัสบันทึก (หรือคีย์หลัก) และเวลาเหตุการณ์ที่เกี่ยวข้องซึ่งทำหน้าที่เป็นเวลาตัดยอดสำหรับกิจกรรม กลไกการดึงข้อมูลนี้บางครั้งเรียกว่า การเดินทางข้ามเวลาระดับแถวเนื่องจากอนุญาตให้ใช้ข้อจำกัดด้านเวลาที่แตกต่างกันสำหรับคีย์แต่ละแถว ในการดำเนินการรวมช่วงเวลากับ SageMaker SDK เราใช้ ตัวสร้างชุดข้อมูล และจัดเตรียมเอนทิตี DataFrame เป็นอาร์กิวเมนต์ฐานให้กับตัวสร้าง
ในโค้ดต่อไปนี้ เราสร้าง DataFrame เอนทิตีแบบธรรมดาที่มีสองเรกคอร์ด เรากำหนดเวลาของเหตุการณ์ซึ่งใช้เพื่อระบุเวลาตัดยอดใกล้กับช่วงกลางของข้อมูลอนุกรมเวลา (กลางเดือนมกราคม 2023) ดังนี้
เมื่อเราใช้ point_in_time_accurate_join
ฟังก์ชั่นการทำงานด้วย create_dataset
การสืบค้นภายในจะไม่รวมบันทึกทั้งหมดที่มีการประทับเวลาในภายหลังจากนั้นตามเวลาตัดสิทธิ์ที่ให้มา โดยส่งคืนค่าคุณลักษณะล่าสุดที่จะมีให้ใช้งานได้ ณ เวลาที่เกิดเหตุการณ์:
โปรดสังเกตว่ามีเพียงสองระเบียนใน DataFrame ที่ส่งคืนโดยการรวม ณ เวลาใดเวลาหนึ่ง เนื่องจากเราส่งรหัสเรกคอร์ดเพียงสองรหัสในเอนทิตี DataFrame หนึ่งรหัสสำหรับแต่ละรหัส Lead_ProspectID
เราต้องการเรียกคืน เกณฑ์ ณ เวลานั้นระบุว่าเวลาเหตุการณ์ของเรกคอร์ด (เก็บไว้ในไฟล์ Lead_Eventtime
field) จะต้องมีค่าที่น้อยกว่าเวลาตัดยอด
นอกจากนี้ เรายังแนะนำให้แบบสอบถามดึงข้อมูลเฉพาะเรกคอร์ดล่าสุดที่ตรงตามเกณฑ์นี้ เนื่องจากเราได้ใช้ with_number_of_recent_records_by_record_identifier
วิธี. เมื่อใช้ร่วมกับ. point_in_time_accurate_join
ซึ่งจะช่วยให้ผู้เรียกระบุจำนวนระเบียนที่จะส่งคืนจากที่ตรงตามเกณฑ์การรวม ณ เวลาใดเวลาหนึ่งได้
เปรียบเทียบผลลัพธ์การรวม ณ เวลาหนึ่งๆ กับผลลัพธ์การสืบค้น Athena
เพื่อตรวจสอบผลลัพธ์ที่ส่งคืนโดย SageMaker SDK point_in_time_accurate_join
เราจะเปรียบเทียบกับผลลัพธ์ของการสืบค้น Athena ขั้นแรก เราสร้างการสืบค้น Athena มาตรฐานโดยใช้คำสั่ง SELECT ที่เชื่อมโยงกับตารางเฉพาะที่สร้างโดยรันไทม์ของ Feature Store ชื่อตารางนี้สามารถพบได้โดยการอ้างอิง table_name
สนามหลังจากสร้างอินสแตนซ์ athena_query
จาก FeatureGroup
ไฟ:
แบบสอบถาม Athena ไม่มีซีแมนทิกส์การรวม ณ เวลาใดเวลาหนึ่ง ดังนั้นจึงส่งคืนระเบียนทั้งหมดที่ตรงกับที่ระบุ record_id
(Lead_ProspectID
).
ต่อไป เราใช้ไลบรารี Pandas เพื่อจัดเรียงผลลัพธ์ของ Athena ตามเวลาของเหตุการณ์เพื่อให้เปรียบเทียบได้ง่าย บันทึกที่มีการประทับเวลาช้ากว่าเวลาเหตุการณ์ที่ระบุใน DataFrame เอนทิตี (ตัวอย่างเช่น 2023-01-15T00:00:00Z
) ส่งไปที่ point_in_time_accurate_join
ไม่ปรากฏในผลลัพธ์ ณ เวลาใดเวลาหนึ่ง เนื่องจากเราระบุเพิ่มเติมว่าเราต้องการเพียงระเบียนเดียวจากรายการก่อนหน้าเท่านั้น create_dataset
รหัสเราจะรับเฉพาะบันทึกล่าสุดก่อนเวลาตัดสิทธิ์เท่านั้น เมื่อเปรียบเทียบผลลัพธ์ SageMaker SDK กับผลลัพธ์การสืบค้น Athena เราจะพบว่าฟังก์ชันการรวม ณ เวลาใดเวลาหนึ่งส่งคืนบันทึกที่เหมาะสม
ดังนั้นเราจึงมั่นใจว่าเราสามารถใช้ SageMaker SDK เพื่อดำเนินการเดินทางข้ามเวลาระดับแถวและหลีกเลี่ยงการรั่วไหลของเป้าหมายได้ นอกจากนี้ ความสามารถนี้ยังใช้ได้กับกลุ่มฟีเจอร์หลายกลุ่มที่อาจรีเฟรชตามไทม์ไลน์ที่ต่างกันโดยสิ้นเชิง
ดึงข้อมูลประวัติฟีเจอร์ภายในช่วงเวลาที่กำหนด
นอกจากนี้เรายังต้องการสาธิตการใช้การระบุกรอบเวลาเมื่อเข้าร่วมกลุ่มคุณลักษณะเพื่อสร้างชุดข้อมูล หน้าต่างเวลาถูกกำหนดโดยใช้ with_event_time_range
ซึ่งรับสองอินพุต starting_timestamp
และ ending_timestamp
และส่งคืนออบเจ็กต์ตัวสร้างชุดข้อมูล ในตัวอย่างโค้ดของเรา เราได้กำหนดกรอบเวลาการดึงข้อมูลเป็นเวลา 1 วันเต็ม 2022-07-01 00:00:00
จนกระทั่ง 2022-07-02 00:00:00
.
รหัสต่อไปนี้แสดงวิธีการสร้างชุดข้อมูลที่มีหน้าต่างเวลาเหตุการณ์ที่ระบุในขณะที่เข้าร่วมกลุ่มคุณลักษณะพื้นฐานกับกลุ่มคุณลักษณะเป้าหมาย:
นอกจากนี้เรายังยืนยันความแตกต่างระหว่างขนาดของชุดข้อมูลที่สร้างขึ้นโดยใช้ with_event_time_range
โดยส่งออกไปยัง Pandas DataFrame ด้วยไฟล์ to_dataframe()
วิธีการและการแสดงข้อมูล สังเกตว่าชุดผลลัพธ์มีเพียงเศษส่วนของระเบียนเดิม 10,020 รายการ เนื่องจากจะดึงเฉพาะระเบียนที่มี event_time
อยู่ในช่วงระยะเวลา 1 วัน
ดึงข้อมูลคุณลักษณะตามเวลาประทับที่ระบุ
พื้นที่ DatasetBuilder as_of
วิธีการดึงคุณสมบัติจากชุดข้อมูลที่ตรงตามข้อ จำกัด ตามเวลาประทับซึ่งผู้เรียกจัดให้เป็นอาร์กิวเมนต์ของฟังก์ชัน กลไกนี้มีประโยชน์สำหรับสถานการณ์ เช่น การเรียกใช้การทดสอบซ้ำกับข้อมูลที่รวบรวมไว้ก่อนหน้านี้ การทดสอบแบบจำลองอนุกรมเวลา หรือการสร้างชุดข้อมูลจากสถานะก่อนหน้าของร้านค้าออฟไลน์เพื่อวัตถุประสงค์ในการตรวจสอบข้อมูล ฟังก์ชันนี้บางครั้งเรียกว่าการเดินทางข้ามเวลา เนื่องจากฟังก์ชันนี้จะย้อนกลับที่เก็บข้อมูลไปเป็นวันที่และเวลาก่อนหน้า ข้อจำกัดด้านเวลานี้เรียกอีกอย่างว่า การประทับเวลาตัด.
ในโค้ดตัวอย่างของเรา ขั้นแรกเราจะสร้างการประทับเวลาตัดออกโดยการอ่าน write_time
ค่าสำหรับเรคคอร์ดสุดท้ายที่เขียนไปยัง Feature Store ซึ่งเป็นเรคคอร์ดที่เขียนด้วย put_record
. จากนั้นเราจะจัดเตรียมการประทับเวลาตัดสิทธิ์นี้ให้กับ DatasetBuilder
เป็นข้อโต้แย้งของ as_of
วิธี:
สิ่งสำคัญคือต้องสังเกตว่า as_of
วิธีการใช้การจำกัดเวลากับภายใน write_time
ฟิลด์ซึ่งสร้างโดยอัตโนมัติโดย Feature Store ที่ write_time
ฟิลด์แสดงถึงการประทับเวลาจริงเมื่อมีการเขียนบันทึกไปยังที่เก็บข้อมูล ซึ่งแตกต่างไปจากวิธีอื่นๆ เช่น point-in-time-accurate-join
และ with_event_time_range
ที่ใช้ไคลเอ็นต์จัดเตรียมไว้ event_time
ลงสนามเป็นตัวเปรียบเทียบ
ทำความสะอาด
อย่าลืมลบทรัพยากรทั้งหมดที่สร้างขึ้นเพื่อเป็นส่วนหนึ่งของตัวอย่างนี้เพื่อหลีกเลี่ยงไม่ให้มีการเรียกเก็บเงินต่อเนื่อง ซึ่งรวมถึงกลุ่มฟีเจอร์และบัคเก็ต S3 ที่มีข้อมูลร้านค้าออฟไลน์
ประสบการณ์ SageMaker Python SDK เทียบกับการเขียน SQL
วิธีการใหม่ใน SageMaker Python SDK ช่วยให้คุณสร้างชุดข้อมูลได้อย่างรวดเร็วและย้ายไปยังขั้นตอนการฝึกอบรมได้อย่างรวดเร็วในระหว่างวงจรการใช้งาน ML เพื่อแสดงเวลาและความพยายามที่สามารถประหยัดได้ เรามาตรวจสอบกรณีการใช้งานที่เราจำเป็นต้องเข้าร่วมกลุ่มคุณสมบัติสองกลุ่มในขณะที่ดึงคุณสมบัติภายในกรอบเวลาที่กำหนด รูปต่อไปนี้เปรียบเทียบการสืบค้น Python บน Feature Store แบบออฟไลน์กับ SQL ที่ใช้เพื่อสร้างชุดข้อมูลที่อยู่เบื้องหลังการสืบค้น Python
ดังที่คุณเห็นแล้วว่า การดำเนินการเดียวกันในการรวมสองกลุ่มคุณลักษณะต้องการให้คุณสร้างแบบสอบถาม SQL ที่ยาวและซับซ้อน ในขณะที่สามารถทำได้โดยใช้เพียง with_feature_group
และ with_event_time_range
วิธีการใน SageMaker Python SDK
สรุป
วิธีการจัดเก็บออฟไลน์แบบใหม่ใน Python SageMaker SDK ช่วยให้คุณสามารถสืบค้นคุณสมบัติออฟไลน์ของคุณได้โดยไม่ต้องเขียนคำสั่ง SQL ที่ซับซ้อน สิ่งนี้มอบประสบการณ์ที่ราบรื่นให้กับลูกค้าที่คุ้นเคยกับการเขียนโค้ด Python ในระหว่างการพัฒนาโมเดล สำหรับข้อมูลเพิ่มเติมเกี่ยวกับกลุ่มคุณลักษณะ โปรดดูที่ สร้างชุดข้อมูลจากกลุ่มคุณลักษณะของคุณ และ API ของร้านค้าฟีเจอร์: กลุ่มฟีเจอร์.
ตัวอย่างแบบเต็มในโพสต์นี้สามารถพบได้ใน พื้นที่เก็บข้อมูล GitHub. ลองดูและแจ้งให้เราทราบความคิดเห็นของคุณในความคิดเห็น
เกี่ยวกับผู้เขียน
พอล ฮาร์กิส ได้มุ่งเน้นความพยายามของเขาในการเรียนรู้ของเครื่องที่บริษัทหลายแห่ง รวมถึง AWS, Amazon และ Hortonworks เขาสนุกกับการสร้างโซลูชันด้านเทคโนโลยีและสอนผู้คนถึงวิธีใช้ประโยชน์จากโซลูชันเหล่านั้น Paul ชอบที่จะช่วยลูกค้าขยายความคิดริเริ่มการเรียนรู้ของเครื่องเพื่อแก้ไขปัญหาในโลกแห่งความเป็นจริง ก่อนที่จะมารับบทที่ AWS เขาเป็นหัวหน้าสถาปนิกของ Amazon Exports and Expansions โดยเป็นผู้ช่วย amazon.com ปรับปรุงประสบการณ์สำหรับนักช้อปจากต่างประเทศ
เมซิท กุนกอร์ เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML ของ AWS ที่ช่วยลูกค้าออกแบบและสร้างโซลูชัน AI/ML ในวงกว้าง เขาครอบคลุมกรณีการใช้งาน AI/ML ที่หลากหลายสำหรับลูกค้าโทรคมนาคม และปัจจุบันมุ่งเน้นไปที่ Generative AI, LLM และการเพิ่มประสิทธิภาพการฝึกอบรมและการอนุมาน เขามักจะพบเห็นการเดินป่าในถิ่นทุรกันดารหรือเล่นเกมกระดานกับเพื่อน ๆ ในเวลาว่าง
โทนี่เฉิน เป็นสถาปนิกโซลูชันการเรียนรู้ของเครื่องที่ AWS ซึ่งช่วยให้ลูกค้าออกแบบความสามารถด้านการเรียนรู้ของเครื่องที่ปรับขนาดได้และมีประสิทธิภาพในระบบคลาวด์ ในฐานะอดีตนักวิทยาศาสตร์ข้อมูลและวิศวกรข้อมูล เขาใช้ประสบการณ์ของเขาเพื่อช่วยจัดการกับปัญหาที่ท้าทายที่สุดที่องค์กรต้องเผชิญด้วยการนำการเรียนรู้ของเครื่องไปใช้จริง
โสวิกกุมารนาถ เป็นสถาปนิกโซลูชัน AI/ML กับ AWS เขามีประสบการณ์มากมายในการออกแบบและโซลูชั่นแบบครบวงจรสำหรับแมชชีนเลิร์นนิง การวิเคราะห์ธุรกิจภายในการวิเคราะห์ทางการเงิน การปฏิบัติการ และการตลาด ดูแลสุขภาพ; ห่วงโซ่อุปทาน; และไอโอที การทำงานนอกสถานที่ Sovik ชอบท่องเที่ยวและดูภาพยนตร์
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- การเงิน EVM ส่วนต่อประสานแบบครบวงจรสำหรับการเงินแบบกระจายอำนาจ เข้าถึงได้ที่นี่.
- กลุ่มสื่อควอนตัม IR/PR ขยาย เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/build-machine-learning-ready-datasets-from-the-amazon-sagemaker-offline-feature-store-using-the-amazon-sagemaker-python-sdk/
- :มี
- :เป็น
- :ที่ไหน
- $ ขึ้น
- 1
- 10
- 100
- 11
- 14
- 15%
- 16
- 2023
- 22
- 24
- 7
- 8
- a
- เกี่ยวกับเรา
- ยอมรับ
- เข้า
- คล่องแคล่ว
- ความถูกต้อง
- ถูกต้อง
- ข้าม
- กิจกรรม
- ที่เกิดขึ้นจริง
- Ad
- เพิ่ม
- นอกจากนี้
- หลังจาก
- AI
- AI / ML
- ทั้งหมด
- อนุญาต
- ช่วยให้
- ด้วย
- เสมอ
- อเมซอน
- อเมซอน SageMaker
- Amazon Web Services
- an
- การวิเคราะห์
- และ
- อื่น
- ใด
- อาปาเช่
- API
- APIs
- ประยุกต์
- เป็น
- อาร์กิวเมนต์
- ข้อโต้แย้ง
- AS
- At
- การตรวจสอบบัญชี
- อัตโนมัติ
- ใช้ได้
- หลีกเลี่ยง
- AWS
- กลับ
- backtesting
- ฐาน
- ตาม
- BE
- เพราะ
- รับ
- หลัง
- ระหว่าง
- คณะกรรมการ
- เกมกระดาน
- สร้าง
- สร้าง
- การก่อสร้าง
- ธุรกิจ
- by
- โทรศัพท์
- ผู้เรียก
- CAN
- ความสามารถในการ
- สามารถ
- ถูกจับกุม
- บัตร
- กรณี
- กรณี
- โซ่
- ท้าทาย
- รับผิดชอบ
- โหลด
- ชั้น
- เมฆ
- รหัส
- ความคิดเห็น
- ร่วมกัน
- บริษัท
- เปรียบเทียบ
- เปรียบเทียบ
- การเปรียบเทียบ
- อย่างสมบูรณ์
- ซับซ้อน
- แนวคิด
- ความมั่นใจ
- ยืนยัน
- ร่วม
- ประกอบด้วย
- บรรจุ
- มี
- แปลง
- ตรงกัน
- ได้
- ครอบคลุม
- สร้าง
- ที่สร้างขึ้น
- การสร้าง
- เครดิต
- บัตรเครดิต
- เกณฑ์
- ขณะนี้
- ลูกค้า
- ข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- ชุดข้อมูล
- วันที่
- วันเวลา
- วัน
- กำหนด
- การกำหนด
- สาธิต
- แสดงให้เห็นถึง
- ออกแบบ
- การออกแบบ
- พัฒนาการ
- ความแตกต่าง
- ต่าง
- แสดง
- ไม่
- Dont
- ในระหว่าง
- แต่ละ
- ก่อน
- ง่ายดาย
- อย่างง่ายดาย
- ง่าย
- ความพยายาม
- ความพยายาม
- ปลาย
- จบสิ้น
- มีส่วนร่วม
- วิศวกร
- การสร้างความมั่นใจ
- เอกลักษณ์
- ยุค
- เป็นหลัก
- เหตุการณ์
- เหตุการณ์
- ตรวจสอบ
- ตัวอย่าง
- ตัวอย่าง
- ที่มีอยู่
- แสดง
- ประสบการณ์
- การทดลอง
- การส่งออก
- ขยายออก
- กว้างขวาง
- ประสบการณ์ที่กว้างขวาง
- ใบหน้า
- ลักษณะ
- คุณสมบัติ
- ฟีเจอร์สโตร์
- ข้อเสนอแนะ
- สนาม
- รูป
- เนื้อไม่มีมัน
- กรอง
- ทางการเงิน
- ชื่อจริง
- มุ่งเน้น
- มุ่งเน้นไปที่
- ดังต่อไปนี้
- สำหรับ
- ฟอร์ม
- อดีต
- พบ
- เศษ
- FRAME
- การหลอกลวง
- ฉ้อโกง
- ฟรี
- มัก
- เพื่อน
- ราคาเริ่มต้นที่
- เต็ม
- ฟังก์ชัน
- ฟังก์ชั่น
- นอกจากนี้
- เกม
- สร้าง
- สร้าง
- กำเนิด
- กำเนิด AI
- ได้รับ
- ให้
- กำหนด
- บัญชีกลุ่ม
- กลุ่ม
- จัดการ
- มี
- มี
- he
- การดูแลสุขภาพ
- ช่วย
- การช่วยเหลือ
- ของเขา
- ทางประวัติศาสตร์
- ประวัติ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTML
- ที่ http
- HTTPS
- ระบุ
- ระบุ
- รหัส
- if
- นำเข้า
- สำคัญ
- ปรับปรุง
- in
- ประกอบด้วย
- รวมถึง
- รวมทั้ง
- แสดง
- ข้อมูล
- ความคิดริเริ่ม
- ปัจจัยการผลิต
- ตัวอย่าง
- สนใจ
- ภายใน
- International
- เข้าไป
- IOT
- IT
- ร่วม
- เข้าร่วม
- การร่วม
- ร่วม
- jpg
- เพียงแค่
- คีย์
- ทราบ
- ชื่อสกุล
- ต่อมา
- ล่าสุด
- นำ
- นำไปสู่
- การเรียนรู้
- น้อยลง
- ให้
- เลฟเวอเรจ
- ยกระดับ
- ห้องสมุด
- วงจรชีวิต
- กดไลก์
- ยอดไลก์
- รายการ
- ที่ตั้ง
- นาน
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- การทำ
- หลาย
- การตลาด
- การจับคู่
- อาจ..
- กลไก
- พบ
- มีคุณสมบัติตรงตาม
- วิธี
- วิธีการ
- ตัวชี้วัด
- กลาง
- ML
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มากที่สุด
- ย้าย
- Movies
- หลาย
- ต้อง
- ชื่อ
- ชื่อ
- ใกล้
- จำเป็นต้อง
- ใหม่
- ถัดไป
- สมุดบันทึก
- สังเกต..
- วัตถุ
- of
- ออฟไลน์
- มักจะ
- on
- ONE
- ต่อเนื่อง
- ออนไลน์
- เพียง
- การดำเนินการ
- การดำเนินงาน
- การดำเนินการ
- การเพิ่มประสิทธิภาพ
- or
- องค์กร
- เป็นต้นฉบับ
- อื่นๆ
- มิฉะนั้น
- ของเรา
- เอาท์พุต
- ด้านนอก
- เกิน
- หมีแพนด้า
- ส่วนหนึ่ง
- ส่วน
- ส่ง
- เส้นทาง
- รูปแบบ
- พอล
- คน
- ดำเนินการ
- ดำเนินการ
- ระยะเวลา
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- โพสต์
- ที่มีประสิทธิภาพ
- คาดการณ์
- คำทำนาย
- คาดการณ์
- ข้อกำหนดเบื้องต้น
- ก่อน
- ก่อนหน้านี้
- ประถม
- ก่อน
- ปัญหาที่เกิดขึ้น
- กระบวนการ
- เหมาะสม
- ที่คาดหวัง
- ให้
- ให้
- การให้
- วัตถุประสงค์
- หลาม
- คำสั่ง
- อย่างรวดเร็ว
- พิสัย
- การอ่าน
- โลกแห่งความจริง
- ระเบียน
- บันทึก
- อ้างอิง
- เรียกว่า
- ปล่อย
- แสดงให้เห็นถึง
- ต้องการ
- จำเป็นต้องใช้
- ต้อง
- แหล่งข้อมูล
- ผล
- ผลสอบ
- กลับ
- การคืน
- รับคืน
- แข็งแรง
- บทบาท
- ม้วน
- แถว
- วิ่ง
- sagemaker
- การขาย
- เดียวกัน
- ที่ปรับขนาดได้
- ขนาด
- สถานการณ์
- นักวิทยาศาสตร์
- นักวิทยาศาสตร์
- SDK
- ไร้รอยต่อ
- วินาที
- Section
- เห็น
- อรรถศาสตร์
- ชุด
- ให้บริการ
- บริการ
- บริการ
- ชุด
- การตั้งค่า
- การติดตั้ง
- หลาย
- น่า
- โชว์
- แสดงให้เห็นว่า
- ง่าย
- ง่ายดาย
- เดียว
- ขนาด
- So
- ทางออก
- โซลูชัน
- แก้
- บาง
- จุดประกาย
- ผู้เชี่ยวชาญ
- โดยเฉพาะ
- ที่ระบุไว้
- มาตรฐาน
- เริ่มต้น
- สถานะ
- คำแถลง
- งบ
- ขั้นตอน
- ขั้นตอน
- การเก็บรักษา
- จัดเก็บ
- เก็บไว้
- ร้านค้า
- ส่ง
- อย่างเช่น
- เหมาะสม
- ที่จัดมา
- จัดหาอุปกรณ์
- ห่วงโซ่อุปทาน
- สนับสนุน
- การประสาน
- ตาราง
- ต่อสู้
- เป้า
- การเรียนการสอน
- เทคโนโลยี
- การสื่อสารโทรคมนาคม
- กว่า
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- เหล่านั้น
- ตลอด
- ผูก
- เวลา
- อนุกรมเวลา
- การเดินทางข้ามเวลา
- ระยะเวลา
- ครั้ง
- การประทับเวลา
- ไปยัง
- โทนี่
- ผ่านการฝึกอบรม
- การฝึกอบรม
- การทำธุรกรรม
- การเดินทาง
- การเดินทาง
- ลอง
- สอง
- ยูนิกซ์
- แตกต่าง
- จนกระทั่ง
- ให้กับคุณ
- us
- ใช้
- ใช้กรณี
- มือสอง
- การใช้
- ความคุ้มค่า
- ความคุ้มค่า
- ต่างๆ
- ตรวจสอบ
- vs
- ต้องการ
- คือ
- ชม
- วิธี
- we
- เว็บ
- บริการเว็บ
- ดี
- เมื่อ
- แต่ทว่า
- ที่
- ในขณะที่
- WHO
- ใคร
- กว้าง
- ช่วงกว้าง
- วิกิพีเดีย
- จะ
- กับ
- ภายใน
- ไม่มี
- งาน
- โรงงาน
- จะ
- เขียน
- การเขียน
- เขียน
- คุณ
- ของคุณ
- ลมทะเล