การกำหนดมูลค่าของที่อยู่อาศัยเป็นตัวอย่างคลาสสิกของการใช้การเรียนรู้ของเครื่อง (ML) Harrison และ Rubinfeld (1978) มีอิทธิพลสำคัญซึ่งตีพิมพ์บทความและชุดข้อมูลที่แหวกแนวซึ่งกลายเป็นที่รู้จักอย่างไม่เป็นทางการในชื่อชุดข้อมูลที่อยู่อาศัยของบอสตัน งานชิ้นสำคัญนี้เสนอวิธีการประมาณราคาที่อยู่อาศัยในหลายๆ มิติ รวมถึงคุณภาพอากาศ ซึ่งเป็นจุดสนใจหลักของการวิจัย เกือบ 50 ปีต่อมา การประมาณราคาที่อยู่อาศัยได้กลายเป็นเครื่องมือการสอนที่สำคัญสำหรับนักศึกษาและผู้เชี่ยวชาญที่สนใจในการใช้ข้อมูลและ ML ในการตัดสินใจทางธุรกิจ
ในโพสต์นี้ เราจะพูดถึงการใช้โมเดลโอเพ่นซอร์สที่ออกแบบมาโดยเฉพาะสำหรับงานตอบคำถามด้วยภาพ (VQA) ด้วย VQA คุณสามารถถามคำถามเกี่ยวกับรูปภาพโดยใช้ภาษาธรรมชาติและรับคำตอบสำหรับคำถามของคุณ—รวมถึงเป็นภาษาธรรมดาด้วย เป้าหมายของเราในโพสต์นี้คือการสร้างแรงบันดาลใจและสาธิตสิ่งที่เป็นไปได้โดยใช้เทคโนโลยีนี้ เราเสนอให้ใช้ความสามารถนี้กับ อเมซอน SageMaker แพลตฟอร์มบริการเพื่อปรับปรุงความแม่นยำของโมเดลการถดถอยในกรณีการใช้งาน ML และอย่างอิสระ สำหรับการแท็กรูปภาพอัตโนมัติ
เราจัดให้มีสิ่งที่สอดคล้องกัน วิดีโอ YouTube ที่แสดงให้เห็นสิ่งที่จะกล่าวถึงที่นี่ การเล่นวิดีโอจะเริ่มตรงกลางเพื่อเน้นจุดที่สำคัญที่สุด เราขอแนะนำให้คุณติดตามการอ่านนี้พร้อมกับวิดีโอเพื่อเสริมและทำความเข้าใจแนวคิดนี้ให้มากขึ้น
โมเดลรองพื้น
โซลูชันนี้มุ่งเน้นไปที่การใช้โมเดลพื้นฐานที่เผยแพร่ไปยังที่เก็บโมเดล Hugging Face ในที่นี้เราใช้คำว่า แบบจำลองรากฐาน เพื่ออธิบายความสามารถด้านปัญญาประดิษฐ์ (AI) ที่ได้รับการฝึกอบรมล่วงหน้าเกี่ยวกับข้อมูลขนาดใหญ่และหลากหลาย บางครั้งโมเดลพื้นฐานก็พร้อมใช้งานโดยไม่ต้องมีภาระในการฝึกโมเดลจากศูนย์ โมเดลพื้นฐานบางรุ่นสามารถปรับแต่งได้อย่างละเอียด ซึ่งหมายถึงการสอนรูปแบบเพิ่มเติมที่เกี่ยวข้องกับธุรกิจของคุณ แต่ขาดหายไปจากโมเดลดั้งเดิมที่เผยแพร่ทั่วไป บางครั้งจำเป็นต้องมีการปรับแต่งอย่างละเอียดเพื่อให้การตอบสนองที่ถูกต้องซึ่งเป็นเอกลักษณ์เฉพาะสำหรับกรณีการใช้งานหรือองค์ความรู้ของคุณ
ตัว Vortex Indicator ได้ถูกนำเสนอลงในนิตยสาร กอดหน้า พื้นที่เก็บข้อมูล มี VQA หลายรุ่นให้เลือก เราเลือกรุ่นที่มีการดาวน์โหลดมากที่สุดในขณะที่เขียนบทความนี้ แม้ว่าโพสต์นี้จะแสดงให้เห็นถึงความสามารถในการใช้โมเดลจากที่เก็บโมเดลโอเพ่นซอร์ส แต่แนวคิดเดียวกันนี้จะนำไปใช้กับโมเดลที่คุณฝึกตั้งแต่ศูนย์หรือใช้จากผู้ให้บริการที่เชื่อถือได้รายอื่น
แนวทางสมัยใหม่สำหรับกรณีการใช้งานแบบคลาสสิก
การประมาณราคาบ้านมักเกิดขึ้นผ่านข้อมูลแบบตารางซึ่งใช้คุณลักษณะของทรัพย์สินเพื่อแจ้งราคา แม้ว่าจะมีคุณสมบัติหลายร้อยรายการที่ต้องพิจารณา แต่ตัวอย่างพื้นฐานบางส่วน ได้แก่ ขนาดของบ้านในพื้นที่สำเร็จรูป จำนวนห้องนอนและห้องน้ำ และตำแหน่งของที่อยู่อาศัย
การเรียนรู้ของเครื่องสามารถรวมแหล่งอินพุตที่หลากหลายนอกเหนือจากข้อมูลแบบตาราง เช่น เสียง ภาพนิ่ง วิดีโอภาพเคลื่อนไหว และภาษาธรรมชาติ ใน AI คำว่า หลายรูปแบบ หมายถึง การใช้สื่อประเภทต่างๆ เช่น รูปภาพ และข้อมูลแบบตาราง ในโพสต์นี้ เราจะแสดงวิธีใช้ข้อมูลหลายรูปแบบเพื่อค้นหาและปลดปล่อยคุณค่าที่ซ่อนอยู่ซึ่งถูกกักขังอยู่ในไอเสียทางดิจิทัลที่มีอยู่มากมายในโลกสมัยใหม่ในปัจจุบัน
ด้วยแนวคิดนี้ เราจึงสาธิตการใช้แบบจำลองพื้นฐานเพื่อแยกคุณลักษณะที่แฝงอยู่ออกจากรูปภาพของทรัพย์สิน ด้วยการใช้ข้อมูลเชิงลึกที่พบในรูปภาพซึ่งไม่มีในข้อมูลแบบตารางก่อนหน้านี้ เราสามารถปรับปรุงความแม่นยำของแบบจำลองได้ ทั้งรูปภาพและข้อมูลแบบตารางที่กล่าวถึงในโพสต์นี้เดิมเผยแพร่และเผยแพร่ไปที่ GitHub โดย Ahmed และ Moustafa (2016)
ภาพที่มีค่าพันคำ
ตอนนี้เราเข้าใจความสามารถของ VQA แล้ว ลองพิจารณารูปภาพห้องครัวสองรูปต่อไปนี้ คุณจะประเมินมูลค่าบ้านจากภาพเหล่านี้อย่างไร คุณจะถามคำถามอะไรบ้างกับตัวเอง? แต่ละภาพอาจก่อให้เกิดคำถามมากมายในใจคุณ คำถามเหล่านั้นบางข้ออาจนำไปสู่คำตอบที่มีความหมายซึ่งช่วยปรับปรุงกระบวนการประเมินราคาบ้าน
เครดิตรูปภาพ Francesca Tosolini (ซ้าย) และ Sidekix Media (R) บน Unsplash
ตารางต่อไปนี้แสดงตัวอย่างโดยสรุปของการโต้ตอบ VQA โดยแสดงคำถามควบคู่ไปกับคำตอบที่เกี่ยวข้อง คำตอบอาจมาในรูปแบบของการตอบกลับแบบหมวดหมู่ ค่าต่อเนื่อง หรือการตอบกลับแบบไบนารี
ตัวอย่างคำถาม | ตัวอย่างคำตอบจาก Foundation Model |
ท็อปโต๊ะทำมาจากอะไร? | หินแกรนิต กระเบื้อง หินอ่อน ลามิเนต ฯลฯ |
ครัวนี้แพงมั้ย? | ใช่ไม่ใช่ |
อ่างล้างจานมีกี่อ่างแยกกัน? | 0, 1, 2 |
สถาปัตยกรรมอ้างอิง
ในโพสต์นี้เราใช้ Amazon SageMaker ข้อมูล Wrangler เพื่อถามคำถามแบบเห็นภาพจำนวนหลายพันภาพในชุดข้อมูล SageMaker Data Wrangler สร้างขึ้นโดยมีจุดประสงค์เพื่อลดความซับซ้อนของกระบวนการเตรียมข้อมูลและวิศวกรรมฟีเจอร์ ด้วยการมอบการแปลงในตัวมากกว่า 300 รายการ SageMaker Data Wrangler ช่วยลดเวลาที่ใช้ในการเตรียมข้อมูลแบบตารางและรูปภาพสำหรับ ML จากสัปดาห์เหลือเพียงนาที ที่นี่ SageMaker Data Wrangler ผสมผสานคุณสมบัติข้อมูลจากชุดตารางดั้งเดิมเข้ากับคุณสมบัติที่เกิดจากภาพถ่ายจากโมเดลพื้นฐานสำหรับการฝึกโมเดล
ต่อไป เราจะสร้างแบบจำลองการถดถอยโดยใช้ ผืนผ้าใบ Amazon SageMaker. SageMaker Canvas สามารถสร้างแบบจำลองโดยไม่ต้องเขียนโค้ดใดๆ และให้ผลลัพธ์เบื้องต้นได้ภายในเวลาเพียง 2-15 นาที ในส่วนต่อไปนี้ เรามีสถาปัตยกรรมอ้างอิงที่ใช้ให้คำแนะนำโซลูชันนี้
โมเดลยอดนิยมมากมายจาก Hugging Face และผู้ให้บริการรายอื่นสามารถปรับใช้ได้ในคลิกเดียว Amazon SageMaker JumpStart. มีโมเดลหลายแสนรุ่นในที่เก็บเหล่านี้ สำหรับโพสต์นี้ เราเลือกโมเดลที่ไม่มีใน SageMaker JumpStart ซึ่งต้องมีการปรับใช้งานโดยลูกค้า ดังแสดงในรูปต่อไปนี้ เราปรับใช้โมเดล Hugging Face สำหรับการอนุมานโดยใช้ สตูดิโอ Amazon SageMaker สมุดบันทึก. โน้ตบุ๊กใช้เพื่อปรับใช้ตำแหน่งข้อมูลสำหรับการอนุมานแบบเรียลไทม์ สมุดบันทึกใช้เนื้อหาที่มีโมเดลไบนารี Hugging Face ตัวชี้ไปยังอิมเมจคอนเทนเนอร์ และสคริปต์ inference.py ที่สร้างขึ้นตามวัตถุประสงค์ซึ่งตรงกับอินพุตและเอาต์พุตที่คาดหวังของโมเดล เมื่อคุณอ่านข้อความนี้ การผสมผสานของโมเดล VQA ที่มีให้เลือกอาจมีการเปลี่ยนแปลง สิ่งสำคัญคือการตรวจสอบโมเดล VQA ที่พร้อมใช้งานในขณะที่คุณอ่านข้อความนี้ และเตรียมพร้อมที่จะปรับใช้โมเดลที่คุณเลือก ซึ่งจะมีคำขอ API และสัญญาตอบกลับของตัวเอง
หลังจากที่จุดสิ้นสุด SageMaker ให้บริการโมเดล VQA แล้ว เราจะใช้ SageMaker Data Wrangler เพื่อจัดระเบียบไปป์ไลน์ที่รวมข้อมูลแบบตารางและคุณสมบัติที่แยกจากรูปภาพดิจิทัลในท้ายที่สุด และปรับรูปร่างข้อมูลใหม่สำหรับการฝึกโมเดล รูปถัดไปนำเสนอมุมมองว่างานการแปลงข้อมูลเต็มรูปแบบดำเนินไปอย่างไร
ในรูปต่อไปนี้ เราใช้ SageMaker Data Wrangler เพื่อประสานงานงานการเตรียมข้อมูลและ SageMaker Canvas สำหรับการฝึกโมเดล ขั้นแรก SageMaker Data Wrangler จะใช้ บริการระบุตำแหน่งอเมซอน เพื่อแปลงรหัสไปรษณีย์ที่มีอยู่ในข้อมูลดิบให้เป็นคุณลักษณะละติจูดและลองจิจูด ประการที่สอง SageMaker Data Wrangler สามารถประสานงานการส่งภาพถ่ายนับพันไปยังจุดสิ้นสุดที่โฮสต์โดย SageMaker เพื่อการอนุมานแบบเรียลไทม์ โดยถามคำถามชุดเดียวกันต่อฉาก ซึ่งส่งผลให้มีคุณลักษณะมากมายที่อธิบายคุณลักษณะที่พบในห้องครัว ห้องน้ำ ภายนอกบ้าน และอื่นๆ หลังจากที่ SageMaker Data Wrangler จัดเตรียมข้อมูลแล้ว ชุดข้อมูลการฝึกอบรมจะพร้อมใช้งานใน บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน S3). การใช้ข้อมูล S3 เป็นอินพุต SageMaker Canvas สามารถฝึกโมเดลได้ในเวลาเพียง 2-15 นาที โดยไม่ต้องเขียนโค้ดใดๆ
การแปลงข้อมูลโดยใช้ SageMaker Data Wrangler
ภาพหน้าจอต่อไปนี้แสดงเวิร์กโฟลว์ SageMaker Data Wrangler ขั้นตอนการทำงานเริ่มต้นด้วยรูปถ่ายบ้านหลายพันภาพที่จัดเก็บไว้ใน Amazon S3 ถัดไป อุปกรณ์ตรวจจับฉากจะกำหนดฉาก เช่น ห้องครัวหรือห้องน้ำ สุดท้าย ชุดคำถามเฉพาะฉากจะถูกถามเกี่ยวกับรูปภาพ ส่งผลให้มีชุดข้อมูลแบบตารางที่สมบูรณ์ยิ่งขึ้นสำหรับการฝึกอบรม
ต่อไปนี้เป็นตัวอย่างของโค้ดการแปลงแบบกำหนดเองของ SageMaker Data Wrangler ที่ใช้เพื่อโต้ตอบกับโมเดลพื้นฐานและรับข้อมูลเกี่ยวกับรูปภาพห้องครัว ในภาพหน้าจอก่อนหน้านี้ หากคุณต้องเลือกโหนดคุณลักษณะห้องครัว รหัสต่อไปนี้จะปรากฏขึ้น:
เพื่อการพิจารณาด้านความปลอดภัย ก่อนอื่นคุณต้องเปิดใช้งาน SageMaker Data Wrangler เพื่อเรียกตำแหน่งข้อมูลแบบเรียลไทม์ของ SageMaker ผ่านทาง AWS Identity และการจัดการการเข้าถึง (ฉัน). ในทำนองเดียวกัน ทรัพยากร AWS ใดๆ ที่คุณเรียกใช้ผ่าน SageMaker Data Wrangler จะต้องมีสิทธิ์อนุญาตที่คล้ายกัน
โครงสร้างข้อมูลก่อนและหลัง SageMaker Data Wrangler
ในส่วนนี้ เราจะหารือเกี่ยวกับโครงสร้างของข้อมูลตารางต้นฉบับและข้อมูลที่ได้รับการปรับปรุง ข้อมูลที่ปรับปรุงประกอบด้วยฟีเจอร์ข้อมูลใหม่ที่เกี่ยวข้องกับกรณีการใช้งานตัวอย่างนี้ ในใบสมัครของคุณ ใช้เวลาจินตนาการถึงชุดคำถามที่หลากหลายที่มีอยู่ในรูปภาพของคุณ เพื่อช่วยในการจำแนกประเภทหรือการถดถอย แนวคิดคือการจินตนาการถึงคำถามให้มากที่สุดเท่าที่จะเป็นไปได้ แล้วทดสอบเพื่อให้แน่ใจว่าคำถามเหล่านั้นช่วยเพิ่มมูลค่าได้
โครงสร้างของข้อมูลตารางดั้งเดิม
ตามที่อธิบายไว้ในแหล่งที่มา repo GitHubชุดข้อมูลตัวอย่างประกอบด้วยบันทึกแบบตาราง 535 รายการ ซึ่งรวมถึงรูปภาพ XNUMX รูปต่อพร็อพเพอร์ตี้ ตารางต่อไปนี้แสดงโครงสร้างของข้อมูลแบบตารางต้นฉบับ
ลักษณะ | Comment |
จำนวนห้องนอน | . |
จำนวนห้องน้ำ | . |
พื้นที่ (ตารางฟุต) | . |
รหัสไปรษณีย์ | . |
ราคา | นี่คือตัวแปรเป้าหมายที่จะคาดการณ์ |
โครงสร้างของข้อมูลที่ปรับปรุง
ตารางต่อไปนี้แสดงโครงสร้างข้อมูลที่ปรับปรุงแล้ว ซึ่งมีคุณลักษณะใหม่ๆ หลายประการที่ได้มาจากรูปภาพ
ลักษณะ | Comment |
จำนวนห้องนอน | . |
จำนวนห้องน้ำ | . |
พื้นที่ (ตารางฟุต) | . |
ละติจูด | คำนวณโดยการส่งรหัสไปรษณีย์ดั้งเดิมไปยัง Amazon Location Service นี่คือค่าเซนทรอยด์สำหรับ ZIP |
ลองจิจูด | คำนวณโดยการส่งรหัสไปรษณีย์ดั้งเดิมไปยัง Amazon Location Service นี่คือค่าเซนทรอยด์สำหรับ ZIP |
ห้องนอนมีเพดานโค้งหรือไม่? | 0 = ไม่; 1 = ใช่ |
ห้องน้ำแพงมั้ย? | 0 = ไม่; 1 = ใช่ |
ครัวแพงมั้ย? | 0 = ไม่; 1 = ใช่ |
ราคา | นี่คือตัวแปรเป้าหมายที่จะคาดการณ์ |
การฝึกโมเดลด้วย SageMaker Canvas
งานประมวลผล SageMaker Data Wrangler เตรียมการอย่างเต็มที่และทำให้ชุดข้อมูลการฝึกแบบตารางทั้งหมดพร้อมใช้งานใน Amazon S3 ต่อไป SageMaker Canvas จะจัดการกับขั้นตอนการสร้างโมเดลของวงจรการใช้งาน ML Canvas เริ่มต้นด้วยการเปิดชุดการฝึก S3 ความสามารถในการเข้าใจแบบจำลองมักเป็นข้อกำหนดหลักของลูกค้า โดยไม่ต้องเขียนโค้ด และภายในไม่กี่คลิก SageMaker Canvas จะให้ผลตอบรับที่เป็นภาพที่สมบูรณ์เกี่ยวกับประสิทธิภาพของโมเดล ดังที่เห็นในภาพหน้าจอในส่วนต่อไปนี้ SageMaker Canvas จะแสดงให้เห็นว่าฟีเจอร์เดียวแจ้งโมเดลอย่างไร
โมเดลที่ได้รับการฝึกด้วยข้อมูลแบบตารางต้นฉบับและฟีเจอร์ที่ได้มาจากรูปภาพอสังหาริมทรัพย์
จากภาพหน้าจอต่อไปนี้เราจะเห็นได้ว่าฟีเจอร์ที่พัฒนาจากรูปภาพของทรัพย์สินมีความสำคัญ จากผลลัพธ์เหล่านี้ คำถาม "ห้องครัวนี้แพงไหม" จากรูปภาพมีความสำคัญมากกว่า "จำนวนห้องนอน" ในชุดตารางดั้งเดิม โดยมีค่าความสำคัญของคุณลักษณะอยู่ที่ 7.08 และ 5.498 ตามลำดับ
ภาพหน้าจอต่อไปนี้ให้ข้อมูลที่สำคัญเกี่ยวกับแบบจำลอง ขั้นแรก กราฟที่เหลือจะแสดงจุดส่วนใหญ่ในกลุ่มชุดที่อยู่รอบๆ โซนสีเทาสีม่วง ในที่นี้ ค่าผิดปกติสองตัวได้รับการใส่คำอธิบายประกอบด้วยตนเองภายนอก SageMaker Canvas สำหรับภาพประกอบนี้ ค่าผิดปกติเหล่านี้แสดงถึงช่องว่างที่สำคัญระหว่างมูลค่าบ้านที่แท้จริงและมูลค่าที่คาดการณ์ไว้ นอกจากนี้ ร2 ค่าซึ่งมีช่วงที่เป็นไปได้ 0–100% จะแสดงที่ 76% สิ่งนี้บ่งชี้ว่าแบบจำลองนั้นไม่สมบูรณ์และไม่มีจุดข้อมูลเพียงพอที่จะพิจารณาความหลากหลายทั้งหมดเพื่อประเมินมูลค่าบ้านได้อย่างสมบูรณ์
เราสามารถใช้ค่าผิดปกติเพื่อค้นหาและเสนอสัญญาณเพิ่มเติมเพื่อสร้างแบบจำลองที่ครอบคลุมมากขึ้น ตัวอย่างเช่น คุณสมบัติที่ผิดปกติเหล่านี้อาจรวมถึงสระว่ายน้ำหรือตั้งอยู่บนที่ดินขนาดใหญ่ ชุดข้อมูลไม่มีคุณลักษณะเหล่านี้ อย่างไรก็ตาม คุณอาจสามารถค้นหาข้อมูลนี้และฝึกโมเดลใหม่โดยมี "มีสระว่ายน้ำ" รวมอยู่ด้วยเป็นคุณสมบัติเพิ่มเติม ตามหลักการแล้ว ในความพยายามครั้งต่อไปของคุณ R2 ค่าจะเพิ่มขึ้นและค่า MAE และ RMSE จะลดลง
โมเดลที่ผ่านการฝึกอบรมโดยไม่มีฟีเจอร์ที่ได้มาจากรูปภาพอสังหาริมทรัพย์
สุดท้าย ก่อนที่จะไปยังส่วนถัดไป เรามาสำรวจว่าฟีเจอร์จากรูปภาพมีประโยชน์หรือไม่ ภาพหน้าจอต่อไปนี้แสดงโมเดลที่ได้รับการฝึก SageMaker Canvas อีกโมเดลหนึ่งโดยไม่มีฟีเจอร์จากโมเดล VQA เราเห็นว่าอัตราข้อผิดพลาดของแบบจำลองเพิ่มขึ้น จาก RMSE ที่ 282K เป็น RMSE ที่ 352K จากนี้ เราสามารถสรุปได้ว่าคำถามง่ายๆ สามข้อจากรูปภาพช่วยเพิ่มความแม่นยำของแบบจำลองได้ประมาณ 20% ไม่แสดงแต่ให้สมบูรณ์อาร์2 ค่าสำหรับรุ่นต่อไปนี้ก็เสื่อมลงเช่นกัน โดยลดลงเหลือค่า 62% จากค่า 76% ด้วยฟีเจอร์ VQA ที่มีให้ นี่คือตัวอย่างวิธีที่ SageMaker Canvas ทำให้การทดลองอย่างรวดเร็วและใช้วิธีการที่ขับเคลื่อนด้วยข้อมูลซึ่งสร้างแบบจำลองที่ตอบสนองความต้องการทางธุรกิจของคุณได้อย่างรวดเร็ว
มองไปข้างหน้า
องค์กรหลายแห่งเริ่มให้ความสนใจแบบจำลองพื้นฐานมากขึ้น โดยเฉพาะอย่างยิ่งเมื่อหม้อแปลงไฟฟ้าที่ได้รับการฝึกอบรมล่วงหน้าทั่วไป (GPT) กลายเป็นหัวข้อหลักที่น่าสนใจอย่างเป็นทางการในเดือนธันวาคม 2022 ความสนใจส่วนใหญ่ในแบบจำลองพื้นฐานนั้นมีศูนย์กลางอยู่ที่งานแบบจำลองภาษาขนาดใหญ่ (LLM) ; อย่างไรก็ตาม ยังมีกรณีการใช้งานอื่นๆ ที่หลากหลาย เช่น คอมพิวเตอร์วิทัศน์ และงาน VQA เฉพาะทางที่อธิบายไว้ที่นี่
โพสต์นี้เป็นตัวอย่างในการสร้างแรงบันดาลใจในการใช้ข้อมูลหลายรูปแบบเพื่อแก้ไขกรณีการใช้งานในอุตสาหกรรม แม้ว่าเราจะสาธิตการใช้งานและประโยชน์ของ VQA ในแบบจำลองการถดถอย แต่ยังสามารถใช้เพื่อติดป้ายกำกับและแท็กรูปภาพสำหรับการค้นหาในภายหลังหรือการกำหนดเส้นทางเวิร์กโฟลว์ธุรกิจ ลองนึกภาพความสามารถในการค้นหาอสังหาริมทรัพย์ที่ลงรายการขายหรือเช่า สมมติว่าคุณต้องการหาที่พักที่มีพื้นกระเบื้องหรือเคาน์เตอร์หินอ่อน วันนี้ คุณอาจต้องรับรายการคุณสมบัติของผู้สมัครจำนวนมากและกรองตัวเองตามที่เห็นเมื่อคุณเรียกดูผู้สมัครแต่ละคน ลองจินตนาการถึงความสามารถในการกรองรายการที่มีคุณสมบัติเหล่านี้แทน แม้ว่าบุคคลจะไม่ได้แท็กรายการเหล่านั้นอย่างชัดเจนก็ตาม ในอุตสาหกรรมประกันภัย ลองจินตนาการถึงความสามารถในการประเมินค่าเสียหายจากการเรียกร้อง หรือกำหนดเส้นทางการดำเนินการถัดไปในขั้นตอนการทำงานทางธุรกิจจากรูปภาพ ในแพลตฟอร์มโซเชียลมีเดีย รูปภาพสามารถติดแท็กอัตโนมัติเพื่อใช้ในภายหลัง
สรุป
โพสต์นี้สาธิตวิธีใช้คอมพิวเตอร์วิทัศน์ที่เปิดใช้งานโดยโมเดลพื้นฐาน เพื่อปรับปรุงกรณีการใช้งาน ML แบบคลาสสิกโดยใช้แพลตฟอร์ม SageMaker ตามส่วนหนึ่งของโซลูชันที่เสนอ เราพบโมเดล VQA ยอดนิยมที่มีอยู่ในการลงทะเบียนโมเดลสาธารณะ และปรับใช้โดยใช้ตำแหน่งข้อมูล SageMaker สำหรับการอนุมานแบบเรียลไทม์
ต่อไป เราใช้ SageMaker Data Wrangler เพื่อเรียบเรียงขั้นตอนการทำงานที่มีการถามคำถามแบบเดียวกันเกี่ยวกับรูปภาพ เพื่อสร้างชุดข้อมูลแบบตารางที่หลากหลาย สุดท้าย เราใช้ SageMaker Canvas เพื่อฝึกแบบจำลองการถดถอย สิ่งสำคัญที่ควรทราบคือชุดข้อมูลตัวอย่างนั้นเรียบง่ายมาก ดังนั้นจึงไม่สมบูรณ์จากการออกแบบ ถึงกระนั้น SageMaker Canvas ก็ทำให้ง่ายต่อการเข้าใจความแม่นยำของโมเดล และค้นหาสัญญาณเพิ่มเติมเพื่อปรับปรุงความแม่นยำของโมเดลพื้นฐาน
เราหวังว่าโพสต์นี้จะสนับสนุนให้คุณใช้ข้อมูลต่อเนื่องหลายรูปแบบที่องค์กรของคุณอาจมี นอกจากนี้ เราหวังว่าโพสต์นี้จะเป็นแรงบันดาลใจให้คุณพิจารณาการฝึกโมเดลเป็นกระบวนการทำซ้ำ โมเดลที่ยอดเยี่ยมสามารถทำได้ด้วยความอดทน โมเดลที่ใกล้จะสมบูรณ์แบบอาจจะดีเกินจริง อาจเป็นผลมาจากการรั่วไหลของเป้าหมายหรือการติดตั้งมากเกินไป สถานการณ์ในอุดมคติจะเริ่มต้นด้วยแบบจำลองที่ดีแต่ไม่สมบูรณ์แบบ เมื่อใช้ข้อผิดพลาด การสูญเสีย และแผนคงเหลือ คุณสามารถรับสัญญาณข้อมูลเพิ่มเติมเพื่อเพิ่มความแม่นยำจากการประมาณค่าพื้นฐานเริ่มต้นของคุณได้
AWS นำเสนอชุดบริการ ML ที่กว้างและลึกที่สุดและรองรับโครงสร้างพื้นฐานระบบคลาวด์ โดยให้ ML อยู่ในมือของนักพัฒนา นักวิทยาศาสตร์ข้อมูล และผู้ปฏิบัติงานที่เชี่ยวชาญทุกคน หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับแพลตฟอร์ม SageMaker รวมถึง SageMaker Data Wrangler และ SageMaker Canvas โปรดติดต่อทีมบัญชี AWS ของคุณและเริ่มการสนทนา นอกจากนี้ ลองอ่านเพิ่มเติมเกี่ยวกับ SageMaker Data Wrangler แปลงร่างเอง.
อ้างอิง
อาเหม็ด, EH, & Moustafa, M. (2016) การประมาณราคาบ้านจากลักษณะภาพและข้อความ IJCCI 2016-การประชุมร่วมระหว่างประเทศด้านความฉลาดทางคอมพิวเตอร์ครั้งที่ 8, 3, 62–68
แฮร์ริสัน จูเนียร์ ดี. และรูบินเฟลด์ ดี.ล. (1978) ราคาที่อยู่อาศัยแบบ Hedonic และความต้องการอากาศบริสุทธิ์ วารสารเศรษฐศาสตร์สิ่งแวดล้อมและการจัดการ, 5(1) 81-102
Kim, W., Son, B. & Kim, I.. (2021) ViLT: การเปลี่ยนแปลงวิสัยทัศน์และภาษาโดยไม่มีการควบแน่นหรือการกำกับดูแลภูมิภาค การดำเนินการของการประชุมนานาชาติเรื่องการเรียนรู้ของเครื่องครั้งที่ 38 ในการดำเนินการวิจัยการเรียนรู้ของเครื่อง 139:5583-5594.
เกี่ยวกับผู้เขียน
ชาร์ลส์ ลาฟลิน เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญ AI/ML หลักและทำงานในทีมบริการ Amazon SageMaker ที่ AWS เขาช่วยกำหนดแผนงานบริการและทำงานร่วมกันทุกวันกับลูกค้า AWS ที่หลากหลาย เพื่อช่วยเปลี่ยนแปลงธุรกิจโดยใช้เทคโนโลยี AWS ที่ล้ำสมัยและความเป็นผู้นำทางความคิด Charles สำเร็จการศึกษาระดับปริญญาโทสาขาการจัดการห่วงโซ่อุปทานและปริญญาเอก ในสาขาวิทยาศาสตร์ข้อมูล
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/use-foundation-models-to-improve-model-accuracy-with-amazon-sagemaker/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 08
- 1
- 100
- 2016
- 2021
- 2022
- 32
- 49
- 50
- 50 ปี
- 7
- 8
- 8th
- a
- ความสามารถ
- สามารถ
- เกี่ยวกับเรา
- อุดมสมบูรณ์
- เข้า
- ลงชื่อเข้าใช้
- ความถูกต้อง
- ประสบความสำเร็จ
- การปฏิบัติ
- เพิ่มเติม
- นอกจากนี้
- ที่อยู่
- หลังจาก
- อาเหม็ด
- AI
- AI / ML
- AIR
- ทั้งหมด
- อนุญาต
- เกือบจะ
- คู่ขนาน
- ด้วย
- แม้ว่า
- อเมซอน
- อเมซอน SageMaker
- Amazon Web Services
- amp
- an
- และ
- อื่น
- คำตอบ
- คำตอบ
- ใด
- API
- ปรากฏ
- การใช้งาน
- ใช้
- เข้าใกล้
- สถาปัตยกรรม
- เป็น
- รอบ
- แถว
- เทียม
- ปัญญาประดิษฐ์
- ปัญญาประดิษฐ์ (AI)
- AS
- ถาม
- ขอให้
- ประเมินผล
- สินทรัพย์
- At
- ความพยายาม
- เสียง
- อัตโนมัติ
- ใช้ได้
- AWS
- ตาม
- baseline
- BE
- กลายเป็น
- กลายเป็น
- สมควร
- รับ
- ก่อน
- เริ่ม
- กำลัง
- ประโยชน์
- ระหว่าง
- เกิน
- ร่างกาย
- บอสตัน
- ทั้งสอง
- สร้าง
- การก่อสร้าง
- built-in
- ภาระ
- ธุรกิจ
- ธุรกิจ
- แต่
- by
- โทรศัพท์
- CAN
- ผู้สมัคร
- ผ้าใบ
- ความสามารถในการ
- ความสามารถ
- สามารถ
- กรณี
- กรณี
- เพดาน
- ศูนย์กลาง
- ศูนย์
- โซ่
- เปลี่ยนแปลง
- ลักษณะ
- Charles
- Choose
- ข้อเรียกร้อง
- คลาสสิก
- การจัดหมวดหมู่
- ปลาเดยส์
- เมฆ
- โครงสร้างพื้นฐานคลาวด์
- การจัดกลุ่ม
- รหัส
- รหัส
- ร่วมมือ
- สี
- รวม
- อย่างไร
- สมบูรณ์
- ครอบคลุม
- การคำนวณ
- คอมพิวเตอร์
- วิสัยทัศน์คอมพิวเตอร์
- แนวคิด
- สรุป
- การประชุม
- พิจารณา
- การพิจารณา
- บรรจุ
- ภาชนะ
- มี
- ต่อเนื่องกัน
- สัญญา
- การสนทนา
- แปลง
- ประสานงาน
- แก้ไข
- ตรงกัน
- ได้
- เครดิต
- อยากรู้อยากเห็น
- ประเพณี
- ลูกค้า
- ลูกค้า
- ตัดขอบ
- ประจำวัน
- ข้อมูล
- การเตรียมข้อมูล
- วิทยาศาสตร์ข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- ชุดข้อมูล
- โครงสร้างข้อมูล
- ที่ขับเคลื่อนด้วยข้อมูล
- ธันวาคม
- การตัดสินใจ
- ลดลง
- ที่ลึกที่สุด
- ส่งมอบ
- ความต้องการ
- สาธิต
- แสดงให้เห็นถึง
- แสดงให้เห็นถึง
- ปรับใช้
- นำไปใช้
- การใช้งาน
- ที่ได้มา
- บรรยาย
- อธิบาย
- ออกแบบ
- ได้รับการออกแบบ
- แน่นอน
- พัฒนา
- ผู้พัฒนา
- ดิจิตอล
- มิติ
- สนทนา
- กล่าวถึง
- หลาย
- do
- ทำ
- ไม่
- ดาวน์โหลด
- หลายสิบ
- ลดลง
- e
- แต่ละ
- ง่าย
- เศรษฐศาสตร์
- ทำให้สามารถ
- เปิดการใช้งาน
- สนับสนุนให้
- ปลายทาง
- ชั้นเยี่ยม
- ที่เพิ่มขึ้น
- พอ
- ทั้งหมด
- สิ่งแวดล้อม
- ความผิดพลาด
- ข้อผิดพลาด
- โดยเฉพาะอย่างยิ่ง
- ประมาณการ
- ฯลฯ
- แม้
- ทุกๆ
- ตัวอย่าง
- ตัวอย่าง
- ที่คาดหวัง
- แพง
- การทดลอง
- ชำนาญ
- อย่างชัดเจน
- สำรวจ
- สารสกัด
- ใบหน้า
- ลักษณะ
- คุณสมบัติ
- ข้อเสนอแนะ
- ฟุต
- สองสาม
- รูป
- กรอง
- ในที่สุด
- หา
- ชื่อจริง
- ชั้น
- โฟกัส
- ปฏิบัติตาม
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- ฟอร์ม
- พบ
- รากฐาน
- สี่
- ราคาเริ่มต้นที่
- เต็มรูปแบบ
- อย่างเต็มที่
- ฟังก์ชัน
- ฟังก์ชั่น
- พื้นฐาน
- ได้รับ
- ช่องว่าง
- General
- สร้าง
- ได้รับ
- เป้าหมาย
- ดี
- กราฟ
- ยิ่งใหญ่
- แหวกแนว
- คำแนะนำ
- มือ
- มี
- he
- ช่วย
- เป็นประโยชน์
- จะช่วยให้
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- ซ่อนเร้น
- เน้น
- ถือ
- หน้าแรก
- บ้าน
- ความหวัง
- เป็นเจ้าภาพ
- บ้าน
- การเคหะ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- ที่ http
- HTTPS
- ร้อย
- i
- ความคิด
- ในอุดมคติ
- ความนึกคิด
- เอกลักษณ์
- if
- แสดงให้เห็นถึง
- ภาพ
- ภาพ
- ภาพ
- นำเข้า
- ความสำคัญ
- สำคัญ
- ปรับปรุง
- การปรับปรุง
- in
- ประกอบด้วย
- รวม
- รวมทั้ง
- ผสมผสาน
- เพิ่ม
- เพิ่มขึ้น
- ขึ้น
- อิสระ
- บ่งชี้ว่า
- อุตสาหกรรม
- มีอิทธิพล
- แจ้ง
- ข้อมูล
- โครงสร้างพื้นฐาน
- แรกเริ่ม
- อินพุต
- ข้อมูลเชิงลึก
- สร้างแรงบันดาลใจ
- แรงบันดาลใจ
- แทน
- ประกัน
- Intelligence
- โต้ตอบ
- ปฏิสัมพันธ์
- อยากเรียนรู้
- สนใจ
- International
- เข้าไป
- IT
- ITS
- การสัมภาษณ์
- ร่วมกัน
- jpg
- JSON
- คีย์
- คิม
- ความรู้
- ที่รู้จักกัน
- ฉลาก
- ที่ดิน
- ภาษา
- ใหญ่
- ต่อมา
- นำ
- ความเป็นผู้นำ
- เรียนรู้
- การเรียนรู้
- วงจรชีวิต
- รายการ
- จดทะเบียน
- รายชื่อ
- น้อย
- LLM
- ที่ตั้งอยู่
- ที่ตั้ง
- ล็อค
- นาน
- การสูญเสีย
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- หลัก
- ทำ
- ทำให้
- การจัดการ
- ด้วยมือ
- หลาย
- ที่ตรงกัน
- อาจ..
- มีความหมาย
- วิธี
- ภาพบรรยากาศ
- วิธี
- มิดเวย์
- อาจ
- ใจ
- นาที
- หายไป
- ผสม
- ML
- แบบ
- โมเดล
- ทันสมัย
- ข้อมูลเพิ่มเติม
- มากที่สุด
- การเคลื่อนไหว
- การย้าย
- ต้อง
- โดยธรรมชาติ
- จำเป็นต้อง
- จำเป็น
- ใหม่
- คุณสมบัติใหม่
- ถัดไป
- ไม่
- ปม
- สมุดบันทึก
- จำนวน
- มากมาย
- ได้รับ
- ที่เกิดขึ้น
- of
- เสนอ
- อย่างเป็นทางการ
- มักจะ
- on
- เพียง
- โอเพนซอร์ส
- การเปิด
- or
- ใบสั่ง
- organizacja
- องค์กร
- เป็นต้นฉบับ
- แต่เดิม
- อื่นๆ
- ของเรา
- ออก
- ค่าผิดปกติ
- เอาท์พุต
- ด้านนอก
- ของตนเอง
- กระดาษ
- ส่วนหนึ่ง
- ที่ผ่านไป
- ความอดทน
- รูปแบบ
- ต่อ
- สมบูรณ์
- การปฏิบัติ
- บางที
- สิทธิ์
- คน
- ระยะ
- ภาพถ่าย
- ภาพถ่าย
- ภาพ
- ภาพ
- ท่อ
- ที่ราบ
- เวที
- แพลตฟอร์ม
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- กรุณา
- จุด
- จุด
- สระ
- ยอดนิยม
- ส่วน
- มี
- เป็นไปได้
- โพสต์
- ที่คาดการณ์
- เบื้องต้น
- การจัดเตรียม
- เตรียมการ
- เตรียม
- เตรียมความพร้อม
- ก่อนหน้านี้
- ราคา
- ราคา
- หลัก
- กิจการ
- กระบวนการ
- การประมวลผล
- ผลิต
- มืออาชีพ
- คุณสมบัติ
- คุณสมบัติ
- เสนอ
- เสนอ
- ให้
- ให้
- ผู้จัดหา
- ผู้ให้บริการ
- ให้
- การให้
- สาธารณะ
- การตีพิมพ์
- วาง
- คุณภาพ
- คำถาม
- คำถาม
- อย่างรวดเร็ว
- R
- พิสัย
- คะแนน
- ดิบ
- มาถึง
- อ่าน
- การอ่าน
- พร้อม
- เรียลไทม์
- รับ
- บันทึก
- ลด
- การอ้างอิง
- หมายถึง
- ภูมิภาค
- รีจิสทรี
- เสริมสร้าง
- ญาติ
- ตรงประเด็น
- ให้เช่า
- กรุ
- แสดง
- ขอ
- ความต้องการ
- ต้อง
- การวิจัย
- Reshape
- การอยู่อาศัย
- แหล่งข้อมูล
- ตามลำดับ
- คำตอบ
- การตอบสนอง
- ผล
- ส่งผลให้
- ผลสอบ
- กลับ
- ทบทวน
- รวย
- ที่ดียิ่งขึ้น
- แผนงาน
- เส้นทาง
- การกำหนดเส้นทาง
- วิ่ง
- รันไทม์
- s
- sagemaker
- การขาย
- เดียวกัน
- ตัวอย่างชุดข้อมูล
- สถานการณ์
- ฉาก
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- สกอตต์
- ต้นฉบับ
- ค้นหา
- ที่สอง
- Section
- ความปลอดภัย
- เห็น
- แสวงหา
- เห็น
- เลือก
- การส่ง
- ให้บริการ
- ให้บริการ
- บริการ
- บริการ
- ชุด
- หลาย
- รูปร่าง
- โชว์
- แสดง
- แสดงให้เห็นว่า
- สายตา
- สัญญาณ
- สำคัญ
- คล้ายคลึงกัน
- เหมือนกับ
- ง่าย
- ลดความซับซ้อน
- ตั้งแต่
- เดียว
- ขนาด
- So
- สังคม
- โซเชียลมีเดีย
- แพลตฟอร์มสื่อสังคม
- ทางออก
- แก้
- บาง
- บางครั้ง
- เป็น
- แหล่ง
- แหล่งที่มา
- ช่องว่าง
- ผู้เชี่ยวชาญ
- เฉพาะ
- เฉพาะ
- สี่เหลี่ยม
- เริ่มต้น
- ยังคง
- การเก็บรักษา
- เก็บไว้
- ซื่อตรง
- โครงสร้าง
- โครงสร้าง
- นักเรียน
- ภายหลัง
- อย่างเช่น
- แนะนำ
- การดูแล
- จัดหาอุปกรณ์
- ห่วงโซ่อุปทาน
- การจัดการห่วงโซ่อุปทาน
- ที่สนับสนุน
- แน่ใจ
- ตาราง
- TAG
- เอา
- ใช้เวลา
- เป้า
- งาน
- งาน
- การเรียนการสอน
- ทีม
- เทคโนโลยี
- เทคโนโลยี
- ระยะ
- ทดสอบ
- เกี่ยวกับใจความ
- กว่า
- ที่
- พื้นที่
- ที่มา
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ดังนั้น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- สิ่ง
- นี้
- เหล่านั้น
- คิดว่า
- ความเป็นผู้นำทางความคิด
- พัน
- พัน
- สาม
- ตลอด
- เวลา
- ไปยัง
- ในวันนี้
- วันนี้
- เกินไป
- เครื่องมือ
- หัวข้อ
- ตามธรรมเนียม
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- แปลง
- การแปลง
- การแปลง
- หม้อแปลงไฟฟ้า
- หม้อแปลง
- จริง
- ที่เชื่อถือ
- สอง
- ชนิด
- ชนิด
- ในที่สุด
- เข้าใจ
- ความเข้าใจ
- เป็นเอกลักษณ์
- Unsplash
- ใช้
- ใช้กรณี
- มือสอง
- ใช้
- การใช้
- การใช้ประโยชน์
- การประเมินค่า
- ความคุ้มค่า
- มูลค่าเพิ่ม
- ความคุ้มค่า
- ตัวแปร
- ความหลากหลาย
- มาก
- วีดีโอ
- รายละเอียด
- มองเห็นได้
- วิสัยทัศน์
- ภาพ
- W
- ต้องการ
- คือ
- we
- เว็บ
- บริการเว็บ
- สัปดาห์ที่ผ่านมา
- ดี
- คือ
- อะไร
- ความหมายของ
- ที่
- WHO
- จะ
- หน้าต่าง
- กับ
- ภายใน
- ไม่มี
- ไม้
- งาน
- เวิร์กโฟลว์
- โรงงาน
- โลก
- คุ้มค่า
- จะ
- การเขียน
- ปี
- อัตราผลตอบแทน
- คุณ
- ของคุณ
- ด้วยตัวคุณเอง
- YouTube
- ลมทะเล
- เป็นศูนย์
- รหัสไปรษณีย์