คุณภาพของข้อมูล – จุดเปลี่ยน (Parvathy Menon)

คุณภาพของข้อมูล – จุดเปลี่ยน (Parvathy Menon)

คุณภาพข้อมูล – The Tipping Point (Parvathy Menon) PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

“ข้อมูลเป็นสิ่งที่มีค่าและจะอยู่ได้นานกว่าตัวระบบเอง” ดังนั้นกล่าวว่า

Tim Berners-Lee
ผู้ประดิษฐ์เวิลด์ไวด์เว็บ 'ล้ำค่า' หากข้อมูลนั้นน่าเชื่อถือและมีคุณภาพที่แน่นอนและสม่ำเสมอ และลูกค้ายอมรับอย่างปฏิเสธไม่ได้กับความจริงที่ว่าคุณภาพข้อมูลเป็นรากฐานของการจัดการข้อมูลทั้งหมดของพวกเขาและการริเริ่มที่ขับเคลื่อนด้วยการวิเคราะห์

แต่แล้วทำไมความเดือดดาลเกี่ยวกับคุณภาพของข้อมูลและเส้นทางของการดำเนินการรอบ ๆ . สิ่งที่ทำให้ลูกค้างุนงงบ่อยครั้งก็คือความใหญ่โตของจุดตรวจสอบในแต่ละขั้นตอนของวงจรชีวิตข้อมูล ด้วยโซลูชันการจัดการข้อมูลที่ลูกค้ามีอยู่ในระบบ ได้แก่ คลังข้อมูล, Data Mart, โซลูชันการจัดการข้อมูลหลัก, Data Lake และอื่นๆ ดูเหมือนจะมีความไม่แน่นอนและความสงสัยในระดับหนึ่งเกี่ยวกับแนวทางสำหรับคุณภาพข้อมูล

และถ้าใครดูที่การขยายตัวของวงจรชีวิตข้อมูล ปัญหาด้านคุณภาพอาจเกิดขึ้นได้ในทุกจุดเชื่อมต่อ ตั้งแต่ต้นทางไปจนถึง ETL หรือการแปลงมิดเดิลแวร์ไปยังคลังข้อมูลรวมและ Data Lake ของโลกและจนถึง ในที่สุดมันก็จับผู้ใช้ปลายทางหรือลูกค้าในรูปแบบของการวิเคราะห์การรายงานหน้าจอผู้ใช้ ฯลฯ และ kaboom!!!!

ดังนั้น ท่ามกลางความหลากหลายของข้อมูลและระบบที่มีอยู่ภายในองค์กร มีกฎเกณฑ์ที่ตายตัวและรวดเร็วหรือไม่ว่าจะจัดการกับปีศาจคุณภาพข้อมูลที่ไหนและอย่างไร ดีมากในรายการความปรารถนาส่วนใหญ่ของเรา แต่ถ้าความปรารถนาเป็นม้า …… จุดประสงค์เดียวของโปรแกรมคุณภาพข้อมูลควรเป็นเพื่อให้แน่ใจว่าข้อมูลศักดิ์สิทธิ์พร้อมใช้งานสำหรับกระบวนการทางธุรกิจที่เกี่ยวข้องทั้งหมด ไม่ว่าจะเป็นผู้บริโภคภายในหรือภายนอก

ต่อไปนี้เป็นรายการหลักเกณฑ์สำคัญที่สามารถช่วยกำหนดทิศทางวิสัยทัศน์ด้านคุณภาพข้อมูลขององค์กรของคุณ:

จัดหมวดหมู่และจัดลำดับความสำคัญของข้อมูลของคุณ:

ในบรรดาข้อมูลประเภทต่างๆ ที่มีอยู่ ได้แก่ ข้อมูลหลัก ข้อมูลธุรกรรม/การปฏิบัติงาน ข้อมูลอ้างอิง ข้อมูลการวิเคราะห์ อาจมีแรงกระตุ้นเร่งด่วนในการล้างข้อมูลภายในขอบเขตของระบบปฏิบัติการหรือระบบวิเคราะห์ เนื่องจากเป็นสิ่งที่ใกล้เคียงที่สุดที่ผู้ใช้เข้าถึง/ใช้ข้อมูลของตน แต่เรียกสิ่งนั้นว่า วิธีแก้ปัญหาระยะสั้นจะเป็นการพูดเกินจริง เพราะหลังจากทั้งหมดแล้ว เราแค่จัดการกับปัญหาเมื่อมันมาถึง และไม่ได้จัดการกับมันที่แก่นแท้ของปัญหา สิ่งที่สมเหตุสมผลกว่าคือการดูที่หมวดหมู่ของข้อมูลที่ใช้งานจริงทั่วทั้งองค์กร และนั่นจะไม่ใช่ใครอื่นนอกจากเอนทิตีธุรกิจหลักของลูกค้า ผลิตภัณฑ์ ผู้ขาย พนักงาน สินทรัพย์ และสถานที่ เป็นต้น ดังนั้น การทำความสะอาด การเพิ่มคุณค่า กระบวนการจับคู่และ Survivorship ที่ใช้กับข้อมูลหลักสามารถใช้เพื่อสร้างบันทึกหลักเวอร์ชันที่ดีที่สุด และด้วยเหตุนี้จึงให้มุมมองที่เป็นหนึ่งเดียว เป็นเอกภาพและสอดคล้องกันของหน่วยงานธุรกิจหลักของคุณ

 ใช้การตรวจสอบในช่วงต้นของวงจรชีวิต:

ล้างข้อมูลให้ใกล้กับแหล่งที่มามากที่สุด และตอนนี้เป็นแนวทางปฏิบัติที่ดีที่สุดขั้นพื้นฐาน และแน่นอนว่าเป็นกรณีของขยะเข้าและขยะออก กลยุทธ์ที่ดีกว่าเสมอคือการจัดการปัญหาคุณภาพข้อมูลให้ใกล้เคียงกับแหล่งที่มาหรือสำหรับเรื่องนั้นที่ แหล่งที่มาเองเนื่องจากสามารถช่วยคุณประหยัดความพยายามและค่าใช้จ่ายได้มาก และเท่าที่คุณสามารถพยายามชำระล้างและสร้างมาตรฐานให้กับข้อมูลในระบบต้นทางของคุณ คุณย่อมต้องการตรวจสอบก่อนเข้าใช้งานเพื่อหลีกเลี่ยงความจำเป็นในการชำระล้างในภายหลัง

 ปัญหาต่างๆ เวลาแฝงที่แตกต่างกัน:

กระบวนการที่สำคัญบางอย่างกับองค์กรอาจต้องการการตรวจสอบคุณภาพข้อมูลแบบเรียลไทม์ ซึ่งเป็นสิ่งที่หลีกเลี่ยงไม่ได้ เพื่อหลีกเลี่ยงกิจกรรมที่เป็นการฉ้อโกงหรือซ้ำซ้อน ตัวอย่างการทำธุรกรรมทางธนาคารใดๆ ตรงข้ามกับกระบวนการที่มีผลกระทบต่อธุรกิจน้อยกว่า ในทั้งสองกรณี เท่าที่คุณอาจใช้หลักการของการจัดการคุณภาพข้อมูล คุณจะต้องรับรู้ถึงความต้องการในการเผาไหม้เทียบกับความต้องการอื่นๆ และเข้าหางานตามนั้น

การรวมธุรกิจในทุกขั้นตอน:

การมีส่วนร่วมของผู้มีส่วนได้ส่วนเสียทางธุรกิจระหว่างการเดินทางของข้อมูลนั้นไม่สามารถเน้นย้ำได้มากกว่านี้ ตั้งแต่เริ่มต้นการเดินทางของ DQ หรือที่รู้จักในการประเมินคุณภาพไปจนถึงการล้างข้อมูลและขจัดข้อมูลซ้ำซ้อน คาดหวังการมีส่วนร่วมในระดับที่สูงมากจากฝั่งธุรกิจ และไม่จำเป็นต้องพูด ความมุ่งมั่นของธุรกิจและการสนับสนุนสำหรับโปรแกรมคุณภาพข้อมูลสะกดความน่าจะเป็นที่จะประสบความสำเร็จ

 สร้างกระบวนการแก้ไขวงปิด:

กิจกรรมต่อเนื่องอย่างต่อเนื่องของการประเมิน การชำระล้าง การจัดระเบียบจะช่วยให้มั่นใจได้ว่าข้อมูลนั้นเหมาะสมสำหรับวัตถุประสงค์และการใช้งานตลอดเวลา แทนที่จะดำเนินกิจกรรมเพียงครั้งเดียวหรือเพื่อตอบโต้การรายงานข้อผิดพลาดหรือการยกระดับ

 ใช้ Agile Sprints:

เราสามารถเรียกการผสมผสานของ Agile และ DQ ว่าการจับคู่ที่เกิดขึ้นในสวรรค์ การนำวิธีการที่คล่องตัวมาใช้ในโปรแกรมคุณภาพข้อมูลของคุณสามารถช่วยลดเวลาแฝงที่เกิดจากการตอบรับที่ล่าช้าจากผู้มีส่วนได้ส่วนเสียได้อย่างมาก แนวทางที่คล่องตัวใน DQ ช่วยเร่งกระบวนการทั้งหมด เนื่องจากผู้มีส่วนได้ส่วนเสียทางธุรกิจสามารถมีบทบาทเป็นผู้จัดการผลิตภัณฑ์ และนอกจากนี้ เนื่องจากการวิ่งจะเน้นไปที่พื้นที่ธุรกิจเฉพาะ จึงช่วยให้วิเคราะห์ได้เร็วขึ้นและส่งผลให้ได้ผลลัพธ์เร็วขึ้น (อ่านค่าใน Agile)

 ชุดเครื่องมือเลเวอเรจ:

การเก็บข้อมูลจำนวนมหาศาลจากระบบที่แตกต่างกันและพยายามวิเคราะห์ข้อมูลเพื่อปลดล็อกค่าที่แท้จริงของมัน สามารถพิสูจน์ได้ว่าเป็นงานที่ยากเย็นแสนเข็ญสำหรับนักวิเคราะห์ เนื่องจากกระบวนการนี้ไม่เพียงแต่ยุ่งยากด้วยตนเองเท่านั้น แต่ยังใช้เวลาที่ไม่มีประสิทธิภาพและเกิดข้อผิดพลาดได้ง่ายอีกด้วย ด้วยชุดเครื่องมือที่มีอยู่มากมายสำหรับการทำโปรไฟล์และการล้างข้อมูล การโต้แย้งข้อมูล จึงจำเป็นอย่างยิ่งที่ธุรกิจจะต้องลงทุนในประเภทของเครื่องมือที่เหมาะสม ซึ่งช่วยให้ธุรกิจสามารถส่งมอบข้อมูลเชิงลึกที่มีค่าอย่างแท้จริงในลักษณะที่เหมาะสมที่สุด

 

การมุ่งเน้นที่คุณภาพของข้อมูลอย่างต่อเนื่องนั้นคุ้มค่ากับการลงทุนทุกบาททุกสตางค์ เพราะไม่เพียงแต่จะช่วยสร้างความเชื่อมั่นให้กับธุรกิจในข้อมูลเท่านั้น แต่ยังช่วยเก็บเกี่ยวผลประโยชน์จากโซลูชันระดับองค์กรอื่นๆ ทั้งหมดที่มีอยู่ด้วย 

ประทับเวลา:

เพิ่มเติมจาก ฟินเท็กซ์ทรา