Якість даних – переломний момент (Парваті Менон)

Якість даних – переломний момент (Парваті Менон)

Якість даних – Переломний момент (Parvathy Menon) PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

«Дані — це дорогоцінна річ, і вони триватимуть довше, ніж самі системи». Так сказано

Тім Бернерс-Лі
, винахідник Всесвітньої павутини. «Дорогоцінні» за умови, що дані справді заслуговують на довіру та мають гарантовану та постійну якість. І клієнти беззаперечно визнали той факт, що якість даних справді є основою всіх їхніх ініціатив з управління даними та Analytics

Але чому тоді весь цей фурор навколо якості даних і слід навколо цього. . Що найчастіше бентежить клієнтів, так це величність контрольних точок на кожному етапі життєвого циклу даних. Завдяки низці рішень для керування даними, які клієнти мають у своїй системі, а саме: Сховища даних, вітринзи даних, рішення для управління основними даними, озера даних тощо, схоже, існує певний рівень невизначеності та скепсису щодо підходу до якості даних.

І якщо поглянути на простір життєвого циклу даних, проблеми з якістю можуть потенційно виникати на кожному етапі, починаючи від джерела до ETL або будь-яких перетворень проміжного програмного забезпечення до консолідованих сховищ даних і озер даних у світі й до нарешті він ловить кінцевого користувача чи клієнта в певній формі аналітики звітів, екрані користувача тощо, і це бум!!!!

Отже, серед різноманіття даних і систем, які існують на підприємствах, чи існує жорстке правило щодо того, що, де і як боротися з демоном якості даних. Ну, дуже багато в нашому списку бажань. але тоді, якби побажання були конями... Єдиною метою програми якості даних має бути забезпечення того, щоб священні дані були доступні для всіх відповідних бізнес-процесів, незалежно від того, внутрішні чи зовнішні споживачі.

Нижче наведено список основних вказівок, які можуть допомогти керувати баченням якості даних вашої організації:

Розташуйте дані за категоріями та пріоритетами:

Серед різних типів доступних даних, а саме. Основні дані, транзакційні/операційні дані, довідкові дані, аналітичні дані, може виникнути нагальна потреба очистити дані в межах операційних або аналітичних систем, оскільки це найближче місце, де користувачі отримують доступ/використовують свої дані, але називати це Короткострокове рішення було б недооцінкою, тому що врешті-решт ми маємо справу з проблемою, коли вона виникає, а не розглядаємо її суть. Натомість краще розглянути категорію даних, які дійсно використовуються в усьому підприємстві, і це не що інше, як основні бізнес-об’єкти клієнта, продукту, постачальника, працівника, активів, місця розташування тощо. Таким чином очищення, збагачення Процеси зіставлення та виживання, застосовані до основних даних, можна використовувати для створення найкращої версії основного запису й таким чином забезпечити єдине, уніфіковане та послідовне уявлення про ваші ключові бізнес-об’єкти.

 Застосуйте перевірки на ранніх етапах життєвого циклу:

Очистіть дані якомога ближче до джерела, і тепер це фундаментальна найкраща практика, і, звичайно, випадок сміття всередину та викид сміття. Завжди краще вирішувати проблеми якості даних якомога ближче до джерела або, якщо на те пішло, на саме джерело, оскільки це може заощадити вам багато зусиль і коштів. І як би ви не намагалися очистити та стандартизувати дані у своїх вихідних системах, ви б краще поставили перевірки перед входом, щоб уникнути необхідності очищення постфактум

 Різні проблеми Різні затримки:

Певні критичні процеси в організації можуть вимагати перевірок якості даних у режимі реального часу, які є неминучими, щоб запобігти будь-яким шахрайським або подвійним діям. Наприклад, будь-яка банківська операція. На відміну від процесу, що має менший вплив на бізнес. В обох випадках, як би ви не застосовували принципи управління якістю даних, потрібно розпізнавати нагальні потреби порівняно з іншими та відповідним чином підходити до завдання

Включення бізнесу на кожному етапі:

Участь бізнес-стейкхолдерів під час подорожі до якості даних не може бути особливо підкреслена. З самого початку DQ подорожі або оцінки якості до очищення та видалення дублікатів даних очікується дуже високий рівень участі з боку бізнесу. І, зрозуміло, бізнес-зобов’язання та спонсорство програми якості даних вказують на ймовірність її успіху

 Встановіть замкнутий цикл процесу відновлення:

Ця безперервна безперервна діяльність з оцінки, очищення, організації гарантує, що дані придатні для цілей і використання в будь-який час, а не проведення одноразової діяльності або у відповідь на повідомлення про помилку чи ескалацію

 Використовуйте Agile Sprints:

Комбінацію Agile і DQ можна назвати небесним матчем. Застосування гнучкого підходу до вашої програми якості даних може значно зменшити затримку, яка виникає через затримку відгуків від зацікавлених сторін. Гнучкий підхід у DQ допомагає пришвидшити весь процес, оскільки бізнес-стейкхолдери можуть виконувати роль менеджера продукту, і, крім того, оскільки спринт буде зосереджений на певній бізнес-сфері, це забезпечує швидший аналіз і, отже, швидші результати (прочитайте значення в Agile)

 Використовуйте набори інструментів:

Отримання величезних обсягів даних із різнорідних систем і спроба проаналізувати дані, щоб розблокувати їхню справжню цінність, може виявитися досить складним завданням для аналітиків, оскільки процес не лише громіздкий вручну, але й неефективний у часі та схильний до помилок. З великою кількістю наборів інструментів, доступних для профілювання та очищення даних, суперечок щодо даних, компаніям вкрай необхідно інвестувати в правильний інструмент, який дозволить компаніям справді надавати цінну інформацію в найоптимальніший спосіб

 

Постійне зосередження на якості даних варте кожного пенні інвестицій, оскільки це не тільки допоможе вселити впевненість бізнесу в дані, але й допоможе отримати переваги всіх інших існуючих корпоративних рішень 

Часова мітка:

Більше від Фінтекстра