데이터 품질 – 티핑 포인트(Parvathy Menon)

데이터 품질 – 티핑 포인트(Parvathy Menon)

데이터 품질 – 전환점(Parvathy Menon) PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

"데이터는 소중한 것이며 시스템 자체보다 오래 지속됩니다." 그래서 말했다

팀 버너스 - 리
, 월드 와이드 웹의 발명가. '소중한' 데이터는 실제로 신뢰할 수 있고 확실하고 일관된 품질을 제공합니다. 그리고 고객은 데이터 품질이 실제로 모든 데이터 관리 및 분석 기반 이니셔티브의 기초를 형성한다는 사실을 인정했습니다.

그런데 왜 데이터 품질에 대한 모든 소동과 그에 대한 사업의 흔적이 있습니다. . 고객을 가장 당황하게 하는 것은 데이터 수명 주기의 각 단계에서 체크포인트가 엄청나게 많다는 것입니다. 고객의 시스템 환경 즉, 다양한 데이터 관리 솔루션을 통해. 데이터 웨어하우스, 데이터 마트, 마스터 데이터 관리 솔루션, 데이터 레이크 등 데이터 품질에 대한 접근 방식에 어느 정도 불확실성과 회의론이 있는 것으로 보입니다.

그리고 데이터 수명 주기의 범위를 살펴보면 소스에서 ETL에 이르기까지 또는 모든 미들웨어 변환에서 통합 데이터 웨어하우스 및 전 세계의 데이터 레이크에 이르기까지 모든 시점에서 품질 문제가 잠재적으로 발생할 수 있습니다. 그것은 최종 사용자 또는 고객을 어떤 형태의 보고 분석, 사용자 화면 등 및 그 카붐으로 포착합니다!!!!

따라서 기업 내에 존재하는 다양한 데이터 및 시스템 중에서 데이터 품질 문제를 어디서 어떻게 해결해야 하는지에 대한 엄격하고 빠른 규칙이 있습니다. 대부분의 위시리스트에 있습니다. 데이터 품질 프로그램의 유일한 목적은 내부 또는 외부 소비자인 모든 적용 가능한 비즈니스 프로세스에서 신성불가침한 데이터를 사용할 수 있도록 하는 것입니다.

다음은 조직의 데이터 품질 비전을 조정하는 데 도움이 되는 주요 지침 목록입니다.

데이터 분류 및 우선 순위 지정:

사용 가능한 다양한 유형의 데이터 즉. 마스터 데이터, 트랜잭션/운영 데이터, 참조 데이터, 분석 데이터, 사용자가 데이터에 액세스/사용하는 가장 가까운 운영 또는 분석 시스템의 범위 내에서 데이터를 정리해야 한다는 절박한 충동이 있을 수 있지만 이를 짧은 범위의 솔루션은 삼가면서 말하는 것입니다. 결국 사람은 문제가 발생하는 대로 처리하고 문제의 핵심을 실제로 해결하지 않기 때문입니다. 오히려 더 나은 의미는 실제로 전사적으로 사용되고 고객, 제품, 공급업체, 직원, 자산 및 위치 등의 마스터 비즈니스 엔터티가 아닌 데이터 범주를 살펴보는 것입니다. 따라서 정리, 강화 마스터 데이터에 적용된 일치 및 생존 프로세스를 사용하여 마스터 레코드의 최상의 버전을 생성할 수 있으므로 주요 비즈니스 엔터티에 대한 단일하고 통합되고 일관된 보기를 제공할 수 있습니다.

 수명 주기 초기에 검사를 적용합니다.

가능한 한 소스에 가까운 데이터를 정리합니다. 이것이 기본적인 모범 사례이며 물론 가비지 인 및 가비지 아웃의 경우입니다. 소스에 가까운 데이터 품질 문제를 해결하는 것이 항상 더 나은 전략입니다. 많은 노력과 비용을 절약할 수 있기 때문입니다. 그리고 소스 시스템의 데이터를 정리하고 표준화하려고 시도할 수 있는 만큼 사후 정리의 필요성을 피하기 위해 입력하기 전에 확인하는 것이 좋습니다.

 다른 문제 다른 대기 시간:

조직의 특정 중요 프로세스에는 사기 또는 이중 활동을 방지하기 위해 불가피한 실시간 데이터 품질 검사가 필요할 수 있습니다. 모든 은행 거래를 예로 들 수 있습니다. 덜 비즈니스에 영향을 미치는 프로세스와 반대입니다. 두 경우 모두 데이터 품질 관리 원칙을 적용하는 만큼 레코딩 요구 사항과 다른 요구 사항을 인식하고 그에 따라 작업에 접근해야 합니다.

모든 단계에서 비즈니스 포함:

데이터 품질 여정 동안 비즈니스 이해 관계자의 참여는 더 이상 강조할 수 없습니다. 품질 평가라고 하는 DQ 여정의 시작부터 데이터 정리 및 중복 제거에 이르기까지 비즈니스 측면에서 기대되는 매우 높은 수준의 참여가 있습니다. 말할 필요도 없이 데이터 품질 프로그램에 대한 기업의 약속과 후원이 성공 가능성을 말해줍니다.

 폐쇄 루프 수정 프로세스를 설정합니다.

이 지속적으로 진행되는 평가, 정리, 구성 활동은 데이터가 일회성 활동을 수행하거나 오류 보고 또는 에스컬레이션에 대한 보복이 아니라 항상 목적과 사용에 적합하도록 합니다.

 애자일 스프린트 채택:

애자일과 DQ의 조합은 천생연분이라고 할 수 있습니다. 데이터 품질 프로그램에서 민첩한 접근 방식을 채택하면 이해 관계자의 지연된 피드백으로 인해 발생하는 대기 시간을 크게 줄이는 데 도움이 될 수 있습니다. DQ의 민첩한 접근 방식은 비즈니스 이해 관계자가 제품 관리자의 역할을 수행할 수 있기 때문에 전체 프로세스를 가속화하는 데 도움이 되며, 추가로 스프린트가 특정 비즈니스 영역에 집중되므로 더 빠른 분석과 더 빠른 결과를 얻을 수 있습니다(애자일의 가치 읽기).

 도구 세트 활용:

서로 다른 시스템에서 방대한 양의 데이터를 캡처하고 진정한 가치를 찾기 위해 데이터를 분석하려고 시도하는 것은 분석가에게 상당히 어려운 작업임을 증명할 수 있습니다. 프로세스가 수동으로 번거로울 뿐만 아니라 시간이 비효율적이고 오류가 발생하기 쉽기 때문입니다. 데이터 프로파일링 및 정리, 데이터 랭글링에 사용할 수 있는 도구 세트가 많기 때문에 기업이 올바른 종류의 도구에 투자하여 기업이 가장 최적의 방식으로 가치 있는 통찰력을 제공할 수 있도록 하는 것이 필수적입니다.

 

데이터 품질에 지속적으로 집중하는 것은 데이터에 대한 비즈니스의 신뢰를 심어줄 뿐만 아니라 현재 사용 중인 다른 모든 엔터프라이즈 솔루션의 이점을 거두는 데 도움이 되기 때문에 아낌없이 투자할 가치가 있습니다. 

타임 스탬프 :

더보기 핀텍스라