數(shù)據(jù)清洗平臺(DCP)
改進決策、縮減成本、降低風(fēng)險
企業(yè)歷史數(shù)據(jù)的清洗工作是數(shù)據(jù)標(biāo)準(zhǔn)化過程中的必經(jīng)階段,通過對企業(yè)存儲在各業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)依據(jù)制定的數(shù)據(jù)標(biāo)準(zhǔn)進行清洗梳理,構(gòu)建高質(zhì)量企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)庫。數(shù)據(jù)標(biāo)準(zhǔn)化的工作是一項非項目型的企業(yè)建設(shè)工作,需建立常態(tài)的數(shù)據(jù)標(biāo)準(zhǔn)化管理模式,因此企業(yè)需要充分認識到數(shù)據(jù)清洗工作是確保企業(yè)高質(zhì)量數(shù)據(jù)標(biāo)準(zhǔn)庫的重要舉措,并要認識到數(shù)據(jù)治理工作的復(fù)雜性、專業(yè)性、技術(shù)性、長期性、持久性。
數(shù)據(jù)治理工作對于確保數(shù)據(jù)的準(zhǔn)確、適度分享和保護是至關(guān)重要的。有效的數(shù)據(jù)治理計劃會通過改進決策、縮減成本、降低風(fēng)險和提高安全合規(guī)等方式,將價值回饋于業(yè)務(wù),并最終體現(xiàn)為增加收入和利潤。
數(shù)據(jù)清洗平臺(Data Cleaning Platform,DCP)是三維天地信息標(biāo)準(zhǔn)化管理一體化平臺解決方案(6P+2E+Mobile)中的核心標(biāo)準(zhǔn)組件。數(shù)據(jù)清洗平臺可建立基于多對多關(guān)系數(shù)據(jù)模式的開放式數(shù)據(jù)清理功能,支持對原始數(shù)據(jù)的抽取、分詞、語義識別、清洗與整合構(gòu)建不同主題模型的主數(shù)據(jù)信息庫,通過人工干預(yù)與確認,采用系統(tǒng)自動掃描清洗與人工干預(yù)相結(jié)合的模式進行數(shù)據(jù)清洗。平臺界面操作友好,使企業(yè)管理人員可以快速上手,控制已有數(shù)據(jù)的抽取、清理和重整,包括映射關(guān)系的轉(zhuǎn)換和對照關(guān)系的存儲,可實現(xiàn)高效率人工干預(yù)與數(shù)據(jù)確認,極大地提升了企業(yè)進行數(shù)據(jù)清洗的系統(tǒng)化和智能化支持,降低了數(shù)據(jù)清洗的操作復(fù)雜性,提升了數(shù)據(jù)質(zhì)量。