准确的数据是任何成功进行计算机软件投资的动力。对于企业而言,至关重要的是要有战略性的方法来确保其数据质量,知道如何清除数据以及如何保持数据清洁。在过程中开始的一个好地方是设定一些有关支持正在进行的功能操作的特定目标。其中应包括:
改进数据管理流程,例如减少处理季度更新和报告所需的时间等。
确保符合法规标准和要求
将源系统清理并将其合并到一个主文件中
等等。
接下来,当您准备制定有条理的策略时,应考虑几个因素。
1.上下文
清除的数据类型是什么,其用途是什么?预先定义数据将帮助您最好地确定如何使用数据以及如何保持数据清洁。这样的示例包括:客户信息;财务数据; 供应链数据;和更多。确定上下文后,可以将其与适当类型的清洗方法进行匹配,以确保一致性和准确性。
2.存储将
存储视为数据质量因素可确保将物理存储介质包含在总体数据质量策略中。例如,如果数据驻留在企业应用程序中,则应用程序的类型(CRM,ERP等)将决定数据的连接选项。数据和数据质量功能之间的连接选项通常分为三类:
数据提取。
从主机系统复制数据时,会发生这种情况。然后通常以批处理的方式对其进行清理,然后将其重新装入主机。
嵌入式过程
这与提取相反。在这种方法中,数据质量功能被嵌入到主机系统中。自定义编码的存储过程编程调用将调用数据质量功能。当策略要求最大程度的自定义和最紧密地集成到操作环境中时,将使用此功能。
集成功能。
这位于数据提取和嵌入式过程之间。通过使用供应商提供的专用链接,数据质量功能被集成到企业信息系统中。链接可以实现无缝操作的快速标准集成,并且可以以事务或批处理模式运行。
3.数据流
这是数据的移动,它如何进入和在组织中移动。映射数据流将提供暂存区域,这些暂存区域将描述移动数据目标的“冻结帧”。这将指示在何处操纵数据,以及数据的使用情况是否会更改上下文。
这很重要,因为它描述了对数据的访问选项并在网络环境中对位置进行了分类。数据流回答了这个问题。“在操作限制内,清理数据的机会是什么?”通常,机会属于以下类别:
交易更新
业务提要
购买数据
旧版迁移
定期保养
4.工作
流程工作流程是完成给定操作所需的物理任务序列。在此类别中,数据质量操作通常属于以下领域:
前台交易–实时清理
后台交易–分阶段清理
后台-批量清洗
跨办公室企业-应用程序清理
持续监测和报告
如果数据接触点没有受到验证功能的保护,则会根据接触点的性质捕获,创建或传播缺陷数据。工作流因素中的一项重要操作是列出各种接触点,以识别有缺陷的数据可能泄漏到您的信息流中的位置。
5.管理
数据本身除了与人们交流信息外没有任何价值。管理数据流程的人是数据管理员。在评估新项目的数据管理因素时,需要执行以下任务:
回答以下问题:
谁是数据的利益相关者?
谁是主要的用户组,可以确定每个用户组的代表吗?
谁负责创建,捕获,维护,报告,分发和删除数据?
与利益相关者认真组织需求收集会议。告诉这些代表任何可以共享的计划,以确保他们还没有最终决定,并收集意见。
一旦准备了一套准最终要求和一个初步的项目计划,就让利益相关者重新了解该计划,但是可以接受变更。
计划提供有关任何新流程,数据模型更改和更新的数据定义的培训。
考虑新流程或更改的数据集对组织结构的影响。
通常,数据质量项目专注于现有系统,而当前的人员报告结构可以吸收新流程或模型更改。
6.持续监控
创建定期验证数据的过程很重要。如果不确定应多久分析一次数据,请考虑以下事项:
您的数据多久使用一次?(每小时,每天,每周,每月等)
使用数据的操作有多重要?(关键任务,依赖生命,日常操作,月末报告等)
监控需要多少费用?监控技术越好,人工成本就越低。
监视数据会对操作产生什么影响?需要考虑两个方面:实时操作期间评估操作数据的影响,以及流程对人员的影响。
最终,您应该:
确定要收集的度量和指标
确定何时何地进行监视
实施监控流程
运行基线评估
发布监控报告
安排定期的数据管理员小组会议以审查监视趋势
总体而言,至关重要的是,您不仅要将时间和资源集中在计算机硬件,网络和企业软件解决方案上,而且还应将精力和资源集中在计算机上。以及支持这些投资以推动业务发展的数据。仅当数据准确时,您的数据才对您有所帮助,并且遵循上述六种方法将帮助您保持正确的轨道。