数据仓库教程
数据仓库是一个用于集成来自多个来源的数据的存储库,可用于报告和分析。然后,该存储库将成为商业智能的来源。
DWH的输入是从企业的不同系统中提取的,这些系统可以包括当前或历史数据。DWH的主要目标是,能够处理批量数据,建立跨系统的关系,并使用最终产品进行分析和维护;报告目的。
通常,从输入源收集数据,进行清理以避免冗余和不准确的垃圾数据,分阶段、集成并加载到数据库中,其中数据库可以根据给定数据的类别组包含不同的模式。Schema是一种模型或特定格式,适用于DWH中的所有数据,而不考虑其源格式。
为什么我们需要学习DWH
数据仓库在商业智能中起着至关重要的作用。使用DWH,业务决策者可以从任何给定的角度创建分析或报告。DWH帮助他们整合从多个来源收集的大量数据。业务人员可以从DWH获取所有必需的信息,以生成必需的统计数据或报告。
DWH使其在时间消耗方面变得简单,因为所有数据都位于一个位置,而不是多个源。由于所有数据都转换为一个模式,因此DWH具有定义良好且准确的数据,冗余最少或为零。不断需要做出商业决策的商业专业人士不必再费心研究和收集信息。数据仓库可以用作一站式解决方案。
DWH的应用
数据仓库可以在任何需要进行频繁决策的领域实施,以实现业务的持续增长。
以下是可以实施DWH的几个领域:
1.任何以员工为主要资源的行业,如——
a.警察部门——每个地区的警察、担任特定角色的警察、成功完成任务的警察、在给定时间内完成的案件数量等信息,可用于生成关于特定特定特定部门记录的报告。
b.软件行业员工出勤率、薪酬、获奖情况、前几年的绩效等信息可用于决定员工当前的绩效
2.银行业务——DWH在银行业有多种应用,包括客户服务、客户交易、银行通信系统、银行员工等细分领域。
3.零售——在零售行业,客户关系管理、销售、服务等可以完美地进行,因为DWH将数据准确性作为其关键功能。
范例
让我们考虑一个例子:
一家名为“Complete Foods”的食品生产公司需要查看当前财年的销售业绩统计数据。“Complete Foods”拥有的数据仓库可用于提取有关销售区域、门店、利润/损失、客户的所有销售记录
反馈、员工记录,以及包装食品、新鲜农产品、家禽、乳制品等不同部门的个人销售流程。,
先决条件
对于任何能够实施DWH的人,以下是基本要求:
1.数据仓库流程知识
2.数据处理经验
3.熟练使用pl/SQL、mySQL、T-SQL等查询语言。,
4.项目堆栈持有人的书面要求。
5.其他资源,如对来自所有必需来源的数据的访问权限、所有必需的硬件和软件设置等。
目标受众
具有数据处理经验的软件工程师,以及数据仓库或一般数据科学方面的额外知识。