实体化视图模式
产生过在一个或多个数据存储中的数据预填充的观点时,数据被格式化以不利于所需的查询操作的一种方式。这种模式可以帮助支持高效的查询和提取数据,并提高应用程序的性能。
背景和问题
何时存储数据时,优先级为开发者和数据管理员经常集中在如何将数据存储,而不是它是如何读出。所选择的存储格式通常是密切相关的数据,用于管理数据的大小和数据的完整性,并且在使用的那种存储的要求的格式。例如,使用的 NoSQL 文献商店时,该数据通常被表示为一系列的聚集体,其每一个包含了所有的信息,该实体。
然而,这可能对查询产生负面影响。当查询需要从一些实体,如订单的几个客户没有所有的顺序的信息的汇总的数据的一个子集,它必须提取所有的相关实体的数据,以获得所需的信息。
解决方案
以支持高效的查询,一个常见的解决方案是生成,预先,即物化数据中最适合于所要求的结果集的格式的图。其中源数据不是一个格式适合于查询,在那里产生一个合适的查询中的实体化视图模式描述产生数据的预先填充的观点在环境中是困难的,或者其中的查询性能差,由于该数据或该性质数据存储区。
这些实例化视图,其中只包含一个查询所需的数据,以便应用程序能够快速获得他们需要的信息。除了连接表或组合的数据实体,物化视图可以包括计算列或数据项的指定作为查询的一部分的当前值,组合值或对数据项执行的转换的结果,和值。物化视图甚至可以就某一个单一的查询优化。
关键的一点是,一个实体化视图,它包含的数据完全是一次性的,因为它可以完全从源数据存储重建。实例化视图是不能直接更新的应用程序,因此它实际上是一个专门的缓存。
何时该视图更改源数据,视图必须被更新以包括新的信息。这可以在适当的日程自动发生,或在系统检测到变化到原始数据的时候。在其他情况下,可能需要手动重新生成视图。
图1示出如何实体化视图图案可能被使用的例子。
图1 - 实体化视图模式
问题和注意事项
在决定如何实现这个模式时,请考虑以下几点:
- 考虑如何以及何时该视图将被更新。理想的情况下,将被再生响应于一个事件,指示改变到所述源数据,尽管在某些情况下,这可能导致过度的开销,如果源数据发生急剧的变化。或者,考虑使用计划任务,外部触发或手动操作来启动该视图的再生。
- 在某些系统中,使用事件采购图案保持仅修改的数据的事件存储区时,例如,实体化视图可能是必要的。通过检查所有事件,以确定当前状态预先填充的观点可以得到从事件存储信息的唯一方式。在使用事件采购时比其它情况下,有必要测量的优点是物化视图可以提供。物化视图往往是专门针对一个或少数的查询。如果许多查询必须被使用,维护实例化视图可能会导致不可接受的存储容量的要求和存储成本。
- 生成的视图时,和更新视图时,如果这发生在一个日程表考虑数据一致性的影响。如果源数据发生了变化时,生成的视图时的点,在该视图中的数据的复制可能会与原来的数据完全一致。
- 考虑在那里你将存储的视图。认为不必位于同一商店或分区的原始数据。它可能是从几个不同的分区合并的一个子集。
- 如果视图是短暂的,仅仅是用来通过反映该数据的当前状态来提高查询性能,或提高扩展性,它可被存储在高速缓存中或者在一个较不可靠的位置。它可以的,如果失去了重建。
- 当定义一个实体化视图中,在数据项或列的基础上计算的或现有的数据项的转换的视图,在查询传递的值,或者对这些值,其中,这是适当的组合发挥其最大价值。
- 凡存储机制支持它,考虑索引实体化视图,以进一步提高性能。大多数关系型数据库支持索引的意见,因为这样做是基于Apache Hadoop的大数据解决方案。
何时使用这个模式
这种模式非常适合于:
- 创建实例化视图以上数据是难以直接查询,或者查询必须以提取存储在归一化,半结构化或非结构化的方式数据非常复杂。
- 创建临时视图,可以显着提高查询性能,或可直接充当UI源视图或数据传输对象(DTO 的),进行报告,或进行显示。
- 支持偶尔连接或断开连接的情况,其中连接到数据存储并不总是可用的。该视图可能在这种情况下被本地缓存。
- 简化查询和在不需要源数据格式的知识的方式曝光数据用于实验。例如,通过在一个或多个数据库,或在 NoSQL 的存储的一个或多个结构域结合不同的表,然后格式化的数据,以满足它的最终用途。
- 提供访问源数据的特定子集,出于安全或隐私原因,不应该是一般访问,公开进行修改,或者完全暴露给用户。
- 使用基于他们的个人能力不同的数据存储在弥合脱节。例如,通过使用云存储中是有效率的用于写入作为基准数据存储,并能提供良好的查询和读取性能保持实例化视图的关系数据库。
这种模式可能不适合于下列情况:
- 源数据简单,便于查询。
- 源数据非常迅速的变化,或者可以在不使用视图来访问。中创建视图处理开销可能会避免在这些情况下。
- 一致性是一个高优先级。的意见可能并不总是与原始数据完全一致。
例子
图2示出了使用实体化视图模式的一个例子。在订单,订单项数据,并在微软的Azure存储帐户单独的分区表的客户相结合,生成包含在电子类别中的每个产品销售总额的视图,客户是谁的采购数量的计数在一起每个项目。
图2 - 使用实体化视图模式产生销售的总结
创建这个实例化视图需要复杂的查询。然而,通过将查询结果作为实体化视图,用户可以轻松获得的结果和直接使用它们,或将其纳入另一个查询。观点很可能在一个报告系统或仪表板中使用,所以可以更新计划的基础上,如每周一次。
注意: 虽然这个例子使用的 Azure 表存储,许多关系数据库管理系统还提供了实例化视图的原生支持。