> ## Documentation Index > Fetch the complete documentation index at: https://private-7c7dfe99-mintlify-8c05c8a2.mintlify.site/llms.txt > Use this file to discover all available pages before exploring further. # ClickStack - materialized views > 使用 Materialized Views 对 ClickStack 进行性能调优 export const Image = ({img, alt, size}) => { return {alt}

; }; export const galaxyOnClick = eventName => () => { try { if (typeof window !== "undefined" && window.galaxy && eventName) { window.galaxy.track(eventName, { interaction: "click" }); } } catch (e) {} }; export const BetaBadge = ({link, galaxyTrack, galaxyEvent}) => { if (link) { return Beta ; } return

Beta 版功能。了解更多。

; };

## 简介

ClickStack 可以利用[增量materialized view (IMV)](/zh/concepts/features/materialized-views/incremental-materialized-view)来加速依赖重度聚合查询的可视化，例如计算随时间变化的每分钟平均请求耗时。该功能可显著提升查询性能，通常在规模较大的部署中收益最明显——大约从每日 10 TB 及以上开始——并支持进一步扩展到每日 PB 级别。增量materialized view 目前处于 Beta 阶段，应谨慎使用。告警也能从 materialized views 中受益，并会自动利用它们。这可以降低运行大量告警的计算开销，尤其是这类任务通常执行得非常频繁。缩短执行时间有助于提升响应速度并降低资源消耗。

## 什么是增量materialized view

增量materialized view 允许将计算成本从查询时转移到写入时，从而显著加快 `SELECT` 查询。与 Postgres 这类事务型数据库不同，ClickHouse 的 materialized view 并不是存储的快照。相反，它更像一个 trigger：当数据块写入源表时，它会对这些数据块执行查询。该查询的输出会写入一个单独的目标表。随着更多数据写入，新的部分结果会被追加并合并到目标表中。合并后的结果等同于对整个原始数据集执行 aggregation。使用 materialized view 的主要原因在于，写入目标表的数据代表的是 aggregation、过滤或转换的结果。在 ClickStack 中，它们仅用于 aggregations。这些结果通常远小于原始输入数据，而且往往表示部分 aggregation 状态。再加上查询预聚合目标表本身更简单，相比在查询时对原始数据执行相同计算，这能显著降低查询延迟。 ClickHouse 中的 materialized view 会随着数据流入源表而持续更新，行为更像始终保持最新的索引。这与许多其他数据库不同：在那些数据库中，materialized view 是静态快照，必须定期刷新，类似于 ClickHouse 的 [可刷新materialized view](/zh/concepts/features/materialized-views/refreshable-materialized-view)。 materialized view 示意图

增量materialized view 只会在新数据到达时计算视图的变更，将计算前移到写入时。由于 ClickHouse 对摄取进行了高度优化，因此，相比查询执行时获得的收益，为每个写入块维护视图所增加的成本很小。aggregation 的计算成本被分摊到多次写入中，而不是在每次读取时反复付出。因此，查询预聚合结果的代价远低于重新计算这些结果，即使在 PB 级规模下，也能为下游可视化带来更低的运营成本和接近实时的性能。这种模型与那些在每次更新时重新计算整个视图，或依赖定时刷新的系统有本质区别。若要更深入了解 materialized view 的工作原理以及如何创建它们，请参阅上方链接的指南。每个 materialized view 都会带来额外的写入时开销，因此应谨慎使用。仅为最常用的仪表盘和可视化创建视图。当该功能处于 Beta 阶段时，将使用量限制在少于 20 个视图。预计这一阈值会在未来版本中提高。单个 materialized view 可以针对不同分组计算多个指标，例如按 1 分钟桶统计每个服务名称的最小值、最大值和 p95 耗时。这样，一个视图就可以服务于多个可视化，而不只是一个。因此，将指标整合到共享视图中非常重要，这样才能最大化每个视图的价值，并确保它能在各个仪表盘和工作流中复用。继续之前，建议先更深入地了解 ClickHouse 中的 materialized view。更多细节请参阅我们的[增量materialized view](/zh/concepts/features/materialized-views/incremental-materialized-view)指南。

## 选择需要加速的可视化

在创建任何 materialized view 之前，务必先明确你希望加速哪些可视化，以及哪些工作流对用户最关键。在 ClickStack 中，materialized view 旨在**加速以聚合为主的可视化**，也就是那些按时间计算一个或多个指标的查询。例如，**每分钟平均请求耗时**、**每个服务的请求数**或**随时间变化的错误率**。materialized view 必须始终包含聚合以及基于时间的分组，因为它本就是为时序可视化服务的。通常，建议如下：

### 识别高价值可视化项

最值得加速的对象通常属于以下几类之一： * 刷新频繁且长期持续展示的仪表盘图表，例如显示在墙上大屏上的高层监控仪表盘。 * runbook 中使用的诊断工作流：在事件响应期间需要反复查看特定图表，并且要求快速返回结果。 * HyperDX 的核心体验，包括： * 搜索页面中的直方图视图。 * 预设仪表盘中使用的可视化项，例如 APM、Services 或 Kubernetes 视图。这些可视化项通常会在不同用户和时间范围下被反复执行，因此非常适合将计算从查询时转移到写入时。

### 权衡收益与写入时成本

materialized view 会在写入时增加额外负担，因此应有选择地谨慎创建。并非每个可视化都能从预聚合中受益，而为使用频率很低的图表提速，通常并不值得这部分开销。materialized view 的总数应控制在 20 个以内。在投入生产环境之前，务必验证 materialized view 带来的资源开销，尤其是 CPU 使用率、磁盘 I/O 和[合并活动](/zh/resources/support-center/tips-and-tricks/too-many-parts)。每个 materialized view 都会增加写入时的工作量，并产生额外的 parts，因此必须确保合并能够跟上，且 part 数量保持稳定。你可以通过开源 ClickHouse 中的[系统表](/zh/reference/system-tables/tables)和[内置可观测性仪表盘](/zh/guides/oss/deployment-and-scaling/monitoring/monitoring#built-in-advanced-observability-dashboard)进行监控，也可以使用内置指标以及 [ClickHouse Cloud 中的监控仪表盘](/zh/products/cloud/features/monitoring/advanced-dashboard)。有关如何诊断和缓解 part 数量过多的问题，请参见 [parts 过多](/zh/resources/support-center/knowledge-base/troubleshooting/exception-too-many-parts)。一旦你确定了最重要的可视化，下一步就是归并。

### 将可视化整合到共享视图中

ClickStack 中的所有 materialized view 都应使用诸如 [`toStartOfMinute`](/zh/reference/functions/regular-functions/date-time-functions#toStartOfMinute) 之类的函数，按时间间隔对数据进行分组。不过，许多可视化还会共用额外的分组键，例如服务名称、span 名称或状态码。当多个可视化使用相同的分组维度时，通常可以由同一个 materialized view 提供支持。例如 (对于链路追踪) ： * 按服务名称统计随时间变化的平均耗时 - `SELECT avg(Duration), toStartOfMinute(Timestamp) as time, ServiceName FROM otel_traces GROUP BY ServiceName, time` * 按服务名称统计随时间变化的请求数 - `SELECT count() count, toStartOfMinute(Timestamp) as time, ServiceName FROM otel_traces GROUP BY ServiceName, time` * 按状态码统计随时间变化的平均耗时 - `SELECT avg(Duration), toStartOfMinute(Timestamp) as time, StatusCode FROM otel_traces GROUP BY StatusCode, time` * 按状态码统计随时间变化的请求数 - `SELECT count() count, toStartOfMinute(Timestamp) as time, StatusCode FROM otel_traces GROUP BY StatusCode, time` 与其为每个查询和图表分别创建独立的 materialized view，不如将它们合并为一个按服务名称和状态码聚合的视图。这个视图可以计算多个指标，例如计数、平均耗时、最大耗时以及百分位数，随后复用于多个可视化。下面展示了一个将上述内容合并后的查询示例： ```sql theme={null} SELECT avg(Duration), max(Duration), count(), quantiles(0.95,0.99)(Duration), toStartOfMinute(Timestamp) as time, ServiceName, StatusCode FROM otel_traces GROUP BY time, ServiceName, StatusCode ``` 以这种方式整合视图，可以减少插入时的开销，控制 materialized view 的总数量，减少 parts 数量相关问题，并简化后续维护。在这个阶段，**重点关注**你想要加速的可视化所发起的查询。下一节将通过一个示例说明，如何将多个聚合查询合并为一个 materialized view。

## 创建 materialized view

确定要加速的一个或一组可视化后，下一步就是找出其底层查询。实际操作中，这意味着检查可视化配置并审查生成的 SQL，重点关注所用的聚合指标和应用的函数。

如果 HyperDX 中某个组件没有调试面板，用户可以查看浏览器控制台，其中会记录所有查询。梳理出所需查询后，你应该先熟悉 ClickHouse 中的 [**聚合状态函数**](/zh/reference/data-types/aggregatefunction)。materialized view 依赖这些函数将计算从查询时转移到写入时。materialized view 不会存储最终聚合值，而是计算并存储**中间聚合状态**，然后在查询时再对其进行合并并完成最终聚合。与原始表相比，这些状态通常会小得多。这些状态有对应的专用数据类型，必须在目标表的 schema 中显式定义。作为参考，ClickHouse 文档中提供了聚合状态函数的详细概述和示例，以及用于存储这些状态的表引擎 `AggregatingMergeTree`： * [聚合函数与状态](/zh/reference/functions/aggregate-functions/index) * [AggregatingMergeTree 引擎](/zh/reference/engines/table-engines/mergetree-family/aggregatingmergetree) 你可以在下面的视频中查看如何使用 AggregatingMergeTree 和聚合函数的示例：