Elasticsearch Refresh vs Flush

发表于 2021-01-23 更新于 2026-07-07 分类于 Elasticsearch 阅读次数：本文字数： 1.5k 阅读时长 ≈ 1 分钟

详解Elasticsearch中Refresh和Flush两个操作的区别，包括触发时机、作用范围和对搜索可见性的影响。

图片来自https://lakshyabansal.hashnode.dev/write-operation-in-elasticsearch

Refresh

使用refresh API显式刷新一个或多个索引。如果请求以数据流为目标，则刷新该流的后台索引。刷新使自上次刷新以来对索引执行的所有操作都可用于搜索。

默认情况下，Elasticsearch会定期每秒刷新一次索引，但仅在最近30秒内收到搜索请求的索引上刷新。也可以使用index.refresh_interval设置更改此默认间隔。

刷新请求是同步的，并且在刷新操作完成之前不会返回响应。

举例

比如设置索引的refresh_interval为-1，这时候会导致/_search?track_total_hits=true返回的数据总条数不准，比如数据在一直写入但查询返回的总条数一直不变。

Flush

通过刷新data stream或者index将当前仅存储在事务日志中的数据永久存储到Lucene索引中。当Elasticsearch重启时，会重放事务日志中未刷新到Lucene索引的数据，从而将Elasticsearch恢复到重启前的状态。

默认情况下，Elasticsearch使用内存启发式，以便根据需要自动触发刷新操作，以便清除内存。
Elasticsearch automatically triggers flushes as needed, using heuristics that trade off the size of the unflushed transaction log against the cost of performing each flush.

一旦一个操作被刷新，它就会永久存储在Lucene索引中。这意味着不需要在事务日志中维护它的额外副本，除非出于某些其他原因而保留它。事务日志由多个文件组成，称为generations，一旦不再需要生成文件，Elasticsearch将删除它们，释放磁盘空间。

使用flush API也可以在一个或多个索引上触发刷新，尽管用户很少需要直接调用这个API。如果在对一些文档建立索引之后调用flush API，那么成功的响应表明Elasticsearch已经flush了所有在调用flush API之前建立索引的文档。

translog的Flush是Elasticsearch在后台自动运行的。默认情况下Elasticsearch每隔5s会去检测要不要Flush translog，默认条件是:每30分钟主动进行一次Flush或者当translog文件大小大于512MB主动进行一次Flush。默认配置下，每次index、bulk、delete、update完成的时候，会触发Flush translog到磁盘上,然后才返回200 OK。这个提高了数据安全性，但是会对写入的性能造成不小的影响。

在写入效率优先的情况下，可以在index template里设置如下参数：

1 2	"index.translog.durability":"async"(默认是request) "index.translog.sync_interval":30s (默认是5s)

小结

简而言之，_refresh用于使新文档在搜索时可见。
反过来，_flush用于在硬盘上持久化内存段。
_flush不会影响Elasticsearch中文档的可见性，因为搜索是在内存段中进行的，而_refresh会影响它们的可见性。