暂无图片
elasticsearch中有什么语句是删除重复数据只保留一条?
我来答
分享
暂无图片 匿名用户
elasticsearch中有什么语句是删除重复数据只保留一条?

elasticsearch中有什么语句是删除重复数据只保留一条?

我来答
添加附件
收藏
分享
问题补充
1条回答
默认
最新
shunwahⓂ️

使用 Logstash 对 Elasticsearch 文档进行重复数据删除
这种方法已经在之前的文章 “Logstash:处理重复的文档” 已经描述过了。Logstash 可用于检测和删除 Elasticsearch 索引中的重复文档。 在那个文章中,我们已经对这个方法进行了详述,也做了展示。我们也无妨做一个更进一步的描述。

在下面的示例中,我编写了一个简单的 Logstash 配置,该配置从 Elasticsearch 集群上的索引读取文档,然后使用指纹过滤器根据 [“CAC”, “FTSE”, “SMI”] 字段的哈希值为每个文档计算唯一的 _id 值,最后将每个文档写回到同一 Elasticsearch 集群上的新索引,这样重复的文档将被写入相同的 _id 并因此被消除。

此外,通过少量修改,相同的 Logstash 过滤器也可以应用于写入新创建的索引的将来文档,以确保几乎实时删除重复项。这可以通过更改以下示例中的输入部分以接受来自实时输入源的文档,而不是从现有索引中提取文档来实现。

来源 Elastic 中国社区官方博客https://blog.csdn.net/UbuntuTouch/article/details/106643400

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
elasticsearch 集群怎么备份?
回答 3
Elasticsearch:索引备份及恢复索引或者集群状态进行备份和恢复。在我之前的文章“Elasticsearch:Cluster备份Snapshot及RestoreAPI”,我详细地描述如何使用E
怎么查询elasticsearch操作的历史记录?
回答 1
可以通过,kibana查看操作记录,控制台维护Elasticsearch成功执行的最后500个请求列表。点击窗口右上角的时钟图标即可查看历史记录。这个图标会打开历史记录面板,您可以在其中查看历史请求。
elasticsearch 自动停了是什么原因?
回答 2
自动停的,这个描述太笼统了,没有任何可分析的对象。
Elasticsearch filebeat 怎么配置告警?
回答 1
可以配置filebeat/inputs.d/.ymlfilebeat/modules.d/.yml这两个文件实现告警
elasticsearch 的查询json有字数限制吗?
回答 1
官方文档https://www.elastic.co/guide/en/elasticsearch/reference/current/indexmodules.html解决方案PUT/account
Elasticsearch 索引名称可以按照时间范围搜吗?
回答 1
可以
logstash 每秒都会同步 sql能查询出数据 但是就是不往elasticsearch插入?
回答 2
手工给es写几条看看能不能写入?是不是配置错了,看看报错日志。
elasticsearch 怎么设置http basic,用的啥插件?
回答 1
已采纳
httpbasic插件是对elasticsearch的http请求做验证的,所有不在白名单的客户机发起的http请求操作都需要用户名密码认证。如下配置:vi elasticsearch.ym
elastic要怎么通过对字段的值进行截取来分组?
回答 1
已采纳
https://blog.csdn.net/lw250397846/article/details/103384345?spm1001.2101.3001.6661.1&utmmediumdi
elasticsearch没有快照 index删除 ,还有可能还原吗?
回答 1
基本没有可能了