目录
产品简介
云搜索服务 ESCloud 是火山引擎提供的完全托管在线分布式搜索服务,兼容 Elasticsearch、Kibana 等软件及常用开源插件。可以提供结构化、非结构化文本的多条件检索、统计、报表,帮助实现一键部署、弹性扩缩、简化运维,快速构建日志分析、信息检索分析等实际业务。
火山引擎云原生全托管在线分布式搜索服务基于 Serverless 和容器化能力部署,支持一键开通、弹性扩缩、简化运维。新版本支持 k-NN,提供向量搜索和向量存储能力。未来可与火山引擎 流式计算 Flink、云原生消息引擎、大数据文件存储产品深度集成,提供端到端的 Serverless 大数据计算及存储解决方案。
产品功能
-
限流插件
QoS限流插件支持配置集群索引级别的读写限流,提高实例的稳定性。 -
多元检索
通过KNN提供向量搜索和向量数据库能力,支持全文搜索、向量搜索、混合搜索、时空检索等多元检索方式,应用于LLM问答、以图/以文搜图等场景。 -
索引压缩
通过ZSTD压缩文档数据。在没有对写入性能造成太大影响的条件下,可降低30%索引存储空间,显著降低存储的成本。 -
数据导入
混合云Hyperoader生成索引并存储HDFS后导入集群;写入模式不占用ESCloud集群计算资源且速度更快,适用于千万/亿级别以上的数据导入场景。
产品优势
-
易迁移,易部署——一键部署
兼容开源ES
可在分钟级完成创建,易于部署
免去软硬件部署调试过程 -
基于云原生架构——云原生
实例支持弹性伸缩
支持跨云、多云部署
多层次安全保障措施 -
高级特性,丰富生态——丰富特性
与其他云原生大数据组件联动
提高运维管理和操作的效率
支持多样生态 -
多策略保障数据安全——高安全性
具备保障实例安全的特性
提供HTTPS的访问协议
提供多租户能力,确保资源安全性
应用场景
-
日志检索分析
云搜索服务提供分布式高可用的存储能力和全文检索能力,满足日志分析场景下的高并发大数据量写入和快速检索日志的需求。 -
基础搜索
云搜索服务通过全文检索和分词能力,使用匹配度打分、查询权重等策略,提供底层的基础搜索能力,用于各种搜索中台/推荐服务。 -
数据分析
云搜索服务利用其分布式数据处理分析能力,更好地适配实时多维分析在线查询服务场景,满足高实时性,高查询QPS,低查询延迟的数据分析要求。
应用场景
-
金融
客户现有的搜索服务产品存在多个版本,无法统一管理。且集群资源分散,索引生成效率低。云搜索服务提供了多集群、多租户的统一管理能力;使用大数据平台的计算引擎资源构建搜索服务索引,提升集群资源利用效率。 -
大消费
某头部餐饮企业的ELK日志系统搭建。基于Flink+云搜索服务搭建,通过Flink替代Logstash实现数据的可靠生成和存储,收集各项日志的统一分析,实现问题快速定位和实时监控的效果。 -
教育
通过倒排索引实现高效检索,利用分词器和词典对文本化教育数据(包括题库、试题等)进行分词,并将其存入索引中。查询关键词时,进行分词匹配,根据匹配得分作为默认排序字段,返回匹配的数据。
某教育客户基于云搜索服务云原生版构建文本搜索服务,通过全文检索和模糊查询,为广大用户提升学习资料的检索效率,提高学习效果。
- 数字人
基于云搜索服务上线直播问答知识检索系统,完成向量搜索系统构建。相比于其他开源向量数据库,ESCloud可以实现向量搜索能力和全文检索结合,能够支持更多的搜索语句,打分更精确,其分布式管理能力也更完善。
所属公司
北京火山引擎科技有限公司。火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、数据库、大数据、人工智能等产品,帮助企业构建体验创新、数据驱动和敏捷迭代等数字化能力,实现业务可持续增长。
相关资料
火山引擎官网:https://www.volcengine.com/product/es
产品文档:https://www.volcengine.com/docs/6465/
《火山引擎云搜索服务升级云原生新架构,提供数十亿级分布式向量数据库能力》