暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
D
DataSense
编辑
简介:DataSense是南京云创大数据科技股份有限公司自主研发的分布式数据挖掘平台。具有高处理性能和高可靠性,可不间断接受任务。系统实现了大多数主流的数据挖掘功能,包括属性选择、分类预测、回归预测、聚类分析、关联分析、时间序列分析等6大类。
简介:DataSense是南京云创大数据科技股份有限公司自主研发的分布式数据挖掘平台。具有高处理性能和高可靠性,可不间断接受任务。系统实现了大多数主流的数据挖掘功能,包括属性选择、分类预测、回归预测、聚类分析、关联分析、时间序列分析等6大类。
产品概览 用户评价

目录

产品简介

DataSense是南京云创大数据科技股份有限公司自主研发的分布式数据挖掘平台。具有高处理性能和高可靠性,可不间断接受任务。系统实现了大多数主流的数据挖掘功能,包括属性选择、分类预测、回归预测、聚类分析、关联分析、时间序列分析等6大类。为适应不同业务数据的特点,对同一个数据挖掘功能,通过多种算法进行实现,例如“分类预测”有决策树、分类回归树、支撑向量机分类、神经网络分类、贝叶斯网络、朴素贝叶斯、逻辑回归、分类组合模型等算法可供用户选用,共计包含了27个数据挖掘算法。

产品特点

大数据挖掘平台是一套软件与硬件相结合的系统,其中专有技术和软件是高附加值部分,可以广泛应用于需要海量数据挖掘的应用场合(如广电、电
信、互联网、银行等领域)。

该系统相比传统数据挖掘系统有如下技术优势:

高度可靠

大数据挖掘系统采用云架构,底层数据被分块存储在不同的存储节点上,数据采用1:1容错机制进行容错,可在任意损坏一个存储服务器节点的情况下
实现数据完整可靠,系统对外存储访问服务不间断。

云存储的管理节点采用了主备双机镜像热备的高可用机制,在主管理节点出现故障时,备管理节点自动接替主管理节点的工作,成为新的主管理节点,
待故障节点修复并重启服务后,它则成为新的备管理节点,保障系统的7×24小时不间断服务。

数据挖掘采用了任务调度框架JobKeeper,当出现故障节点后,JobKeeper会自动转移处理任务,保证数据挖掘过程的完整性和正确性。

优异性能

数据挖掘采用分布式并行计算技术,将海量数据的计算处理转化为各个存储节点上并行读写和计算,这样减少了网络的带宽使用,提高了数据的处理速
度。同时随着处理节点数目的增多,整个系统的计算性能将呈线性增长。
同时,JobKeeper采用负载均衡技术,自动均衡各服务器负载,使得各处理节点的性能调节到很高,实现资源优化配置。

海量存储

数据挖掘平台所依赖的数据存储层数据立方容量仅受限于卷管理服务器内存,可支撑的容量接近无限,1G个PB容量)。这样为超大规模的数据挖掘提供了数据支撑。

在线伸缩

大数据挖掘系统扩容非常方便,支持不停止服务的情况下,动态加入新的处理节点,无需任何操作,即实现扩容;同时,无需人为干预,也可以摘下任
意节点,系统自动缩小规模而不影响挖掘业务,运行在此节点上的计算将会重新运行到其他节点上。

通用易用

大数据挖掘系统提供专用的API接口,供开发人员调用。

智能管理

提供基于WEB的管理控制平台,所有的管理工作均由大数据挖掘管理模块自动完成,使用人员无需任何专业知识便可以轻松管理整个系统。通过管理平台,可以对数据立方中的数据源进行挖掘业务,同时提供挖掘结果的可视化查询界面,可以方面的查看挖掘结果,为业务决策做支持。此外,用户还可以通过监控界面可以清楚地了解到每一个处理节点的负载、存储和运行情况。

快速高效

大数据挖掘平台算法库采用了分布式并行算法能够在较短的时间内完整各种算法,同时随着机器的增加系统性能线性增长。

产品架构

企业微信截图_20220517163459.png

所属公司

南京云创大数据科技股份有限公司

相关资料

南京云创大数据科技股份有限公司官网:http://www.cstor.cn/

用户评价

0
0
词条统计
创建者:小小亮
编辑次数:1
浏览次数:1270
API调用次数:0
贡献者
2022/05/16