新闻速递
1.TC601深圳大会聚焦大数据技术标准,星环科技分享向量数据库和时空数据库发展趋势
2.2023大数据十大关键词出炉,数据资产化、数据服务、数据伦理……
3.中国信通院发布《大数据白皮书(2022年)》,我国大数据发展态势好动力足!
4.《全球商业领袖》预言:大数据分析10大趋势,暗数据、XOps··
大数据
5.《地球大数据白皮书(2023年)》正式发布,星环科技入选
6.Oracle推出新一代融合数据智能平台Oracle Fusion Data Intelligence Platform
7.Elasticsearch 8.10 来了!适用于安全的 Elastic AI Assistant 的正式发布版
8.阿里云Elasticsearch 8.9版本释放 AI 搜索新动能
9.ClickHouse正在退出开源世界?
10.Starburst 加强其数据湖分析平台以支持每个云之旅阶段
11.Confluent首次推出托管Apache Flink服务和生成AI功能
12.数据网格公司Nextdata筹集了1200万美元的资金
数据库
13.CockroachDB Dediced现已在所有三个主要云提供商中可用
14.MongoDB推出四项AI驱动的新功能,助力开发者提升效率并加速应用程序现代化
15.阿里云瑶池推出AnalyticDB 全自研企业级向量数据库
数据安全
16.腾讯安全发布云原生安全数据湖
17.亚马逊云科技加速分析与安全服务创新,加速生成式AI落地
18.思科280亿美元收购网络安全公司Splunk,借助AI成为全球最大的软件公司
19.Palo Alto Networks可能以6亿美元的价格收购安全浏览器制造商Talon
AI
20.星环科技参编国内首个金融行业大模型标准,助推大模型产业标准化建设
21.Neo4j、Docker、Langchain、Ollama联合推出GenAI堆栈,可在几分钟内快速启动GenAI应用
22.Snowflake、Pinecone、Dataiku和AI21 Labs合作推出LLM Mesh
23.九章云极DataCanvas完成3亿融资,发展人工智能基础软件
本周焦点
1.TC601深圳大会聚焦大数据技术标准,星环科技分享向量数据库和时空数据库发展趋势
近日,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)第14次全体会议和WG1-WG17工作组会议在深圳召开,成员单位的200余位专家参会。星环科技受邀参会,高级产品经理谭力鸣和王轲分别在WG1和WG4做了主题分享。
谭力鸣分享了Hippo数据库如何提升LLM知识库召回精度的实践和思考,Hippo可以解决大模型在知识时效性低、输入能力有限、准确度低等问题,拓展大模型的应用边界,让大模型保持信息实时性,并能够动态调整,拥有“长期记忆”。Hippo推出社区版,单机即可安装部署,支持多种接口、向量/标量数据实时更新和多种向量检索,可低成本、快速地进行大模型场景的探索。
王轲详细介绍了星环科技分布式时空数据库Spacture,Spacture支持大规模矢量数据、时空轨迹数据、栅格瓦片数据的存储与计算,拥有完备的数据查询、分析和挖掘能力,能支持轨迹数据应用,提供丰富易用的查询分析函数,实现时空范围检索、轨迹运行监控、速度分析、距离分析、热点区域分析、异常行为分析等操作,广泛应用于交通物流、城市管理、位置服务等场景。
2.2023大数据十大关键词出炉,数据资产化、数据服务、数据伦理……
中国信息通信研究院在“2023大数据产业发展大会”上发布了“2023大数据十大关键词”,研判当前大数据产业发展的热点和方向。
“2023大数据十大关键词”分别是:湖仓一体、数据资产化、DataOps、数据服务、增强分析、数据伦理、数据基础制度、公共数据授权运营、数据安全风险评估、数据出境。
3.中国信通院发布《大数据白皮书(2022年)》,我国大数据发展态势好动力足!
《大数据白皮书(2022年)》聚焦过去一年来大数据领域不断涌现的新技术、新模式、新业态,分析总结全球和我国大数据发展的总体态势,并重点针对数据存储与计算、数据管理、数据应用、数据流通、数据安全五大核心领域,逐一分析、探讨其发展现状、特征、问题和趋势,最后对我国大数据未来发展进行展望与研判。
白皮书核心观点包括
我国大数据产业发展态势好动力足。我国大数据经过多年高速发展,产业规模高速增长,创新能力不断增强,生态体系持续优化,市场前景广受认可,呈现良好发展态势。近一年,我国在政策、人才、资金等方面持续加码,为大数据后续发展注入强劲动力。
数据存储与计算领域通过深度优化实现提质增效。经过60余年发展,数据存储与计算领域总体技术框架趋于成熟,在此基础上,以云化、湖仓一体为代表的深度优化理念不断涌现,并逐步应用,为数据存储与计算领域进一步降本提质提供了新范式。
数据管理领域在政策引领下规模化落地。2020年来,行业、地方大力推动DCMM贯标评估,通过“以评促建”的方式提升数据管理能力,累计完成近千家企业的评估。各领域企业的数据管理意识和能力不断增强,越来越多的企业开始从顶层统筹规划数据管理工作,我国数据管理能力建设呈现大规模落地态势。
数据流通领域流通规范体系加速构建。制度创新方面,党中央、国务院发布以《关于构建数据基础制度 更好发挥数据要素作用的意见》为代表的一系列政策文件,为我国数据流通产业发展提供了重要思路;技术创新方面,数据流通技术提供了“数据可用不可见”“数据可控可计量”的数据服务新范式,为企业安全地获取和利用外部数据提供了技术可能。
数据应用领域积极探索数据深层价值的释放路径。由于技术能力不足、前序工作未就绪等因素限制,传统数据应用主要针对的是少量、局部、非实时数据,依赖大量人工决策,导致数据主要释放其浅层价值。当前,国内外各方正积极探索新的数据应用方法论,并在不同行业、不同场景进行滚动式实践,从而释放数据深层价值,目前已取得初步进展。
强需求牵引数据安全产业生态飞速发展。2021年来,数据安全体系建设进程明显提速。政策层面,数据安全法律政策逐步细化,政策环境不断完善,为企业数据安全建设提供政策引领;技术层面,数据安全技术产品蓬勃发展,数据安全培训、数据安全评估等方面需求呈现爆炸式增长。
4.《全球商业领袖》预言:大数据分析10大趋势,暗数据、XOps··
《全球商业领袖》预言,全球大数据分析的10大趋势包括:
·数据即服务:与软件即服务应用程序一样,数据即服务 (DaaS) 使用云技术为用户和应用程序提供对信息的按需访问,而无需依赖于用户或应用程序的位置。它将使分析师更容易获得业务审查任务的数据,并使整个业务或行业的区域更容易共享信息。
·负责任和更智能的人工智能:责任和可扩展的人工智能将以更短的上市时间实现更好的学习算法。企业将从人工智能系统中取得更多成就,如制定可以有效运作的流程。企业将找到一种方法来扩大人工智能(AI)的规模。
·预测分析:实施预测方法来仔细检查当前数据和历史事件,以了解客户并识别公司可能的危险和事件。大数据中的预测分析可以预测未来可能发生的事情。
·量子计算:如果我们在短短几分钟内一次压缩数十亿个数据,我们可以大大减少处理时间,使组织能够及时做出决策并获得更理想的结果。通过使用量子计算,此过程是可行的。
·边缘计算:运行进程并将这些进程移动到本地系统(如任何用户的系统、loT 设备或服务器)定义了边缘处理。边缘计算将计算带到网络的边缘。它减少了客户和服务器之间必须发生的长途连接量,这使其成为大数据分析的最新趋势之一。
·自然语言处理:自然语言处理(NLP)位于人工智能内部,致力于扩展计算机与人类之间的通信。NLP的目标是阅读和解码人类语言的含义。自然语言处理主要基于机器学习,用于开发文字处理器应用程序或翻译软件。NLP 技术要求算法通过应用语法规则来识别和获取每个句子的数据。
·混合云:组织必须拥有私有云来适应所需的公共云。它必须开发一个数据中心,包括服务器、LAN、存储和负载平衡器。组织必须部署虑拟化层/虚拟机管理程序以支持虚拟机和容器,并安装私有云软件层。软件实施允许实例在私有云和公有云之间传输信息。
·暗数据:暗数据是组织在任何分析系统中不使用的数据。数据是从各种网络操作中收集的,这些操作不用于确定见解或用于预测。暗数据数量的扩大可以被视为大数据分析的另一个最新趋势。组织可能认为这是不正确的数据,因为他们正在等待结果。但他们明白,这将是一件珍贵的事情。随着数据每天都在增长,行业必须了解任何新数据都可能带来安全风险。
·数据结构:数据结构是一种体系结构和数据网络集合。它跨本地和云环境的各种终结点提供一致的功能。为了试点数字化转型,Data Fabric 简化并整合了跨云和本地环境的数据存情。它允许在分布式数据环境中进行访问和数据共享。此外,它还跨非孤立存储提供了一致的数据管理框架
·XOps:XOps(数据、ML、模型平台)的主要目标是提高效率和规模经济。Xops是通过实现DevOps 的最佳实践来实现的。因此,确保效率、可重复性和可重用性,同时减少技术、流程复制并允许自动化。这些创新将使原型能够通过受治理系统的灵活设计和敏捷编排进行扩展。
结论:多年来,大数据分析中的新技术在不断变化。因此,企业必须实施正确的趋势,以保持领先于竞争对手
大数据
5.《地球大数据白皮书(2023年)》正式发布,星环科技入选
在大数据技术标准推进委员会WG10数据应用工作组&WG11地球大数据工作组会议上,《地球大数据白皮书(2023年)》正式发布。星环科技是WG11地球大数据工作组成员单位,凭借在大数据和时空数据领域的技术优势,入选白皮书《地球大数据产业图谱1.0》地球大数据平台板块。
白皮书梳理了地球大数据的内容范畴、数据资源、关键技术、行业生态、应用场景以及实践案例等。本白皮中也收录了地球大数据产业图谱1.0,图谱覆盖地球大数据产业的各个环节,梳理了地球大数据行业生态,并初步提出地球大数据实践方法,旨在厘清地球大数据的行业发展现状,并为产业各方开展地球大数据开发利用的相关实践提供参考。
地球大数据的应用领域范围广阔,包括生态保护、自然资源管理、气象服务、城市规划、应急容灾等方面,但目前仍处于发展初期,面临着数据来源、结构多样,数据管理门槛高,数据应用场景复杂、落地方法论较少等痛点。如何充分发挥地球大数据的优势和特点,促进其社会价值、经济价值的高效释放成为产业界亟需解决的问题。
6.Oracle推出新一代融合数据智能平台Oracle Fusion Data Intelligence Platform
Oracle近期推出融合数据智能平台 Fusion Data Intelligence Platform,这是新一代数据、分析和人工智能平台,帮助Oracle融合云应用客户将数据驱动的洞察与智能决策和行动相结合,实现更好的业务成果。
新平台是Oracle Fusion Analytics Warehouse产品的演变,将通过自动化数据管道、关键业务实体的360度数据模型、丰富的交互式分析、AI/ML模型和智能应用提供业务数据即服务。所有这些开箱即用的功能都运行在 Oracle 云基础设施 (OCI) 数据湖屋服务之上,包括 Oracle 自治数据库和 Oracle 分析云,可在数据、分析、AI/ML 和应用层实现完全可扩展性。
Fusion Data Intelligence Platform包括丰富的开箱即用分析产品组合,适用于Oracle Fusion Cloud Enterprise Resource Planning(ERP)、Oracle Fusion Cloud Supply Chain & Manufacturing (SCM)、Oracle Fusion Cloud Human Capital Management (HCM) 和 Oracle Fusion Cloud Customer Experience (CX)。
Oracle Fusion Data Intelligence Platform 包括360 度数据模型、规范性 AI/ML 模型、丰富的交互式分析、智能应用等开箱即用的功能,可帮助 Oracle Fusion Cloud Applications 客户从其数据中获得最大价值。
7.Elasticsearch 8.10 来了!适用于安全的 Elastic AI Assistant 的正式发布版
Elastic 8.10 版正式发布。Elastic 8.10 版是改进的跨集群搜索。同时适用于安全的 Elastic AI Assistant正式发布。主要改进包括:
Elastic 可观测性可将指标、日志和跟踪转化为行之有效的IT见解,在数字生态系统中实现一体化的可观测性。
Elastic安全集 SIEM、终端安全和云安全于一个解决方案中,能够以云技术带来的规模有效检测、调查和应对威胁。Elastic Search 可帮助开发人员实现强大的现代搜索和发现体验。
Elastic 的所有开箱即用型解决方案均基于 Elasticsearch这一个平台构建而成。所有用户,无论是什么用例,都能受益于核心增强功能。
8.阿里云Elasticsearch 8.9版本释放 AI 搜索新动能
阿里云作为国内首家上线Elasticsearch 8.9版本的厂商,在提供Elasticsearch Relevance Engine(ESRE)引擎的基础上,提供增强AI的最佳实践与ES本身的混合搜索能力,为用户带来了更多创新和探索的可能性。
此次从8.5版本到8.9版本的全新升级,新增了以下重点功能,使得阿里云Elasticsearch在向量检索和混合搜索能力都具有显著改善,大大提升了搜索结果的准确性和相关性。
· 支持文本和向量召回结果混排(RRF)。
· 向量最大维度提升到2048。
· 暴力检索性能提升。
· KNN查询支持多个字段同时查询。
· 内置ELSER模型。
· 稳定支持NLP分布式模型调度管理。
9.ClickHouse正在退出开源世界?
ClickHouse 是市面上最好的开源数据库之一,有着非常活跃的技术社区。它最早发布于 2016 年,采用宽松的 Apache 2.0 许可证,目前已有超 3 万人打出 star、数百位代码贡献者、丰富的生态系统以及数千家将其纳入生产环境的企业用户。所有这些,都标志着这项开源技术取得了巨大成功。
2021 年,为了推动 ClickHouse 商业化,同名公司应运而生。但在两年后的今天,有迹象表明 ClickHouse 可能正步步远离开源初衷——重要新功能仅在 ClickHouse Cloud 上开放。此举也引发人们关于 ClickHouse 未来命运的讨论。
不幸的是,转向开放核心模式破坏了 ClickHouse 赖以成功的这几大因素。对产品的关注导致核心团队无法像过去那样提供高水平的社区支持。对 ClickHouse 云功能的强调,则忽略了想要在其他场景下使用 ClickHouse 的用户需求。种种因素正在损害社区对于 ClickHouse 的信任和喜爱,整个社区也必须找到新的相处方式才能保持住过去几年来的惊人增长。
10.Starburst 加强其数据湖分析平台以支持每个云之旅阶段
数据湖分析平台Starburst正在为Starburst Galaxy和Starburst Enterprise添加增强功能,在客户云之旅的每个阶段为客户提供支持。
据该公司称,作为为可选性而构建的数据湖分析平台,Starburst致力于满足客户的需求,并支持这些旅程,无论处于哪个阶段。
·戴尔对Starburst Enterprise中的ECS,ObjectScale和Ceph的存储支持:对于那些刚刚开始云之旅的用户,Starburst支持本地存储,使客户能够运行其商业智能,分析和数据科学工作负载,并使用Starburst的数据湖分析平台访问分布在整个企业中的数据。
·Starburst Galaxy中的本地连接:对于那些利用混合云方法的用户,Starburst增加了本地连接,将Starburst Galaxy扩展到“仅云数据源”之外,并允许正在迁移到云的大型企业客户仍然可以访问其本地数据集。
·Starburst Galaxy 中的 Unity Catalog 集成:对于那些已经采用以云为中心的方法的用户,Starburst Galaxy 正在与 Databricks Unity Catalog 集成,以提供与 AWS Glue、Hive HMS 和 Galaxy Metastore 之外的额外元存储,以便客户无需迁移或重新配置即可访问和混合现代数据源。
11.Confluent首次推出托管Apache Flink服务和生成AI功能
Confluent正在通过托管的Apache Flink服务扩展其旗舰数据流平台Confluent Cloud,这将使客户更容易分析其业务信息。
在纳斯达克上市的Confluent由流行的开源数据流平台Apache Kafka的创建者于2014年创立。Confluent的旗舰产品是一个名为Confluent Cloud的托管数据流平台。它有望减少在应用程序之间移动数据所涉及的开发工作量。Confluent Cloud仍然基于Kafka,但现在由Kora Engine提供支持,Kora Engine是为云构建的Apache Kafka引擎,该公司将其描述为更快,更具成本效益。
Confluent Cloud正在接收托管的Flink服务。Flink 是一个开源工具,允许公司对大量实时信息进行计算。使用该技术,Confluent Cloud客户不仅可以在其系统之间实时流式传输数据,还可以在传输数据时修改数据。
可以应用新的托管 Flink 服务的第一个任务是数据过滤。使用该技术,公司可以分析客户购买日志流并过滤包含错误输入信息的记录。Flink 还可以将多个数据流合并为单个流,这简化了处理,并使用来自外部来源的记录丰富了信息。
12.数据网格公司Nextdata筹集了1200万美元的资金
Nextdata是一家使企业更容易实施数据网格架构的初创公司,已筹集了1200万美元的种子资金,利用这笔资金加速产品开发计划并增加目前由10人组成的员工队伍。
Nextdata由首席执行官扎马克·德加尼于2022年创立。2018年,在Thoughtworks公司工作时,德加尼发明了数据网格data mesh的概念。该概念封装了一种管理业务数据的新方法,有望帮助公司简化其分析项目并降低成本。
Nextdata构建了一个软件平台Nextdata OS,使公司更容易构建内部数据网格。该平台允许公司的业务部门将他们产生的信息打包到所谓的数据产品容器中。Nextdata表示,这些容器使与工作所需的员工共享业务部门的信息变得简单。
数据库
13.CockroachDB Dediced现已在所有三个主要云提供商中可用
云原生分布式SQL数据库CockroachDB背后的公司Cockroach Labs宣布,专用的CockroachDB现已在Azure、AWS和Google Cloud三个主要云提供商中按需发布。
现在,借助专用于三个主要云的CockroachDB,用户可以随时随地轻松运行数据密集型应用程序。借助CockroachDB,组织可以在云提供商之间或跨多个云提供商之间进行选择,并且可以轻松地在自有数据中心和公共云提供商之间混合工作负载。
此外,Cockroach Labs还为其基于消费的自动扩展产品CockroachDB无服务器发布了多区域功能。
此更新允许客户跨多个云区域分布数据行,同时仍作为单个逻辑数据库运行,并且只需为确切的存储和计算用途付费。
14.MongoDB推出四项AI驱动的新功能,助力开发者提升效率并加速应用程序现代化
MongoDB推出全新的智能化开发者体验,利用生成式人工智能助力开发者更快速、更轻松地在MongoDB上构建应用程序。
MongoDB Relational Migrator、MongoDB Compass、MongoDB Atlas Charts、MongoDB Documentation(MongoDB 官方文档)中的全新生成式AI功能可帮助开发者减少耗费在重复性任务上的时间和精力,从而更加专注于解决难题和构建现代应用程序。
·MongoDB Relational Migrator可借助AI将SQL转换为MongoDB Query API语法,进一步提高关系数据库迁移的自动化水平。
·MongoDB Compass可根据自然语言生成查询和聚合,助力更快速、更轻松地构建由数据驱动的应用程序。
·MongoDB Atlas Charts可根据自然语言构建丰富的数据可视化,助力加速仪表板创建和商业智能。
·MongoDB 官方文档全新AI聊天机器人功能可解答技术问题,助力缩短应用程序构建和故障排除所需的时。
15.阿里云瑶池推出AnalyticDB 全自研企业级向量数据库
阿里云瑶池旗下的云原生数据仓库AnalyticDB锚点未来 5 年企业数据架构智能化升级需求,全自研了企业级向量数据库,它也是国内云厂商中唯一被 ChatGPT 和 LangChain 推荐的向量引擎。
阿里云全新升级的云原生数据仓库AnalyticDB,内置向量数据引擎,其可连接大语言模型,企业只需将专业知识输入该向量引擎,仅需30分钟即可实现企业专属的生成式AI问答机器人。据悉,AnalyticDB现已用于文本搜索、图片搜索等场景,并实现了准确性的大幅提升。
数据安全
16.腾讯安全发布云原生安全数据湖
腾讯安全发布全新一代云原生安全数据湖,专注海量日志数据分析,助力企业构建一体化云原生数据湖平台,迈向主动安全。据悉,在同等数据规模下,该产品的硬件成本仅为同类开源软件的 1/10,此外在查询性能特别是聚合查询性能方面有了成倍的提升,能实现 PB 级日志的秒级查询。
两年前,腾讯安全在服务客户过程中发现,客户普遍反应遇到日志存储成本攀升、查询效率低下的问题,因此腾讯安全大数据实验室基于多年的大数据分析处理能力,前后花费两年时间自主研发了一款面向云原生的安全数据湖产品。
腾讯云原生安全数据湖是基于云原生的自研数据分析平台,利用日志数据无需修改、大量字段重复、有时间戳等特性进行了几大创新:
·架构领先:MPP 架构,采用 Rust 语言开发,针对日志及安全场景进行专项优化
·极致降本:使用列存储实现极致压缩比,无索引架构避免索引开销
·一体化引擎:通过原子能力实现数据处理、查询、存储、分析一体化
·插件式扩展:通过 SQL/SPL 语句支持不同分析场景,支持“插件式”扩容
·易运维:面向云原生架构实现存算分离、读写分离、从而实现一键弹性扩容,故障秒级切换。
17.亚马逊云科技加速分析与安全服务创新,加速生成式AI落地
亚马逊云科技不断探索云上数据创新的边界,围绕业务数据的可识别、可见、可协作和安全数据的可操作四大场景提供创新服务和解决方案,如保障数据合规的敏感数据保护解决方案,提升数据可见性的数据治理服务Amazon DataZone,助力多方数据协作的分析服务Amazon Clean Rooms和Amazon Data Exchange,以及对安全日志进行统一管理的安全数据湖服务Amazon Security Lake。亚马逊云科技分析与安全服务协同,也助力生成式AI基础模型广泛获取内外部数据并实现安全训练。
释放数据价值并非只局限在企业自身的业务数据,产业上下游和合作伙伴等第三方数据的加入将为企业创新注入全新活力。Amazon Clean Rooms分析服务能够帮助企业与其合作伙伴在互相不暴露原始数据的情况下进行数据协作,也无需在云上移动数据,从而最大化数据价值。对生成式AI基础模型而言,模型训练需要海量的第三方非结构化数据。Amazon Data Exchange提供来自300多家提供商的3500多种公共数据产品,可以帮助客户轻松查找、订阅和使用所需的各种第三方数据。Amazon Data Exchange与Amazon EMR Serverless等分析服务相结合,可以大大简化企业生成式AI应用开发方面的数据获取难题,加速生成式AI落地。
18.思科280亿美元收购网络安全公司Splunk,借助AI成为全球最大的软件公司
思科公司表示,正在以每股157美元的价格收购网络安全软件公司Splunk,这笔现金交易价值约280亿美元,这是思科公司有史以来最大的一笔收购。
思科长期以来一直是全球最大的计算机网络设备制造商,并一直在加强其网络安全业务,以满足客户需求并推动增长。
2023年,思科收购了四家专注于网络安全的公司,包括威胁检测平台 Armorblox;身份管理公司Oort;以及Valtix和Lightspin,两者都在云安全方面。
Splunk股价9月21日收盘上涨21%,而思科股价收盘下跌4%。
Splunk 的技术可帮助企业监控和分析其数据,以最大限度地降低黑客攻击风险并更快地解决技术问题。思科CEO查克·罗宾斯(Chuck Robbins)表示,“我们将共同成为全球最大的软件公司之一。”
19.Palo Alto Networks可能以6亿美元的价格收购安全浏览器制造商Talon
Palo Alto Networks正在就收购Talon Cyber Security 进行谈判。这笔交易如果发生,预计将使Talon的估值达到6亿美元。
总部位于以色列特拉维夫的Talon自两年前成立以来已筹集了超过1.26亿美元的资金。Talon的旗舰产品是一个名为TalonWork的浏览器。它基于Chromium,Chromium是构成Google Chrome基础的开源浏览器。Talon扩展了Chromium的功能集,提供了大量网络安全功能,旨在保护员工免受黑客攻击。
TalonWork中的第一套违规预防工具专注于监管网络流量。据该公司称,其浏览器可以阻止网络钓鱼电子邮件和其他恶意URL中的网站链接。此外,公司可以使他们的 Web 应用程序仅供通过 TalonWork 登录的员工访问。
该浏览器还包括一系列旨在减轻文件下载带来的风险的功能。内置网络安全功能可以阻止针对TalonWork本身的网络攻击。
如果Palo Alto Networks收购Talon的计划成为现实,这笔交易将成为这家网络安全巨头近期最大的收购之一。
AI
20.星环科技参编国内首个金融行业大模型标准,助推大模型产业标准化建设
在2023年可信AI大会暨南京人工智能产业发展大会—大模型高质量发展论坛上,《面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型》标准重磅发布。该标准由中国信通院联合星环科技等近40家企业共同编制,是国内首个金融行业大模型标准,涵盖投研、投顾、风控、营销、银行、保险、证券等多个应用场景,对大模型在数据合规性、可追溯性、私有化部署、风险控制等方面提出了要求,旨在助力金融行业智能化升级。
星环科技积极参与该标准的编写工作,为标准的完善做出了重要贡献,就金融知识问答、市场情绪分析、金融新闻/研报自动摘要、法规合规检查、SQL生成等场景在私有化部署、审计追溯、实时性要求、数据安全与隐私等方面提供了宝贵的评价指标和反馈意见。
21.Neo4j、Docker、Langchain、Ollama联合推出GenAI堆栈,可在几分钟内快速启动GenAI应用
在DockerCon上,Docker与合作伙伴Neo4j、LangChain和Ollama一起宣布推出新的GenAI堆栈,旨在帮助开发人员在几分钟内开始使用生成式AI应用程序。GenAI Stack 无需搜索、拼凑和配置来自不同来源的技术,它是预先配置的、随时可以编码的,并且使用来自Ollama 的大型语言模型 (LLM)、来自Neo4j 的矢量和图形数据库以及 LangChain 框架进行保护。
GenAI Stack今天在Docker Desktop的学习中心和 https://github.com/docker/genai-stack 的存储库中提供,它使用Docker Hub上的可信开源内容解决了流行的GenAI用例。组件包括:
·预配置的开源LLM,如Llama 2,Code Llama,Mistral或私有模型,如OpenAI的GPT-3.5和GPT-4;
·来自 Ollama 的帮助,帮助开发人员在本地启动和运行开源 LLM;
·Neo4j作为图和原生向量搜索的默认数据库,可发现数据中的显式和隐式模式和关系,使AI ML模型更快,更准确,并充当这些模型的长期记忆;
·Neo4j知识图谱,作为LLM基础的知识库,以获得更准确的GenAI预测和结果;
·LLM、应用程序和数据库之间的 LangChain 编排,具有向量索引,并作为开发由 LLM 提供支持的上下文感知推理应用程序的框架和一系列支持工具、代码模板、操作方法和 GenAI 最佳实践。
22.Snowflake、Pinecone、Dataiku和AI21 Labs合作推出LLM Mesh
Dataiku,日常人工智能平台,正在推出LLM Mesh,满足对有效、可扩展和安全平台的需求,以在企业中集成大型语言模型(LLM)。
此外,Dataiku正在与Snowflake、Pinecone和AI21 Labs合作开发LLM Mesh,其功能代表了LLM Mesh的几个关键组件:容器化数据和计算功能,矢量数据库和LLM构建器。
据该公司称,LLM Mesh提供了公司使用LLM大规模构建安全应用程序所需的组件。
由于LLM Mesh位于LLM服务提供商和最终用户应用程序之间,公司可以根据他们现在和未来的需求选择最具成本效益的模型,确保其数据和响应的安全性,并为可扩展的应用程序开发创建可重用的组件。
LLM Mesh的组件包括通用AI服务路由,AI服务的安全访问和审计,私有数据筛选和响应审核的安全规定以及性能和成本跟踪。
23.九章云极DataCanvas完成3亿融资,发展人工智能基础软件
近日,九章云极DataCanvas公司完成总融资额3亿元D1轮融资。九章云极DataCanvas公司作为国家专精特新小巨人企业,其“人工智能”技术创新能力和“基础软件”产品商业化能力备受市场认可。
投资方表示,九章云极DataCanvas公司包含大模型在内的前沿人工智能技术成果、长效优势显著的AI基础软件商业化策略,充分展现了我国科技创新企业的实力和潜力。基础软件是人工智能的底座,人工智能的基础软件的发展决定了人工智能发展的深度、高度、广度,拥有商业化的广阔市场。在大算力时代,充分发挥算法+算力的优势,作为赛道领头企业实现规模化行业应用能力,看好公司未来发展。
多年来,凭借行业领先的人工智能基础软件,九章云极DataCanvas为各行各业的头部企业提供自主AI能力。在今年6月的产品发布会上,九章云极DataCanvas公司宣布产品体系升级,重磅发布业界前沿技术水准的DataCanvas Alaya九章元识大模型、DingoDB多模向量数据库等多款产品,共同构成 「AIFS人工智能基础软件」和「DataPilot数据领航员」核心产品体系。至此,九章云极DataCanvas公司成功实现构建企业“大+小”模型能力的产品布局。

春华秋实!

扫码关注
大数据应用
从现在开始

End