暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

国产数据库配四代至强性能提升69%;更便宜电动汽车来了;亚马逊裁员今天开始;神奇的ChatGPT人人可用;HPC+AI算法···

93


距2023年还有

2







本周热点



1.满足湖仓集一体需求,性能提升69%!星环科技ArgoDBx第四代英特尔至强处理器解决方案发布


英特尔在北京正式推出第四代英特尔至强可扩展处理器、英特尔至强CPU Max系列以及英特尔首个数据中心GPU Max系列,在实现数据中心性能、能效和安全性大幅跃升的同时,为AI、云、网络、边缘和全球领先的超级计算机带来全新功能。而星环科技与英特尔合作的星环科技ArgoDB x 第四代英特尔至强处理器解决方案也重磅发布。


星环科技与英特尔合作推出了基于第四代英特尔至强可扩展处理器的ArgoDB分布式分析型数据库解决方案,实现了高性能、高经济性、高扩展性、高可用性的统一。除此之外,该解决方案还搭载了英特尔网卡等产品,为用户部署面向分布式全闪存架构的高性能数据库提供了重要依据和选型方向。


Transwarp ArgoDB 借助在分布式向量化计算引擎、高性能列式存储等技术方面的深度创新,结合第四代英特尔至强可扩展处理器提供的高级硬件能力,进一步将 ArgoDB 的性能提升 69%,为用户提供更加强大的数据处理能力,充分满足联机分析处理 (OLAP)、实时数仓、数据集市和湖仓集一体等场景的性能要求,助力用户轻松释放大数据价值。



2.2023 年电动车更便宜,揭示为什么更多人将买得起


对于美国车主来说,2023 年电动汽车将会变得更便宜。这在很大程度上是因为大量价格较低的电动汽车将投放市场,同时新的政府补贴政策也将让更多人买得起价格更高的车型。


2022年,尽管存在供应链问题和通货膨胀,但电动汽车在美国汽车市场所占份额几乎翻了一番。例如,在 2022 年前 10 个月,电动汽车占美国所有汽车销量的 5.3%,而上年同期仅为 2.9%。信息服务公司 Experian 的数据显示,美国新电动汽车注册数量达到604638 辆,比上年同期增长了60% 以上。摩根士丹利的亚当・乔纳斯(Adam Jonas)等分析师预计,到 2025 年,电动汽车的市场份额将达到 11%。


大多数在售的新款电动汽车都在 5 万美元以上,而且这个高端市场仍有巨大增长空间。SAP 北美汽车业务主管比尔・纽曼 (Bill Newman) 表示:“至少未来 10 年,不低于 3 万美元的高端电动汽车市场仍有很大的增长空间,可以实现投资组合目标。”


在国内,工信部公布了第367批《道路机动车辆生产企业及产品公告》新产品公示,也是2023年第一批,在这批新产品公示中,公布了多款新能源产品,包含比亚迪、极狐、别克等多款产品,随着这新车的公示,我们即将迎来2023年第一波新车。随着特斯拉的降价,国内EV汽车将不得不跟随。







政策速递



3.工信部等十六部门印发《关于促进数据安全产业发展的指导意见》,2025年规模上1500亿元


工业和信息化部、国家网信办、发展改革委等十六部门近日印发《关于促进数据安全产业发展的指导意见》(下称《意见》)。《意见》明确,提升产业创新能力,加强核心技术攻关。


加强核心技术攻关。推进新型计算模式和网络架构下数据安全基础理论和技术研究,支持后量子密码算法、密态计算等技术在数据安全产业的发展应用。优化升级数据识别、分类分级、数据脱敏、数据权限管理等共性基础技术,加强隐私计算、数据流转分析等关键技术攻关。研究大数据场景下轻量级安全传输存储、隐私合规检测、数据滥用分析等技术。建设和认定一批省部级及以上数据安全重点实验室,鼓励产学研用多方主体共建高水平研发机构、产业协同创新中心,开展技术攻关,推动成果转化。


构建数据安全产品体系。加快发展数据资源管理、资源保护产品,重点提升智能化水平,加强数据质量评估、隐私计算等产品研发。发展面向重点行业领域特色需求的精细化、专业型数据安全产品,开发适合中小企业的解决方案和工具包,支持发展定制化、轻便化的个人数据安全防护产品。提升基础软硬件数据安全水平,推动数据安全产品与基础软硬件的适配发展,增强数据安全内生能力。


提升关键环节、重点领域应用水平。深度分析工业、电信、交通、金融、卫生健康、知识产权等领域数据安全需求,梳理典型应用场景,分类制定数据安全技术产品应用指南,促进数据处理各环节深度应用。推动先进适用数据安全技术产品在电子商务、远程医疗、在线教育、线上办公、直播新媒体等新型应用场景,以及国家数据中心集群、国家算力枢纽节点等重大数据基础设施中的应用。推进安全多方计算、联邦学习、全同态加密等数据开发利用支撑技术的部署应用。



4.《数据治理产业图谱1.0》正式发布


《数据治理产业图谱1.0》(以下简称“图谱1.0”)由中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同发起,旨在梳理数据治理产业上下游相关企业、产品、服务的分布情况,掌握数据治理市场现状,洞察数据治理产业发展趋势。



图谱1.0收录了来自98家企业的144款数据治理产品和53项数据治理相关的服务,覆盖超过15个行业领域。分为数据治理产品图谱和数据治理服务图谱两部分。


星环科技入选四个类别,包括数据管理一体化平台、咨询服务、实施服务等,为各类客户提供大数据治理产品与服务。



5.虎符智库报告:数据安全踏入“发展暖春”,数据治理遇规模发展“瓶颈”


数据安全治理作为做好数据安全的前提和基础,近年来受到越来越多的关注和重视。相应的政策法规不断出台,技术创新成为热点。从实际成效和结果看,数据治理领域尚未呈现人气与市场交替上升局面,存在一定叫好不叫座问题,其产业化相对滞后,与数字化产业规模难以匹配。


全球数据治理市场规模显著小于同期大数据市场规模。据海外the business research company统计,2021年全球数据治理市场规模约为26.2亿美元,预计2022年将增长至32.8亿美元,年复合增长率为24.9%,而IDC数据显示,2021年全球大数据市场的IT总投资规模为2176.1亿美元,是同期数据治理市场规模的83倍。


各方积极参与,数据治理市场呈现多元化趋势。投入数据安全治理体系的研发和市场拓展的企业包括数据安全类厂商、数据安全服务商、甲方用户(深度行业集成商)、监管单位,以及中小企业及个体。







大数据与数据库



6.50种图算法加速海量图数据分析,星环科技发布分布式图数据库StellarDB 4.1


星环科技分布式图数据库StellarDB正式发布4.1版本,在对现有功能进行优化的基础上,新增Weighted PageRank、Personalized PageRank、Dice Index、Adamic Adar等十多种图算法,内置图算法近50种,不但算法性能超过同类竞品数倍,而且对部分已支持算法进行了性能提升,助力企业加速图数据分析。


此外,StellarDB 4.1版本在数据类型和查询语法方面进行深度升级,在支持多种常用数据类型以及 Array 和高精度 Decimal复杂类型之外,新增支持时序类型、地理空间(GEO)两个复杂类型,增加数据建模的灵活性,降低了传统图数据建模时需要单独对特殊数据类型构建点或者边的复杂性,大幅提高产品的易用性和建模灵活性,帮助用户更快、更高效地挖掘海量数据互联价值。



7.网易数帆数据开发治理平台Easydata 7.0正式发布


网易数帆数据开发治理平台Easydata 7.0版本发布,推出两款全新子产品:发布中心、UDF Studio,助力提升跨环境资源发布效率与UDF使用便捷性;数据治理体系升级、产品架构深度优化、交互视觉全新升级、产品性能大幅提升、用户手册和FAQ线上化、子产品使用体验持续优化。


发布中心,跨环境发布的神兵利器,高效解决多套环境间资源发布问题;UDF Studio:统一函数管理,让函数使用更便捷。


另外在传统数据治理的基础上,网易数帆提出“开发治理一体化”的核心思想,将数据治理的过程前置到数据开发环节,确保生产出来的数据就是符合标准和规范的,同时,结合数据中台的构建思想,打破烟囱式数据架构,构建统一的指标管理体系和企业公共数据模型层,通过服务化的方式对外提供服务。



8.红象云腾Redoop Community上线,简化Apache Ambari让大数据更简单


专注于Apache Hadoop生态的大数据软件企业红象云腾上线了Redoop Community(红象社区版),旨在简化Apache Ambari的安装及使用门槛,并降低用户的运维成本。社区官网访问地址:https://community.redoop.com/。


Redoop Community 是一款完全基于Apache Ambari的产品,旨在为用户提供更加方便和高效的大数据集群管理方案。


作为Apache Ambari的补充和扩展,Redoop Community主要提供Apache社区未发版的较稳定Snapshot版本,以及已发版的Release版本的RPM包的镜像站。


据介绍,Redoop Community 拥有兼容上游、方便部署、多云支持等优势,用户可以根据实际负载情况,通过 Redoop Community 自动调整虚拟机的个数,来动态扩/缩容集群,达到节省成本的目的。



9.云和恩墨数据库一体机、DBaaS平台等三款全新产品


2023云和恩墨生态产品发布会在线上成功召开,发布了三款全新产品:zData X 数据库一体机、zCloud for DBaaS平台和 zAIoT 机器数据智管产品。


基于自研的新一代数据库存储 zStorage 的数据库一体机 zData X 通过高速网络将计算节点和存储节点进行互联,不仅能够承载不同类型的商业、开源和国产数据库(包括 Oracle、MySQL、MogDB、达梦等),还针对数据库、操作系统、硬件以及存储软件进行了端到端的深度性能优化,以期为客户打造面向多元数据库的最佳运行平台。


云和恩墨将过去所积累、调优的 zCloud 数据库云管平台的能力和政务云、行业云的场景结合起来,正式推出 zCloud for DBaaS平台。


zAIoT 产品分为两大部分,PaaS层的数据基座——zAIoT Platform,可作为物联网平台对物联设备数据进行采、存、管、析,也可作为工业大数据平台对工业生产中的数据进行存储和分析,其价值在于能够连接数据孤岛,实现一站式数据处理和海量数据挖掘;SaaS层的智能应用——zAIoT AS,可作为设备制造场景的数据分析软件,核心功能包含设备型号管理、试验任务数据分析、故障诊断、协作分析等,能够实现原型快速验证、数据智能分析以及设备模型的智能评估。



10.阿里云Elasticsearch Serverless 正式上线,免费公测中!


2022云栖大会上,阿里云Elasticsearch发布业内首个Elasticsearch Serverless云服务——阿里云Elasticsearch Serverless,现已正式上线开启免费公测。



以往创建Elasticsearch集群时,用户往往需要按照业务预估读写情况,在预留一定水位情况下,配置集群资源包括CPU、内存、磁盘、Shard等各类参数,以确保业务在波峰波谷都能平稳运行。


相较之前,云上Elasticsearch Serverless实现了对资源的按需取用,使得用户每个Elasticsearch应用资源能跟随业务负载、流量和数据量大小动态伸缩,按使用量计费。从而为用户提供简单易用、弹性灵活、开箱即用的Elasticsearch产品体验,做到快速响应业务变化的同时,合理优化使用成本,助力企业降本增效。



11.柏睿数据虚拟化管理平台Rapidsdb DVM开启本地化测试


应用各自为政,之间的数据互不相通,数据存放格式和数据安全管理都是烟囱式模型,无法跨业务集成和使用;企业使用ETL工具在多个数据源之间抽取、转换、加载来获得业务数据,造成了业务之间集成工作量巨大、安全系数低等多种困境。


针对这些问题,柏睿数据基于完全自研的新一代内存数据库技术,推出柏睿数据虚拟化管理平台Rapidsdb DVM,目前该平台面向全球开启本地化测试!


Rapidsdb DVM可以屏蔽数据的格式、地域、系统等属性,最终为用户呈现出统一全域的SQL数据接口层,从而在不迁移任何数据的情况下,实现对跨源异构数据的实时极速查询。



12.火山引擎E-MapReduce上线无状态集群能力


日前火山引擎E-MapReduce(简称“EMR”)正式上线无状态集群能力,拉开从云上EMR向EMR Stateless进化的新序幕。


开源大数据平台最早部署在传统IDC中,随着云计算的普及逐渐发展成为云上EMR,如今,在技术进步和用户需求的双重驱动下,火山引擎率先提出了EMR Stateless的理念。


火山引擎EMR正式上线瞬态集群新功能,该能力基于业界领先的EMR Stateless理念,可以实现集群级别的弹性伸缩,即无业务需求时释放集群,有业务需求时再拉起集群,从而帮助企业大幅降低产品使用和平台运维成本。



13.RocketMQ 集成生态再升级:轻松构建云上数据管道


随着业务需求场景日渐丰富,在多年经验积累后,阿里云 RocketMQ 也迎来了革命性的更新,正式发布了阿里云消息队列 RocketMQ 版 5.0,在架构、网络、负载均衡、存储等诸多方面进行了显著优化。其定位不再局限于消息解耦场景,将全新布局事件驱动和消息流式处理场景。


阿里云消息队列 RocketMQ 版是阿里云基于 Apache RocketMQ 构建的低延迟、高并发、高可用、高可靠的分布式“消息、事件、流”统一处理平台,面向互联网分布式应用场景提供微服务异步解耦、流式数据处理、事件驱动处理等核心能力。


阿里云 EventBridge 作为云上事件枢纽一直以来都保持着对云上事件、数据的友好生态支持。随着 RocketMQ 5.0版本的用户日渐增多,EventBridge 在近期对 RocketMQ Connector 进行了全面升级。升级之后的 RocketMQ Connector 不仅可以支持RocketMQ 5.0 版本,同时也能支持云上自建 RocketMQ 实例。除此之外,基于成熟的事件流能力,用户使用 EventBridge 也能轻松构建消息路由能力,实现对灾备、数据同步的需求。







AI天地



14.谷歌推出Muse,一种新的文本到图像转换器模型


随着大量深度学习支持的文本到图像模型如DALL-E-2、Stable Diffusion、Midjourney的诞生,人工智能研究与应用发生了革命性的变化。日前谷歌推出Muse,是一种文本到图像的变压器模型,声称可以实现最先进的图像生成性能。


从已经过训练的大型语言模型(LLM) 获得的文本嵌入,Muse将在离散令牌空间中接受掩码建模任务的训练。Muse已被训练来预测随机掩蔽的图像令牌。Muse声称比Imagen和DALL-E 2等像素空间扩散模型更有效,因为它使用离散令牌并且需要更少的样本迭代。该模型通过迭代重采样图像标记,根据文本提示进行迭代重采样,免费生成零镜头、无掩蔽编辑。



15.微软推出VALL-E,只需3秒音频训练即可模仿人说话


微软推出了最新的文本到语音 (TTS) 生成器VALL-E,可以在短短三秒钟内训练模仿任何人的声音。与以前听起来像机器人的语音发生器不同,VALL-E 听起来很自然。


谷歌、Meta 等主要科技公司也一直致力于这一领域,以使其产品更易于使用。然而,这些产品并非旨在模仿用户的声音,需要无数小时的培训才能做到这一点,而且效果不佳。


该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E 可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。



16.434名贡献者、3300多次代码提交的深度学习框架PyTorch最新版本 1.11来了


深度学习框架PyTorch的官方网站宣布PyTorch 1.11正式发布。该版本自1.10版本以来有超过3300次代码提交,由434位贡献者协同完成。


同时,PyTorch还发布了两个新库TorchData和functorch的beta版本,引起无数程序员狂欢热议。


● TorchData,这是一个通用模块化数据加载原语的新库,用于轻松构建灵活和高性能的数据管道。


● functorch,这是一个将可组合函数转换添加到PyTorch的新库,现已推出beta版。


● 分布式数据并行 (DDP) 静态图形优化稳定可用。


PyTorch是Facebook在2017年开源的一个针对深度学习的张量库。它凭借容易上手、功能强大、性能高和用途广泛等优点,成为了当前主流的深度学习框架之一,无论是在学术界还是在工业界都受到了深度学习爱好者的青睐。



17.微软面向所有人提供Azure OpenAI服务,ChatGPT人人可用


微软宣布其基于云的Azure OpenAI服务正式发布,以便普通人可以使用其AI工具(如GPT-3.5,Codex和DALL•E 2)来增强工作。微软表示,客户可以通过Azure访问OpenAI的旗舰AI聊天机器人ChatGPT。OpenAI也宣布将很快将ChatGPT添加到其API中。


那些使用Azure服务的人已经可以访问ChatGPT所基于的GPT-3.5语言系统以及用于从文本提示生成图像的Dall-E模型等工具。“ChatGPT即将推出Azure OpenAI服务,该服务现已正式发布,帮助客户将世界上最先进的AI模型应用于他们自己的业务需求,”微软首席执行官Satya Nadella在推特上写道。







爆点事件



18.郑纬民院士:AI for Science的出现,HPC(高性能计算)+AI+BigData融合的服务器就会出现


中国工程院院士、清华大学计算机科学与技术系郑纬民,在MEET2023智能未来大会上,分享了自己的见解和思考。


估计未来两年到四年,HPC(高性能计算)+AI+BigData融合的服务器就会出现。


AI for Science的出现,让HPC+AI的融合成为刚性需求;而数据处理又是AI的基础,数据和AI的融合也很自然。


甚至他还开玩笑说,现在要获HPC领域的戈登贝尔奖,必须要有AI的算法。你没有AI的算法,否则奖都得不了。


虽然这是玩笑说法,但实际上也是一种趋势。


除此之外,他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。



19.亚马逊有史以来最大规模的裁员周三开始


亚马逊历史上最大的裁员于周三开始,将采用1.8万人。裁员只是其150万全球员工人数的一小部分,也是公司正在进行的年度运营审查的一部分,将主要影响该公司的亚马逊商店部门(包括其电子商务业务以及公司的实体店)及其PXT组织,负责处理人力资源和其他职能。



20.比特币在2-3年内达到50,000至100,000美元


在经历了动荡的 2022 年之后,加密货币投资者正试图弄清楚下一次比特币牛市何时到来。


2022 年,整个加密货币市场损失了约 1.4 万亿美元的价值,该行业面临流动性问题和破产,再加上交易所 FTX 的崩溃。传染蔓延到整个行业。


在瑞士举行的一次加密会议上,业内人士认为,2023年将是谨慎的一年,不太可能出现新的牛市。专家表示,比特币不太可能重新回到其略低于69,000美元的历史高点。


SkyBridge Capital创始人安东尼·斯卡拉穆奇(Anthony Scaramucci)称2023年是比特币的“复苏年”,并预测比特币可能在两到三年内以5万至10万美元的价格交易。







IPO/投融资



21.微软收购以数据处理部门而闻名的初创公司Fungible


微软收购了以其数据处理部门而闻名的初创公司Fungible。Fungible的团队将加入微软的数据中心基础设施工程团队,该团队将专注于存储和网络的DPU服务。


Fungible凭借其数据处理单元(DPU)声名鹊起,这是该公司愿景的一部分,即使客户能够根据需要组合存储,而不是添加节点。DPU 是可编程处理器,旨在将网络和通信任务与处理任务分离,从而释放其 CPU 以专注于处理数据。



22.人工智能公司 DataStax 收购机器学习公司 Kaskada


实时人工智能公司 DataStax 正在收购机器学习 (ML) 公司 Kaskada,该公司可以训练行为 ML 模型并提供即时、可操作的见解,为人工智能 (AI) 提供动力。


根据供应商的说法,将 Kaskada 添加到 DataStax 的云服务组合中——现在包括基于 Apache Cassandra构建的可大规模扩展的 Astra DB数据库即服务和使用 Astra Streaming的事件流——将为组织提供一个单一的环境来轻松地使用经 Netflix 和 Uber等行业领导者验证的高级 ML/AI 模型,经济高效地交付融入实时 AI 的应用程序。


DataStax 和 Kaskada都有为开源社区做出贡献的记录。Datastax最初将开源核心 Kaskada 技术,并计划在今年晚些时候提供新的机器学习云服务。



23.「丈八网安」完成数千万元级别A轮融资

网络安全厂商「丈八网安」已于近日完成A轮融资。丈八网安成立于2021年,当前专注打造下一代网络安全靶场产品。


丈八网安成立于2021年3月,秉承“让网络安全仿真及应用的核心技术掌握在国人手中”的使命,自主研发了国内首款原生网络靶场——“火天网境”,目前,“火天网境”衍生的四款标准化产品(火天网演、火天网训、火天网测、火天网弈)已经围绕特种行业、教育及金融等关键基础设施行业,在基于真实业务的仿真训练、竞赛、攻防演练、测试评估等多种场景中发挥重要作用。



24.加速存算一体商用,「知存科技」完成2亿元B2轮融资


存算一体芯片企业知存科技宣布完成2亿元B2轮融资。本轮融资由国投创业领投,水木春锦资本、领航新界跟投,指数资本继续担任独家财务顾问。本轮融资将主要用于存内计算芯片的量产和新产品开发,拓展产业化落地规模。


知存科技目前已发布和量产了存算一体加速器WTM1001、存内计算SoC芯片WTM2101两代产品。2022年,知存科技曾分别于1月和9月宣布完成了2亿元B1轮融资和1亿元的B1+轮融资。



25.专注物联网安全创新 天防安全获数千万Pre-A轮融资


物联网安全创新厂商天防安全完成数千万Pre-A轮融资。本轮融资由天鹰资本领投,主要用于新产品开发和全国市场体系的搭建以及团队人才引进等方面。


天防安全主要针对于智慧城市、平安城市、天网工程、雪亮工程、平安中国等大型视频物联网络提供“资弱漏补,闭环管理”整体物联网安全解决方案,提高网络的抗击打能力和安全监测管理能力。并进一步扩展金融、交通、电力、能源、应急等行业物联网市场。


END



文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论