暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

大模型跑在PC上;AI PC商业带动产业;国产数据库企业退出关系市场;Redis开源替代者;数据库增加智能助手;大模型新王诞生!

359

点击蓝字 关注我们



行业快讯与友商动态 2024年第12期:



本周的新闻热点就是英特尔和微软主导的AI PC开始商用化,大模型一改过去在云端运行,开始在PC端本地运行。英特尔承诺,微软的AI应用智能助手Copilot,将在本地运行,对NPU的计算需求将大幅提高。


大模型新产品和新应用井喷,开源的大模型不断增多。未来,用户会不会有选择困难症?另外,能否利用自己的数据,训练专用大模型成为焦点。


数据库市场的竞争异常激烈。传出一家国产数据库企业退出关系型数据库市场。键值数据库领头羊 Redis 改变许可协议,成为不开源的数据库产品。因此,Linux基金会支持 Redis 的“Valkey”开源分支,替代Redis。


本周焦点
1.星环科技亮相英特尔AIPC发布会 推出AIPC版大模型产品
2.英特尔:AI PC 的时代已经到来,将永远改变您的工作方式
3.英特尔AI PC开启商用元年!打造6大AI场景应用,三大AI引擎助力本地跑20B大模型

大数据
4.凭借大数据、人工智能等的硬核实力,星环科技荣登“2024上海硬核科技企业TOP100榜单”
5.全球调查显示,跨各种平台统一数据对于有效的人工智能至关重要
6.网易湖仓管理系统Amoro进入 Apache 孵化器
7.Astronomer 通过更新Astro简化企业数据编排
8.向量搜索和存储是AWS数据库战略的关键
9.Snowflake Data Clean Rooms增强安全的跨云协作,实现高价值业务成果

数据库
10.国产数据库厂商巨杉退出关系型数据库市场
11.海致星图参与的国家重点研发计划“基于新型硬件的原生数据库系统”项目启动
12.Linux基金会支持 Redis 的“Valkey”开源分支
13.Microsoft推出适用于Azure SQL数据库的Copilot

数据安全
14.国密认证!星环科技分布式交易型数据库KunDB通过商用密码产品认证
15.云数据隐私解决方案提供商Skyflow融资3000 万美元以增强数据隐私保险库
16.数据安全初创公司Bedrock Security筹集1000 万美元,用于通过基于 AI 的推理增强大数据安全性
17.谷歌同意删除大量用户数据以解决“隐身”诉讼

AI
18.2024年中国AI大模型产业发展报告发布,展望五大趋势
19.大模型新王诞生!Claude 3首次超越GPT4
20.国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok
21.大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起
22.OpenCSG将开源大模型的微调项目 LLM-Finetune项目
23.百度智能云发布 Baidu Comate 2.0,个人开发者可免费使用
24.Activeloop筹集了1100万美元,发展用于AI训练和推理的专用张量数据库



本周焦点



1.星环科技亮相英特尔AIPC发布会 推出AIPC版大模型产品




星环科技亮相英特尔商用客户端AIPC产品发布会,发布“无涯大模型AIPC版”,并预发布“无涯·问知”AIPC版,正式开启了大模型的个人应用时代。


星环科技最新发布的无涯大模型AIPC版,是专为AIPC量身打造的一款产品。在实际应用场景中,它可以在配备Intel新一代CPU的主流个人电脑上,基于集成显卡和NPU流畅运行。这款大模型版本拥有三大显著能力:


首先,它具备泛行业的知识获取能力。无论在日常使用还是特定行业应用中,无涯大模型AIPC版都能充分发挥大模型技术的优势,为各类场景提供强大的支持。


其次,该版本提供了出色的内容理解能力。这包括对感知和认知层面的深度理解,以及对事实、流程、图谱等高级语意的精准把握。这种能力使得无涯大模型AIPC版能够更准确地理解用户需求,从而提供更精准的服务。


最后,它还具备强大的数据分析能力。对于可量化的内容,无涯大模型AIPC版能够提供高效的计算和分析能力,帮助用户从海量数据中提取有价值的信息。


星环科技4月即将正式推出的大模型系列产品之一无涯·问知,在本次活动上预发布的无涯·问知AIPC版本备受瞩目。这款产品的口号“无涯问知、一问便知”揭示了其核心功能——它能迅速而精准地将各行各业的海量文件资料转化为知识,为用户带来前所未有的便捷体验。



2.英特尔:AI PC 的时代已经到来,将永远改变您的工作方式




英特尔认为,AI PC 提供一系列好处,不仅涵盖效率和生产力,还涵盖安全性甚至内容创建,将改变我们许多人的工作和创作方式。


同时Microsoft的 Copilot 将来将能够在您的 AI PC 上本地运行,在这些以 AI 为中心的设备中需要 NPU(神经处理单元)的强大功能。


在台北举行的 Team Blue AI 峰会上,英特尔证实,下一代 AI PC 的 NPU 将需要达到 40 TOPS(与 AI 任务相关的处理能力的衡量标准)。(pcmag、techradar



3.英特尔AI PC开启商用元年!打造6大AI场景应用,三大AI引擎助力本地跑20B大模型




近日,英特尔重磅推出全新商用客户端AI PC产品,将基于英特尔酷睿Ultra处理器的AI特性扩展至商用领域,在AI PC规模应用元年,踏出行业落地的关键一步。


酷睿Ultra处理器是英特尔40年来最大的架构变革,其首次引入两颗低功耗内核、首次集成独立显卡架构,并集成了NPU(神经元处理器),通过三大AI引擎架构革新,可本地运行200亿参数大模型,无需联网即可秒级生成高质量多模态数据。


本次发布将酷睿Ultra的能力从个人延伸至行业,在视频会议、多媒体处理等商用场景中,相比上一代产品处理器功耗下降最高36%,生产力提升最高47%,视频编辑的AI性能提升2.2倍。


发布会现场,英特尔与超35家ISV(独立软件开发商)及10家OEM(原厂设备制造商)合作伙伴分享了酷睿Ultra在商用AI PC中的应用爆发,全方位瞄准AI Chatbot、AI PC助理、AI Office助手、AI本地知识库、AI图像视频处理、AI PC管理六大AI场景,在经济、物理、数据保密三大AI PC法则的指导下推动各行业数字化转型。


那么,英特尔此次升级的产品点具体有哪些?六大AI场景中,具体有哪些创新应用?为什么说本地生成式AI是必然的趋势?


大数据



4.凭借大数据、人工智能等硬核实力,星环科技荣登“2024上海硬核科技企业TOP100榜单




2024年上海市产业技术创新大会现场,上海市产业技术创新促进会联合市科协发布《2024上海硬核科技企业TOP100榜单》,星环科技凭借在大数据、人工智能等领域的硬核科技创新实力荣登“2024上海硬核科技企业TOP100榜单”。这也是星环科技继2023年入选“上海硬核科技企业TOP100榜单”后,再次入选。


硬核科技是高科技中的前沿技术,也是未来产业发展的航向标。《2024上海硬核科技企业TOP100榜单》是为培育壮大硬核科技企业,推动未来产业创新突破,打造产业创新风向标,在上海市经济信息化委指导下,上海市产业技术创新促进会联合上海产业安全监测与预警研究中心开展硬核科技企业创新指数研究并建立评价指标体系。榜单企业主要集中在“3+6”产业体系,具有较强的创新能力和丰硕的创新成果。



5.全球调查显示,跨各种平台统一数据对于有效人工智能至关重要




GenAI的崛起清楚地表明,如果组织想要在AI 时代竞争,就必须挖掘其数据的隐藏价值。Foundry Media发布的《人工智能时代的数据架构和战略》报告认为,对于希望利用人工智能力量的组织来说,将数据视为关键资产至关重要,而基于业务战略的现代数据架构是基础。


Foundry的研究基于对全球600名IT决策者的调查。为确保数据反映组织的观点,研究仅包括那些担任董事或以上职称的高级职位的受访者。


研究表明,企业看到了现代数据架构的广泛好处,包括简化数据和分析流程(40%),在处理不同类型的数据方面获得灵活性(38%),以及增强数据治理和安全性(37%)。现代数据架构的关键要求之一是拥有一个跨公有云和本地基础设施无缝工作的单一数据平台。


2/3的受访者认为数据湖仓一体有助于降低管道的复杂性,但目前只有2/5的企业使用它们。这表明组织发现集成新的数据管理平台具有挑战性。


该报告还显示,90% 的数据领导者认为,在单一平台上统一数据生命周期对于分析和人工智能至关重要,可以为高级分析和人工智能提供理想的跳板。(datanami.com



6.网易湖仓管理系统Amoro进入 Apache 孵化器




Amoro 项目顺利通过投票,正式进入 Apache 软件基金会的孵化器,成为 ASF 的一个孵化项目。


Amoro 是建立在开放数据湖表格式之上的湖仓管理系统,旨在提供开箱即用的湖仓管理能力,将湖仓的复杂性留给系统,简化给产品和用户。据介绍,Amoro 的功能主要包括:


提供统一的 Catalog 服务,对齐 Hive Metastore、Rest catalog 等开源标准,支持集成 Glue 等商业元仓,帮助引擎和产品构建流批统一的元仓;


提供全托管的湖仓维护功能,包括数据自优化、数据过期、快照清理、元数据同步等,以实现数据在不同引擎之间的高可用性和开箱即用。


支持对接不同的数据湖格式,包括 Apache Iceberg 和 Apache Paimon,以及一种对流批一体场景更加优化的 Mixed 格式。


提供开箱即用的管理工具,包括 DSL 指令、Metrics、Dashboard 等。



7.Astronomer 通过更新Astro简化企业数据编排




现代数据编排领域的领导者Astronomer 发布了最新版本的 Astro 平台,旨在让用户加速创新,同时实现最高水平的治理和合规性。


Astro 是 Astronomer 的 Airflow 即服务平台,现在使数据优先组织能够通过以下功能扩展成本节约、无缝扩展数据操作并简化跨其动态数据平台的数据工作流管理:


·大规模治理:报告仪表板提供对平台使用情况、性能和成本归属的全面洞察,以便做出明智的决策,同时确保遵守 SLA 和合规性标准。这对于跨不同团队管理多个 Airflow 实例特别有用。


·增强的安全性:自定义部署角色使团队能够对 Astro 管理的环境配置更精细的访问控制,确保合适的人能够访问他们需要的功能,同时限制对敏感数据和资源的访问。


·加快开发周期:GitHub 集成简化了代码部署流程,同时实施了最佳实践,并直接在 Astro UI 中提供了对 GitHub 审批工作流程的可见性。这加快了 Astro 的价值实现时间,并为数据工程师促进了更高效、更安全的软件流程。(dbta.com



8.向量搜索和存储是AWS数据库战略的关键




AWS 多年来一直具有矢量搜索和存储功能。例如,Amazon Music 使用向量来响应查询和命令。


现在,AWS 正在为其所有数据库添加矢量功能,以便客户在检索数据时可以使用他们选择的工具来为生成式 AI 模型和应用程序提供信息。谷歌最近也同样将矢量搜索和存储作为重点,开发了具有矢量功能的数据库AlloyDB AI。


数据库 OpenSearch Serverless、Amazon Aurora、Amazon RDS、Amazon Neptune Analytics、Amazon DocumentDB 和 Amazon DynamoDB 现在都具有矢量功能。此外,Amazon MemoryDB for Redis 的矢量功能也处于预览阶段。(techtarget



9.Snowflake Data Clean Rooms增强安全的跨云协作,实现高价值业务成果




Snowflake向 AWS、Azure 的客户推出 Snowflake Data Clean Rooms,彻底改变了各种规模的企业以保护隐私的方式安全地共享数据和协作的方式,从而在数据云中实现高价值的业务成果。


Snowflake Data Clean Rooms使客户能够:


·通过对敏感数据进行安全协作,轻松释放价值,无需额外费用:团队可以快速、轻松地建立新的数据洁净室,而无需额外成本。Snowflake Data Clean Rooms 专为业务和技术用户打造,允许组织通过行业特定的工作流程和模板(如受众重叠、覆盖面和频率、最终接触归因等)更快地从数据中释放价值。


·利用 Snowflake 数据云的开放且可互操作的生态系统:连接到 Snowflake 开放、中立且可互操作的数据洁净室生态系统,提供跨扩充、身份、激活和公共云提供商的交钥匙第三方集成和解决方案。客户可以与业务合作伙伴无缝协作,无论他们是否已经在 Snowflake 上。


·利用 Snowflake 内置的隐私和治理功能:Snowflake Data Clean Rooms 基于 Snowflake 原生应用程序框架(在 AWS 和 Azure 上正式发布,在 GCP 上提供个人预览版)构建,可处理您的数据,无需数据离开 Snowflake 的治理、安全和隐私参数,并帮助客户维护隐私,同时允许与业务合作伙伴进行更深入的分析见解。


数据库



10.某国产数据库厂商退出关系型数据库市场




腾讯公众号发文,TDSQL、腾讯DTS-DBbridgeV2.0(迁移工具)与巨杉数据库完成兼容适配。腾讯的文章更是单方向地表示,可以将巨杉数据库顺利迁移到TDSQL。


巨杉公众号发文“国产数据库需要减法思维”,而后删除;随后重新措辞“SequoiaDB聚焦文档型数据库的产品减法思维”再次发布。


巨杉表明,重新聚焦核心技术,停止发展偏离自身核心的“关系型”特性。



11.海致星图参与的国家重点研发计划“基于新型硬件的原生数据库系统”项目启动




3月27日,国家重点研发计划“基于新型硬件的原生数据库系统”项目启动,海致星图作为“新硬件架构下的多模数据库系统”的课题承担单位,将为大规模数据量及高并发使用环境下新型数据产品的开发与应用提供技术保障。


对于新型硬件如CXL和NVM带来的带宽和数据访问效率的提升,传统的数据库系统已经难以满足当下海量数据的处理需求。因此,海致星图与国家重点研发计划紧密合作,从高效数据组织子系统、共享内存池化子系统、异构统一执行子系统、多模查询优化子系统四个研究内容出发,利用新型硬件特点,结合软硬协同优化、记录级数据组织、共享内存池化、异构智能计算等技术,打造可以应对多种模型、面向海量数据的多模数据库平台。



12.Linux基金会支持 Redis 的“Valkey”开源分支




Linux 基金会已经分享了其创建 Valkey 作为自己的 Redis 替代品的意图。Redis 是一种流行的开源内存 NoSQL 键/存储,主要用作快速响应数据库或应用程序缓存。


Valkey 由 Redis 贡献者开发,旨在进一步开发开源、内存中的 NoSQL 数据存储,作为 Redis 的强大替代品。新平台得到了包括谷歌、AWS、甲骨文和 Snap Inc. 在内的主要科技公司的支持。


Valkey 本质上是 Redis 的一个分支。分叉是复制代码库,然后独立于创建者开发它的过程。


Valkey 的推出是为了响应Redis最近的许可变更,Redis最近宣布他们正在将软件从开源许可转变为专有许可。Valkey 现在将使用 BSD 3 条款许可证,该许可证直到最近才涵盖 Redis 的开源平台。



13.Microsoft推出适用于Azure SQL数据库的Copilot




Microsoft 宣布在 Azure SQL 数据库中推出 Copilot 的私人预览版,这是一个 AI 助手,通过提供自然语言到 SQL 的转换以及数据库管理的自助服务来提高 Azure 门户的生产力。


Microsoft说,Azure SQL 数据库中的 Copilot 使 Azure 门户查询编辑器能够将自然语言查询转换为 SQL,使数据库交互更加直观。此外,Azure Copilot 集成将 Azure SQL 数据库技能添加到 Microsoft Copilot for Azure 中,提供自助帮助,使用户能够独立管理数据库和解决问题。(infoworld


数据安全



14.国密认证!星环科技分布式交易型数据库KunDB通过商用密码产品认证




近日,星环科技自主研发的分布式交易型数据库KunDB顺利通过了GM/T 0028《密码模块安全技术要求》安全等级第二级认证,获得了由国家密码管理局商用密码检测中心颁发的《商用密码产品认证证书》,标志着星环科技分布式数据库产品在密码算法的安全性、实现的正确性、密码模块的安全管理及物理安全等方面均达到了国家标准,能够为用户提供更加安全、可靠的数据服务。


此外,KunDB通过了信通院第十五批”可信数据库“关系型数据库安全专项评测,包括用户标识与身份鉴别、访问控制、数据存储安全、数据通信安全和安全审计5大项共26项评测,体现了其卓越的安全能力。



15.云数据隐私解决方案提供商Skyflow融资3000 万美元以增强数据隐私保险库




云数据隐私解决方案提供商 Skyflow 宣布,已筹集了3000万美元的新资金,用于扩展其隐私保险库解决方案,并满足复杂的数据本地化要求,因为人们对 AI 应用程序中的敏感数据保护越来越关注。


Skyflow 成立于 2019 年,提供与任何技术堆栈集成的数据隐私保险库,该公司表示,可以轻松地在任何应用程序、数据云和大型语言模型中执行隐私政策。该保管库旨在简化公司隔离、保护和管理客户最敏感数据的方式。它为希望安全实施 LLM 并满足复杂数据本地化要求的公司提供了一个全球数据隐私保险库网络。


该公司认为,随着LLM的采用率越来越高,很少有数据保护机制,使合规性、安全和隐私面临风险。在他们看来,问题在于,一旦敏感数据进入模型,几乎不可能删除,这使得数据删除请求(根据新的隐私法的要求)变得更加困难。


Skyflow 充当隐私信任层,帮助公司从一开始就防止敏感数据进入 AI 模型。客户可以根据需要定义敏感术语,从而保护敏感信息,甚至超出个人身份信息或公司知识产权。


该公司使用一种称为“多态加密”的专有技术提供服务。据说Skyflow设计的加密方法可以保护数据,而不会牺牲其对关键业务运营(如分析,营销和客户支持)的可用性。



16.数据安全初创公司Bedrock Security筹集1000 万美元,用于通过基于 AI 的推理增强大数据安全性




数据安全初创公司Bedrock Security已经完成了由Greylock领投的1000万美元种子轮融资,并宣布推出其“无摩擦数据安全”平台,据称该平台通过不断发现、管理和保护公司最敏感的信息来帮助公司。


数据安全平台由业界首创的人工智能推理引擎提供支持,该引擎依靠人工智能自动理解新数据对公司的意义。Bedrock Security表示,通过了解新数据在生成时的重要性,它可以帮助公司在不中断业务运营的情况下保护其最有价值的资产。最重要的是,它还为使用生成式 AI 模型的组织提供了强大的保护,具有各种功能,可确保这些算法无法访问敏感信息。


AIR Engine 使各种规模和任何行业的公司都能以自动化方式保护机密数据并管理相关风险。这个想法是帮助组织从头开始创建一个强大的数据安全计划,这是“大数据”呈指数级增长的基本要求。



17.谷歌同意删除大量用户数据以解决“隐身”诉讼




在一项涉及在线隐私的重大发展中,谷歌已同意销毁数十亿条数据记录,解决了一起集体诉讼,该诉讼指控这家科技巨头秘密跟踪那些认为自己以私人模式浏览的用户。


原告对和解的估值超过50亿美元,但根据协议条款,谷歌不会支付任何赔偿金。但是,用户可以单独向公司寻求赔偿。


该诉讼于2020年启动,声称谷歌从其Chrome网络浏览器用户那里收集了数据,即使他们激活了其“隐身”功能,旨在防止此类跟踪。尽管有隐私浏览选项,但该诉讼指控谷歌在网站上的工具,包括其广告技术,继续收集用户数据。


去年12月达成的和解协议还包括谷歌承诺加强其披露政策。(CSO)


AI



18.2024年中国AI大模型产业发展报告发布,展望五大趋势




人民网&至顶科技发布的《2024年中国AI大模型产业发展报告——开启智能新时代》。报告认为:


中国AI大模型产业的发展受到政策、技术和市场的三重驱动。政策层面,国家发布了多项支持AI发展的政策;技术层面,Transformer架构等关键技术的发展推动了大模型的快速进步;市场层面,多领域对AI大模型的需求不断增长。


AI大模型产业在发展中遇到了算力瓶颈、架构局限性、高质量训练数据集不足和缺乏爆款应用等问题。


未来AI大模型将更加注重云侧与端侧的结合,满足不同用户需求,特别是C端用户。大模型将趋向通用化和专用化,垂直行业将成为主要应用场景。开源将成为大模型发展的趋势之一,有助于小型开发者提升开发效率。同时,AI高性能芯片的不断升级将促进大模型产业生态体系的完善。



19.大模型新王诞生!Claude 3首次超越GPT4




聊天机器人竞技场Chatbot Arena更新对战排行榜,Claude 3反超GPT-4,一举摘得“最强王者”桂冠。


这次登顶榜首的是Claude 3系列的超大杯Opus,它以2分Elo的微弱优势,险胜GPT-4-1106-preview模型,GPT-4-0125-preview位列第三。



20.国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok




国内独角兽企业APUS(麒麟合盛)联合新旦智能训练的大模型APUS-xDAN 大模型4.0(MoE)将于近日宣布开源。


APUS-xDAN 大模型4.0(MoE)是国内首个千亿以上参数MoE架构的开源大模型,参数规模为1360亿,这也是目前国内参数规模最大的开源模型。此前国内开源的大模型中,参数规模最大的是阿里720亿参数的千问72B,参数规模为720亿。


此外,APUS-xDAN 大模型4.0(MoE)还是国内首个支持在4090低端算力上训练的千亿参数开源大模型,通过MoE架构和算法优化实现了对低端算力芯片的适配。



21.大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起




云天励飞正式发布“深目”AI 模盒。该产品能够做到“3 个 90%”——覆盖场景超过 90%、算法精度超过 90%,使用成本降低 90%,解决大模型在场景落地最后一公里的问题,帮助更多中小企业客户轻松使用大模型。


云天励飞还与鹏城实验室、之江实验室、中国电子、华为、华润数科等单位成立“深目 2.0”生态联盟,共同探索更多大模型落地应用路径。


云天励飞还宣布“云天天书 -2.0-68B”版本免费向合作伙伴开放,即日起预订“深目”AI 模盒,即有机会获得邀约测试的机会。



22.OpenCSG将开源大模型的微调项目 LLM-Finetune项目




对于开发人员来说持续迭代更新大模型技术是保证不落后的基础,开放传神(OpenCSG)在此之前开了大模型的推理项目、开源代码大模型等项目,这一举动在业界引起开发者的共鸣,OpenCSG将再次开源大模型的微调项目 LLM-Finetune项目。


LLM-Finetune项目是一个专注于大模型微调技术的Python项目,它极大地简化了微调过程,提高了效率和可扩展性。用户可以通过以下几个步骤来利用LLM-Finetune进行模型微调:


模型配置灵活:用户首先需要根据项目提供的YAML文件模板,配置用于微调的参数。这些模板包含了一些常用的模型微调配置,用户可以根据自己的需求进行选择和修改。


一键式启动:配置好YAML文件后,用户可以通过命令行工具一键启动微调过程。这个过程是自动化的,能够根据集群中的资源情况智能地进行资源的扩展和释放,确保微调过程的高效运行。


微调过程可精确配置:在YAML配置文件中,用户可以详细设定微调的各种参数,如学习率、checkpoints的存储方法和策略、最大长度、微调的最大步数等。这些配置项让用户能够精细控制微调过程,以达到最佳的微调效果。


定制化模型微调方案:LLM-Finetune项目支持用户通过YAML模板快速定制化模型微调方案。这意味着用户可以根据自己的特定需求,快速创建适合自己的微调方案,而无需从头开始编写复杂的配置。


更多模型支持:项目不仅支持一些常用的模型,还持续增加对更多模型的支持,支持量化模型训练。这样,用户可以选择更多的预训练模型进行微调,满足不同应用场景的需求。



23.百度智能云发布 Baidu Comate 2.0,个人开发者可免费使用




百度智能云在“AICloud Day:大模型应用产品发布会”上,正式发布Baidu Comate2.0版本。Baidu Comate作为全栈智能代码助手,已覆盖100多种主流开发语言、支持常用IDE。目前,已有超过10000家企业注册试用Comate,企业客户的采纳率近50%。Comate2.0版本也向个人开发者免费开放使用,目前,单行/多行续写、生成单元测试、多条推荐、注释生成代码等基础功能已经可无限次使用。



24.Activeloop筹集了1100万美元,发展用于AI训练和推理的专用张量数据库




Activeloop是一家专门针对人工智能工作负载的数据库平台的创建者,已经完成了1100万美元的早期融资,使其筹集的总金额达到约2000万美元。


这家初创公司创建了一个名为Deep Lake的专用数据库,旨在简化非结构化信息(如音频、视频、图像、文本文件和嵌入)到机器学习和大型语言模型中的流动。它还提供数据存储和知识检索功能,用于管理 AI 的复杂数据集。Deep Lake是一个开源平台,下载量已超过100万次。


Deep Lake解决了为AI解锁多模态数据的问题,而传统数据库在很大程度上无法访问这些问题。它通过以所谓的“张量格式”存储非结构化数据文件来实现这一点,张量格式是机器学习原生的数学表示,使这些信息随时可供 AI 算法使用。

END




文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论