行业快讯与友商动态 2024年第7期:
文本生成视频等大模型应用不断推出,给众多从业者带来更大的焦虑,而无法忽视的迷幻问题,以及安全隐忧也让监管部门忧心忡忡。
上周,谷歌暂时关闭了Gemini由文生成视频的功能,大模型的“幻觉”正在折磨众多的用户。
本周推出的两款向量数据库,以及大模型微调工具,都将目标对准了大模型的“幻觉”问题,为大模型行业应用解决最根本的问题。
同时,MySQL分支数据库MariaDB叫好不叫座,替代MySQL的希望破灭。同时,太多开源数据库的前途也令人怀疑。
本周焦点
1.生成式AI的未来看什么?星环科技入选IDC“中国生成式AI市场生态图谱”
2.Magnificent 7?FAANG股票?这7家企业靠科技让你财富翻百倍,却不断裁员
3.如何避免知无不言、言无不尽——大模型训练数据泄露的隐忧
4.大模型的阴面:无法忽视的安全隐忧
大数据
5.“数易贷”首笔数据资产质押贷款发放!建行基于数据资产凭证开展信贷业务
6.中国矿产5亿元成立大数据公司,运营商再添劲敌与盟友
7.Salesforce推出 Tableau Pulse,通过生成式AI和分析加快决策速度
8.将零代码平台的优势与 BI 分析的需求相结合,零代码BI平台motor-admin开源!
9.OpenSearch LLM 智能问答版上线
10.苹果开源可提升Apache Spark向量处理速度的插件 Apache Spark DataFusion Comet
11.公有云数据备份和恢复Clumio完成7500万美元融资和4倍的ARR同比增长
数据库
12.Pinecone无服务器向量数据库公开预览,提高生成式AI的准确性
13.向量数据库Zilliz Cloud再发新版本,性能提升10+倍,AI应用开发流程再简化!
14.市值缩水超90%!MariaDB或以3730万美元抄底价卖出,MySQL替代中道崩殂?
15.Hyper-Q平台与PostgreSQL v16.x相结合,Datometry推出OpenDB v2
16.Apica收购时序数据库企业Circonus,转发可观测性和数据管理成功
数据安全
17.工信部《工业领域数据安全能力提升实施方案(2024—2026年)》,基本建立数据安全保障体系
18.Microsoft 发布用于查找 AI 模型风险的自动化 PyRIT 红队工具
AI
19.谷歌暂时关闭了 Gemini 创建带有人的 AI 图像的能力
20.苹果放弃造车,转向GenAI
21.「春秋」靶场构建大型模型、安全竞技大型模型和人才评估大型模型推出
22.华为发布通信行业首个大模型
23.Predibase推出LLM微调工具LoRA Land
24.Guardrails AI 承诺以750的种子资金阻止困扰 LLM 的“幻觉”
本周焦点
1.生成式AI的未来看什么?星环科技入选IDC“中国生成式AI市场生态图谱”
近日,国际权威IT咨询机构IDC发布了《IDC Market Glance: 中国生成式AI市场概览》报告分析了当前市场的整体情况以及市场格局,通过中国生成式AI市场生态图谱V1.0和代表厂商分析,旨在为生成式AI的未来发展提供参考。星环科技凭借在大模型领域的深耕布局和技术实力,入选IDC“中国生成式AI市场生态图谱V1.0”。
在大模型领域,星环科技发布了一系列工具产品供用户使用,助力企业抓住大模型时代的新机遇。工具链方面,发布了大模型外挂存储分布式向量数据库Hippo、大模型预训练微调工具Sophon LLMOps及自动化知识库构建工具TKS。预训练大模型方面,发布了金融大模型星环无涯(Infinity)和数据分析大模型星环求索(SoLar)。用户可以通过星环科技自动化知识工程、多模态数据处理等技术,有效降低企业构建自有大模型应用的门槛,并不断促进我国大模型生态的持续繁荣。
目前星环科技大模型产品已经在政府、金融、运营商、制造、能源等多个行业有诸多落地案例。
2.Magnificent 7?FAANG股票?这7家企业靠科技让你财富翻百倍,却不断裁员
2024年伊始,科技行业就出现了大规模裁员。TechCrunch报道称,仅1月份,谷歌、微软、eBay、SAP以及Salesforce等公司就裁员超过23,000人。
而德意志银行(Deutsche Bank)的最新研究,所谓的“壮丽7国”现在拥有比世界上几乎所有其他主要国家都更强大的金融实力。
德意志银行(Deutsche Bank)分析师强调,仅Magnificent 7的总市值就将使其成为世界第二大国家证券交易所,是第四大日本的两倍。
Microsoft和苹果的市值分别与法国、沙特阿拉伯和英国的所有合并上市公司相当。
所谓的“壮丽7”美国科技巨头包括苹果、亚马逊、Alphabet、Meta、Microsoft、英伟达和特斯拉。
该银行在一份研究报告中表示,美国这七大科技巨头的利润和市值迅速增长,几乎超过了每个G20国家的所有上市公司。非美国G20国家中,只有中国和日本上市公司利润超过这七家之和。
然而,这种集中程度导致一些分析师对美国和全球股市的相关风险表示担忧。
3.如何避免知无不言、言无不尽——大模型训练数据泄露的隐忧
在人工智能的快速发展中,大型语言模型(LLMs)如GPT-3和GPT-4因其卓越的语言处理能力而成为研究热点。然而,随着这些模型能力的增强,它们在训练过程中记忆训练数据的能力也随之增强。这种记忆能力带来了一个关键问题:在特定的攻击手段下,这些模型可能会泄露训练数据。
近期,对新型GPT模型(如GPT-4)中可能存在的隐式数据泄露引发了广泛的担忧。这种泄露不仅可能包括一般的文本信息,还可能涉及个人身份信息(PII)、商业敏感数据甚至版权受保护的内容。随着这些模型在各种应用中的部署,如客户服务、内容创作和数据分析,这种数据泄露的风险成为一个不可忽视的问题。
4.大模型的阴面:无法忽视的安全隐忧
在AI大模型的身上,竟也出现了“to be or not to be”问题。
争议是伴随着大模型的能力惊艳四座而来的,争议的核心问题在于安全。安全有两个方面,一个是大模型带来的对人类伦理的思考,一个是大模型本身带来的隐私泄漏、数据安全等问题。
埃隆·马斯克应该可以说是对大模型发起质疑的企业家之一。早在ChatGPT诞生之初,马斯克等一千多名业界、学界人士联署发表公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统,暂停至少6个月。
时至今日,马斯克依旧对外表达的态度是,人工智能是一把双刃剑,对人工智能方面的监管是强烈共识,可能会出现某种形式的监管机构。
围绕着AI大模型的安全,不少国内专家学者以及企业家们也有了更多的思考和发声。9月初,中国科学院院士何积丰曾发言谈到,目前大模型面临的安全问题涵盖两方面,分别是隐私保护和价值观对齐两大难题。
大数据
5.“数易贷”首笔数据资产质押贷款发放!建行基于数据资产凭证开展信贷业务
中国建设银行上海市分行与上海数据交易所深度合作,成功发放首笔基于上海数交所推出的数据资产信贷服务产品“数易贷”的数据资产质押贷款,标志着上海金融产品和服务创新的又一次重要跃升,将成为数据资产创新应用的典型示范案例。
“数易贷”是由上海数交所主导,并联合多家银行共同推出的数据资产信贷服务产品。上海数交所将以企业的数据资产为核心,为银行提供一个创新、高效且风险可控的贷款投放渠道,充分体现数据资产在银行信贷业务中的关键价值,促进银行等金融机构服务数据实体经济发展,共同繁荣数据要素市场。
6.中国矿产5亿元成立大数据公司,运营商再添劲敌与盟友
近日,中国矿产资源集团大数据有限公司(以下简称该大数据公司)成立,注册资本5亿元,注册地河北省雄安新区启动区中谷甲1号,经营范围含工业互联网数据服务、数据处理服务、大数据服务、互联网安全服务、互联网销售、在线数据处理与交易处理业务等。股东信息显示,该公司为中国矿产资源集团有限公司全资控股。
7.Salesforce推出 Tableau Pulse,通过生成式AI和分析加快决策速度
Salesforce推出Tableau Pulse,让客户能够通过可信的生成式 AI 和分析,更轻松、更快地做出决策。Tableau Pulse免费包含在所有Tableau Cloud版本和嵌入式分析解决方案中。
Tableau Pulse使用生成式 AI 以自然语言和视觉格式提供见解,从而更轻松地发现重要指标、获取见解、提出问题以及将数据与真实业务环境联系起来。此外,借助通过 Einstein Trust Layer(Salesforce 平台原生内置的安全 AI 架构)运行的 AI 功能,Pulse 允许团队在不损害客户数据的情况下从生成式 AI 中受益。
Tableau Pulse 功能包括:
·Tableau Pulse Insights Platform,可自动检测业务用户在工作流程中关心的指标的驱动因素、趋势、参与者和异常值,以帮助他们更快、更明智地做出决策。例如,Pulse 可以使用自然语言和简单的视觉解释主动提醒营销领导者活动绩效下降。然后,Pulse 可以帮助营销人员识别一段时间内的趋势,确定这些指标是在预期范围内还是在预期范围内,并提供建议以帮助他们让活动重回正轨。
·Tableau Pulse on Mobile,可直接在用户的移动设备(包括 Tableau Mobile、Slack 和电子邮件)上以自然语言主动为用户提供数据见解。
·Tableau Pulse Slack 摘要,它使用 Tableau for Slack 应用在首选的 Slack 频道中共享 AI 生成的摘要和有关关键指标的上下文见解。
·Tableau Pulse 指标层,可帮助分析师轻松创建标准指标定义,这是一组元数据,用于确定指标的含义和业务上下文。Tableau Pulse 只允许对一组元数据进行一个衡量指标定义,从而为客户提供单一事实来源。
Tableau Cloud 是一个快速灵活的分析平台,可帮助业务用户自信地更快地做出数据驱动的决策。新功能包括:
·Tableau Cloud AWS Marketplace 可用性,允许客户通过 AWS Marketplace 管理 Salesforce 产品,包括使用 Tableau 进行高级数据分析。它可帮助 IT 领导者在一个地方简化计费、简化采购并全面了解 IT 支出。
·在数据云中创建可视化区段,使数据分析师能够直接通过在 Tableau 中浏览可视化数据,轻松地在数据云中创建区段。例如,数据分析师可以使用 Tableau Cloud 中的空间映射功能,根据地图上任意的邮政编码集合创建地理区段,然后将这些受众区段引入 Data Cloud,以根据客户的位置启动营销活动。数据云使公司能够将所有被捕获的数据导入 Salesforce,以构建所有产品、服务和交互的客户 360 度视图。
·扩展的数据存储,使客户能够在 Tableau Cloud 中使用更多数据,具有 1 TB 的数据存储空间和 5 TB 的高级管理空间。(salesforce.com)
8.将零代码平台的优势与 BI 分析的需求相结合,零代码BI平台motor-admin开源!
motor-admin 作为一个零代码的管理面板,确实非常适合用于企业级的 BI(商业智能)分析。通过将零代码平台的优势与 BI 分析的需求相结合,motor-admin 可以成为一个强大的企业级分析工具,帮助企业用户更快速、更高效地获取有价值的业务洞察。
零代码平台的主要优势在于它们能够允许用户通过图形化界面和预配置的功能模块来快速搭建应用程序,而无需编写任何代码。在 BI 分析的上下文中,这意味着企业用户可以更快速地创建和部署自定义的分析工具,以满足特定的业务需求。
motor-admin 作为企业级 BI 分析工具的一些关键优势包括:
·快速部署和配置
·易于使用的界面
·高度可定制
·集成能力
·数据安全性
·可扩展性
·实时分析
9.OpenSearch LLM 智能问答版上线
OpenSearch LLM智能问答版是阿里云推出的一站式RAG解决方案,内置大语言模型,可基于业务数据搭建企业专属模型,支持丰富数据格式的快速导入,构建包括对话、链接、图片在内的多模态搜索服务,帮助开发者一站式快速搭建RAG系统。
本问答知识库来自千万级博客阅读量的资深 Elastic技术专家铭毅天下的新书《一本书讲透Elasticsearch》,包含Elasticsearch 基础知识、关联技术、核心能力及实践,覆盖检索系统、大数据可视化系统、日志系统等业务场景,融合全球数百家企业的近 2000 名Elastic爱好者的实战经验,旨在帮助开发者深入了解Elasticsearch的核心技术和应用场景。
10.苹果开源可提升Apache Spark向量处理速度的插件 Apache Spark DataFusion Comet
消费电子巨头苹果公司发布了一个开源插件,可以帮助 Apache Spark 更有效地执行向量搜索,使开源数据处理平台在大规模机器学习数据处理方面变得更有吸引力。
这个基于 Rust 的插件名为 Apache Spark DataFusion Comet。苹果工程师已经将其提交给了 Apache 软件基金会,使其成为 Apache Arrow 项目下的一个子项目。该插件是以可扩展的 Apache DataFusion 查询引擎(也是用 Rust 编写的)和 Arrow 列式数据格式为基础构建的。
该项目的功能尚未全部开发完成,但部分功能已经应用于生产环境。
Apache Arrow 项目管理委员会主席 Andy Grove 在 X 上指出:“对于最近每个人都在谈论的可组合数据系统概念,这就是一个很好的例子。利用 Spark 非常成熟的计划和调度,并将其委托给 DataFusion 进行本地执行。”
11.公有云数据备份和恢复Clumio完成7500万美元融资和4倍的ARR同比增长
公有云数据备份和恢复领域的领导者Clumio宣布获得7500万美元的D轮融资,.这笔投资将用于加速公司的创新和上市,从根本上简化公有云客户的备份和恢复。Clumio现在已经筹集了2.61亿美元。
Clumio 还宣布,2023年的年度经常性收入(ARR)将增长 4 倍。
在公有云备份和恢复方面,如今大多数企业都依赖于快照和副本等基本工具。然而,这些缺乏企业级操作所需的优化、可观察性和安全性,很快就会变得复杂且管理成本高昂。Clumio——唯一的无服务器备份解决方案 — 通过一个自主、默认气隙和不可变的平台克服了这些挑战,该平台可主动监控合规性并降低成本。
“客户在公共云中已经达到了成熟点,备份和恢复关键数据现在是重中之重,”Clumio联合创始人兼首席执行官Poojan Kumar说。“这是他们运营弹性、勒索软件恢复和监管合规需求的基础。由于传统的备份和恢复供应商不是针对公有云应用程序构建的,因此 Clumio 看到了云数据库、数据湖和高性能存储的大量需求。我们将利用我们的D轮融资来加速我们在这些领域的发展势头,跨越主要的云提供商。(clumio.com)
数据库
12.Pinecone无服务器向量数据库公开预览,提高生成式AI的准确性
最近,Pinecone 宣布了其新的无服务器向量数据库的公共预览,旨在降低基础设施管理成本,同时提高生成式人工智能应用的准确性。
根据向量数据库专家的说法,读、写和存储的分离显着降低了各种规模和类型的工作负载的开销。多租户计算层使用新的索引和检索算法实现了按需检索,从而实现了对 blob 存储进行内存高效的向量搜索。
与基于pod的索引类似,Pinecone无服务器支持实时索引更新、元数据过滤、混合搜索和命名空间。
据 Pinecone 称,检索增强生成 (RAG) 将大型语言模型 (LLM) 与向量数据库结合起来,通过三种不同的方式增强 LLM 的知识:RAG 可以提供最新信息,利用领域外知识,并解决幻觉问题。
Pinecone 并不是市场上唯一支持无服务器向量存储的参与者,其他数据库和数据平台供应商也提供了支持向量的无服务器数据库,包括 MongoDB和 Snowflake。
13.向量数据库Zilliz Cloud再发新版本,性能提升10+倍,AI应用开发流程再简化!
Zilliz Cloud 再发新版本!本次新版本的主要内容包括:大幅提升的向量搜索性能(性能提升 10 倍以上)、企业级数据安全和无缝数据集成。
Cardinal 搜索引擎搜索速度提升 10 倍,数据容量提升 50%。Cardinal 是用现代 C++ 语言和实用的近似最近邻搜索(ANNS)算法构建的多线程、高效率向量搜索引擎。它同时能够处理暴搜请求和 ANNS 索引修改请求;处理各种数据格式,包括 FP32、FP16 和 BF16。Cardinal 搜索引擎强调速度和效率,能够在有限的资源内处理更多用户请求。
新版本发布后,用户无需自定义代码,便可快速顺畅地完成非结构化数据处理和索引。
此外,Zilliz Cloud 将有效帮助用户节省成本,简化支付和采购流程。
14.市值缩水超90%!MariaDB或以3730万美元抄底价卖出,MySQL替代中道崩殂?
2 月 19 日,MariaDB 发布公告称正在积极寻求收购。作为同名开源关系数据库管理系统(RDBMS)背后的运营厂商,MariaDB 已确认收到了来自加利福尼亚州投资管理公司 K1 Investment Management 的临时收购要约。
K1 也已经于上周五低调透露,其已经向 MariaDB 递交了所谓“主动提出且不具现实约束力的指导性提案”。顾名思义,这是一份非约束性探索提议,具体内容将根据未来几周的谈判进展而随时调整。提案内容包括以每股 0.55 美元价格收购所有 MariaDB 股票,这一估值基于 MariaDB 公司 2 月 5 日收盘日的估值,总交易金额约为 3700 万美元。但提案并未确定收购要约的具体交易形式。
值此消息发布之际,MariaDB 公司正身陷一系列重大动荡。除了走马换将迎来新任 CEO 之外,MariaDB 还因剥离数据库即服务以及地理空间业务而进行了大规模裁员。
15.Hyper-Q平台与PostgreSQL v16.x相结合,Datometry推出OpenDB v2
数据库虚拟化领域的先驱 Datometry 通过 AWS Marketplace 推出 OpenDB v2.0。OpenDB 将 Datometry 屡获殊荣的Hyper-Q 平台与 PostgreSQL v16.x 相结合,树立了新的标准,为客户提供了Oracle 数据库替代品。
OpenDB 是与 Oracle 兼容的数据库。在 OpenDB v2 中,Datometry 提供了增强版本,包括额外的功能支持和客户反馈工具。通过用 OpenDB 取代 Oracle,企业可以节省大约 79% 的许可费用,同时获得相同的处理能力和功能。
以传统方式将工作负载从 Oracle 迁移到 PostgreSQL 的转换成本约为 Oracle 年度许可费的 10 倍。一个企业每年在甲骨文上花费100万美元,预计在几年内取代甲骨文的总费用为1000万美元。借助 Datometry,他们可以将这一成本降低至少 75%。(datanami.com)
16.Apica收购时序数据库企业Circonus,转发可观测性和数据管理成功
数据管理和主动可观测性提供商 Apia 宣布最近收购遥测数据公司 Circonus,以及由 Riverside Acceleration Capital (RAC) 领投的新一轮融资。
Circonus 是可观测性的先驱,专注于为拥有大量遥测数据的企业提供监控和分析解决方案。该公司的两款产品——IRONdb 和 Passport——将集成到 Apia 的 Ascent 平台中。
IRONdb 是 Cironus 的时间序列数据库,在设计时考虑到了高基数,为数据管理团队面临的关键时间序列挑战提供补救措施。Passport 是一种可观测性解决方案,它使数据团队(因大量遥测数据而陷入困境)能够收回对遥测代理的控制权。(dbta.com)
数据安全
17.工信部《工业领域数据安全能力提升实施方案(2024—2026年)》,基本建立数据安全保障体系
工业和信息化部印发《工业领域数据安全能力提升实施方案(2024—2026年)》,提出到2026年底,我国工业领域数据安全保障体系基本建立。数据安全保护意识普遍提高,重点企业数据安全主体责任落实到位,重点场景数据保护水平大幅提升,重大风险得到有效防控。数据安全政策标准、工作机制、监管队伍和技术手段更加健全。数据安全技术、产品、服务和人才等产业支撑能力稳步提升。
关键指标包括:基本实现各工业行业规上企业数据安全要求宣贯全覆盖;开展数据分类分级保护的企业超4.5万家,至少覆盖年营收在各省(区、市)行业排名前10%的规上工业企业;立项研制数据安全国家、行业、团体等标准规范不少于100项;遴选数据安全典型案例不少于200个,覆盖行业不少于10个;数据安全培训覆盖3万人次,培养工业数据安全人才超5000人。
18.Microsoft 发布用于查找 AI 模型风险的自动化 PyRIT 红队工具
负责使用黑客策略发现网络安全问题的Microsoft 团队开源了一个内部工具PyRIT,可以帮助开发人员发现其人工智能模型中的风险。
PyRIT可以自动生成数千个对抗性AI提示,以测试神经网络是否有效地抵御黑客攻击。该工具旨在处理文本,但允许开发人员添加对其他类型的AI 输入(如图像)的支持。
PyRIT最初是Microsoft的AI Red Team为内部使用而开发的脚本集合。该团队负责模拟针对新人工智能模型的网络攻击,以便在黑客之前发现弱点。研究人员稳步扩展了脚本,增加了其他功能,直到代码库发展到本周发布的框架PyRIT。
开发人员必须测试新创建的 AI 模型是否存在多种类型的风险,然后才能将其部署到生产环境中。他们必须搜索网络安全风险,例如可能导致模型写入恶意软件的提示。软件团队还需要寻找人工智能可能产生幻觉的情况,并确定它是否可以被诱骗从其训练数据集中泄露敏感信息。
使任务更加复杂的是,一些模型不仅生成文本,还生成其他类型的输出,如图像。漏洞测试必须分别在每种输出类型以及用户与 AI 交互的每个软件界面上重复。这些因素意味着,彻底测试神经网络需要开发人员制作多达数千个对抗性提示,这通常是不切实际的。
Microsoft创建了PyRIT来消除该限制。据该公司称,该框架允许开发人员指定某种类型的对抗性 AI 输入,并自动生成数千个符合标准的提示。这些提示可用于测试以 Web 服务形式实现的 AI,以及通过应用程序编程接口提供的模型。(siliconangle.com)
AI
19.谷歌暂时关闭了 Gemini 创建带有人的 AI 图像的能力
谷歌周四宣布暂停其双子座Gemini AI 人工智能图像生成功能,原因是高大模型在历史图片中提供了“不准确之处”,并将很快重新发布“改进”版本。
社交媒体上的用户一直在抱怨人工智能工具将历史人物(如美国开国元勋)的图像生成为有色人种,称这是不准确的。
研究表明,人工智能图像生成器可以放大其训练数据中发现的种族和性别刻板印象,并且当被要求在各种情况下生成一个人时,如果没有过滤器,则更有可能显示肤色较浅的男性。
谷歌周三在X上的一篇文章中表示,人工智能功能可以“产生各种各样的人。这通常是一件好事,因为世界各地的人们都在使用它。”但它表示,该软件功能“在这里没有达到目标,正在努力立即改进。”
谷歌试图赶上Microsoft支持的OpenAI。Gemini AI 图像生成器工具于2月初通过 Gemini(以前称为 Bard)推出。
20.苹果放弃造车,转向GenAI
苹果公司在周二在内部一次约12分钟的简短会议上披露,将取消筹划长达十年的造车计划,转而投向生成式AI。
苹果汽车团队目前有近 2000 名员工,还拥有数百名硬件工程师和车辆设计师。他们有可能内部转岗,或者裁员。
作为苹果造车计划的主要竞争对手之一,特斯拉公司负责人埃隆·马斯克也庆祝了这一举措。他在 X 上发了一条帖子,里面有一个敬礼的表情符号和一支香烟。
苹果在智能手机领域的一些亚洲竞争对手在设计和制造汽车方面投入了大量资金。Android智能手机制造商小米投入100亿元研发EV汽车,最近宣布了一款新的电动汽车,并将目标瞄准2000万智能手机高端用户。苹果的主要制造合作伙伴富士康去年表示,它将生产电动汽车。(CNBC.COM)
21.「春秋」靶场构建大型模型、安全竞技大型模型和人才评估大型模型推出
永信至诚公司推出了三款革命性的产品:「春秋」靶场构建大型模型、「春秋」安全竞技大型模型和「春秋」人才评估大型模型。
这三款AI大型模型产品通过集成和智能化设计,显著降低了用户使用安全技术产品的难度,提升了操作体验。在网络靶场构建、安全竞技组织和人才测评等方面,它们解决了一系列现实问题,并通过智能对话交互实现了快速准确的场景构建、赛事演练组织和人才评价,从而大大提高了安全工作的效率和准确性。
据数据显示,永信至诚公司的AI春秋大型模型产品在安全领域的应用效果显著,用户体验得到了普遍认可。其中,「春秋」靶场构建大型模型在模拟网络环境方面的准确率超过了90%,「春秋」安全竞技大型模型在实战演练中表现出色,有效提高了团队的协作能力,而「春秋」人才评估大型模型在快速准确评估人才技能方面发挥了重要作用。
22.华为发布通信行业首个大模型
2月26日,在MWC24巴塞罗那展期间,华为发布了通信行业首个大模型。针对行业提出的敏捷业务发放、精准用户体验保障、跨领域高效运维的高阶智能化目标,该大模型提供基于角色和基于场景的智能化应用,旨在提供网络生产力。
据悉,华为通信大模型是一款基于AI的商用大模型,采用先进的技术和算法,用于优化通信网络性能、智能调度资源等,大幅提高网络效率和智能化水平,成为推进通信产业变革的新型技术底座,有望提升整个通信行业的技术水平和竞争力。
23.Predibase推出LLM微调工具LoRA Land
微调 LLM 的领先开发平台Predibase推出了 LoRA Land,这是 25 个开源微调模型的集合,该公司声称这些模型可以挑战甚至超越 OpenAI 广受欢迎的 GPT-4.0。
LoRA Land 由 Predibase 的无服务器微调端点和开源 LoRAX 框架提供支持。新平台提供了从情感分析到摘要的广泛用例。
该公司声称,LoRA Land 为组织提供了一种更具成本效益的方式来训练高度准确和专业化的 GenAI 应用程序。由于从头开始构建 GPT 模型或微调 LLMS 的成本高得惊人,使用专门的 LLM 正在成为一种流行的替代方案,而这正是 Predibase 可能在竞争格局中定位 LoRA Land 的地方。
使用更小且更专业的 LLMS,开发人员利用参数高效微调和低秩适应等技术来创建高性能的 AI 应用程序,以降低微调 LLM 的成本。Predibase 表示,它已将此类技术整合到其平台中,为用户提供了选择最适合其用例的 LLM 并相应地进行微调的选项。
微调的 LLMS 历来投入生产成本如此之高的原因之一是它们需要为每个模型配备专用 GPU。对于需要部署 LLMS 以解决各种用例的用户来说,GPU 费用累积成为增长和创新的主要障碍。虽然使用 API 访问的 LLM 的初始实验相对便宜,但当部署全面实现时,费用会迅速增加。(datanami.com)
24.Guardrails AI 承诺以 $7.5M 的种子资金阻止困扰 LLM 的“幻觉”
开放和值得信赖的人工智能保障公司Guardrails A推出了 Guardrails Hub,这是一款开源产品,允许开发人员构建、贡献、共享和重用高级验证技术,称为验证器。这些验证器可以与 Guardrails 一起使用,Guardrails 是该公司流行的开源产品,可作为构建 AI 应用程序的关键可靠性层,确保它们遵守特定的准则和规范。
这些验证器可以由用户定义,可以是简单的规则,也可以是更高级的 AI 检查。用例包括:
·通过确认 AI 信息提取的事实性来减少幻觉
·确保聊天机器人的通信以预期的方式运行,例如品牌和信息
·在 AI 自动化工作流中执行政策和法规。
借助 Guardrails Hub,开发人员可以:构建验证器、贡献和协作、重用验证器、将验证者组合成守卫、实施正确性保证和风险界等。
除了公司启动外,Guardrails AI 还宣布完成由 Zetta Venture Partners 领投的 750 万美元种子轮融资,该轮融资将用于扩大公司的工程和产品团队,并继续推进其产品。(dbta.com)
全国两会
END