暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【Reli】基于Amazon Bedrock推出 “筑巢日记”,一键生成观鸟Vlog

亚马逊云科技 2025-03-27
0


概 述


Reli Technologies LLC(以下简称“Reli”)基于Amazon Bedrock调用Anthropic的Claude 3.5 Sonnet推出“筑巢日记“功能,提升海外用户的观鸟体验。


90%

帮助Reli将鸟类识别成本

降低一倍

识别准确率提高到90%以上

50%

“筑巢日记”功能上线周期

短缩1到2个月

人力投入节省50%以上



60天

“筑巢日记”可针对

60天视频自动生成

精彩时刻视频集锦

提升

极大提升

欧洲用户访问

Reli App的速度



目前,Reli采用的亚马逊云科技主要服务包括:Amazon Bedrock、Amazon Bedrock中Anthropic的Claude、Amazon Polly、Amazon Lambda、Amazon IoT Core、Amazon S3、Amazon DocumentDB、Amazon RDS、Amazon EKS、Amazon Route 53、Amazon Cloud Front、Amazon ELB等。

















机会 | 利用生成式AI提升用户观鸟体验


一个可能鲜为人知的事实是,根据美国鱼类和野生生物管理局的统计,美国3.3亿人口中的20%是观鸟爱好者,而这4500万观鸟者中的3900万人会选择在家或邻近区域赏鸟。Reli的业务起步于美国,并在Kickstarter上众筹了一款智能鸟窝,并成为该类目最受欢迎的产品之一。此后,Reli相继推出智能喂鸟器、智能鸟浴等针对爱鸟人士的智能硬件产品,持续提升在野生动物爱好者中的影响力。但在实际应用中,无论是家庭安防摄像头还是观鸟类摄像头,用户都需要观看完整视频才能获取到视频记录了什么样的内容,但观察并记录鸟儿的视频时间跨度可能长达数月,而大部分画面是无意义或重复的,因此用户获取有效画面的效率较低。生成式AI问世以来,借助大语言模型(Large Language Model,LLM)自动识别、抓取视频画面,并高效生成精彩时刻视频,通过更好的交互性和趣味性提升用户体验、增强用户粘性,成为Reli的关键诉求之一。


然而,在利用LLM生成精彩时刻视频过程中,Reli 发现视频画面和字幕配音的对齐匹配存在挑战,比如Reli记录的画面中第15秒发生某瞬时事件,但生成的字幕配音需要5秒才能讲述完成,导致字幕配音与实际画面无法匹配,非但不能给视频添光加彩,反而给用户带来困扰。所以,如何利用LLM生成带有字幕和配音的Vlog,并解决字幕、配音与视频画面对齐问题成为Reli面临的首要挑战。


凭借亚马逊云科技在云计算和人工智能及生成式AI的领先优势,Reli期望与亚马逊云科技合作,共同探索生成式AI在多模态领域的应用,为全球用户打造领先的AIoT产品,重新定义人与自然的互动。


“从最初的产品设想到‘筑巢日记’功能的落地,亚马逊云科技与Reli通力合作,从业务逻辑理解、产品功能定义、技术架构设计到反复调试优化,通过Amazon Bedrock调用LLM,运用多模态能力进行视频识别、分析、生成字幕和音频并合成视频集锦,最终让创新灵感落地,帮助Reli抢占海外市场先机。”


——Bob Huang|Reli CEO



















解决方案 | 基于Amazon Bedrock

调用LLM推出“筑巢日记”

自动生成精彩时刻视频集锦


基于Amazon Bedrock调用LLM,Reli运用多模态能力推出“筑巢日记”,自动生动观鸟Vlog


此前,Reli已经上市了多款观鸟、喂鸟类产品,为了帮助爱鸟人士更贴近自然,以更直观的方式观察和关爱野生动物,Reli受苹果相册启发,想要打造一款类似苹果相册的“回忆”功能的应用,可以根据画面生成相应的字幕、配音并合成Vlog。因此,Reli计划利用生成式AI,自动对摄像头记录和存储的鸟儿筑巢、生蛋、孵蛋、喂食等画面进行识别、筛选、生成字幕,并配音合成后生成视频集锦。Reli针对其海外业务基于亚马逊云科技Amazon Bedrock等服务解决了以下关键问题:


视频画面的识别:借助生成式AI可以帮助Reli识别更多种类鸟儿,不再需要人工肉眼逐帧识别,大大提高识别的准确度和识别效率,降低成本;


视频分析与抽帧:借助大模型的多模态能力,快速理解摄像头记录的长达60余天孵蛋周期的整条视频内容,识别筛选出诸如鸟类筑巢的精彩瞬间画面,由AI Agent自动抽帧;


生成故事:画面生成对应的文字信息,对筛选处理的关键画面,利用LLM分析抽帧图片自动生成字幕文本,并将时间节点信息写入故事线中,基于Amazon Lambda和Amazon S3开发全托管无服务架构的AI Agent让字幕与视频匹配;


视频配音:字幕转化为音频,利用Amazon Polly 将生成配音文字高效转换成音频文件,确保音频时长与画面时长对齐。


最终,Reli将不同的视频画面合成到一起,为用户生成了一段栩栩如生的Vlog。


通过Amazon IoT Core高效连接全球设备,Amazon S3存储数据,Reli让用户7*24小时远程轻松控制观鸟体验


Reli的产品刚上线就受到用户的追捧,目前已有大量的用户购买和使用Reli公司推出观察野生鸟类的相关智能IoT设备,这些设备7*24小时持续产生视频数据,且每月的数据规模还在以翻番的速度增长。为保障用户随时随地获取流畅的体验,Reli始终高度关注设备的安全稳定连接,视频数据的可靠存储以及用户的便捷访问。


Amazon IoT Core可支持数十亿台设备连接以及数万亿条消息传送,每分钟同时在线数设备数高达3亿台。借助Amazon IoT Core,Reli可以让所有设备在低功耗状态下实时安全连接,远程唤醒设备。


作为亚马逊云科技的推出的第一个云服务,Amazon S3目前已经为全球数百万来自各行各业的客户存储了超过350万亿个对象,平均每秒处理超过1亿次请求。Reli将用户的摄像头全天记录的视频数据全部存储在Amazon S3上,可靠、便捷的云存储让用户可以随时在线实时观看或回看鸟儿视频。


亚马逊云科技携手Ultrapower,帮助Reli的生成式AI应用得以工程化落地


在Reli将生成式AI部署到自身业务中,亚马逊云科技携手合作伙伴Ultrapower(Singapore)Pte. Ltd.(以下简称“Ultrapower”),共同帮助Reli将生成式AI应用工程化落地:


解决Vlog的前置输入条件,包括定义鸟儿种类、标记鸟儿活动阶段、设定Vlog参数如时长等,制定为LLM提供这些输入的接口字段和格式;


开发图像采样算法,自动精简抽帧图片数量,从每日视频中平均筛选3张图片,减少LLM调用不必要的token数量;


开发基于Serverless架构的AI agent,通过多线程并行处理推理任务,实现AI agent兼具推理速度、低成本和鲁棒性;


进行PE(Prompt Engineering,提示词工程)优化;


迭代优化多媒体处理工具FFmpeg的参数,提升最终Vlog中视频、字幕和音频的合成效果。


Reli基于亚马逊云科技的产品架构示意图
















业务成果 | 生成式AI应用提升用户观鸟体验

研发周期缩短一半

人力投入节省50%


生成式AI应用研发周期缩短1到2个月,人力投入节省50%以上


Reli原来预计自身开发生成式AI应用需要2到3个月才能完成,在亚马逊云科技和Ultrapower的助力下,双方为Reli提供了从功能设计、框架设计到Demo验证等全面的技术支持,同时应用生成式AI赋能下的视觉分析解决方案指南让Reli可以基于历史积累素材进行训练、调优,无需从零搭建技术架构。最终“筑巢日记”功能的研发周期缩短了1到2个月,人力投入节省超过50%,让Reli工程师更多聚焦在业务创新上。


“筑巢日记”更精准识别鸟儿,一键自动生成精彩时刻视频集锦


以前Reli通过通过公开数据集自行训练的模型,仅能识别约400种鸟儿,且容易产生幻觉,如将松鼠识别成鸟类等。通过Amazon Bedrock采用Claude 3.5 Sonnet后,Reli可以为其海外用户识别超过1000种鸟儿,而且识别精度大大提升。


此外,Reli的竞品大多只能提供每天的源视频,用户想要精华视频只能自己二次剪辑处理。但Reli的“筑巢日记”功能推出后,用户可以在Reli App上对长达60天的源视频一键进行筛选、剪辑、字幕生成并合成,轻松观看鸟儿的筑巢、孵化等精彩时刻,并分享到社交媒体上,创新体验大大提升用户粘性。


多区域部署极大提升全球用户访问Reli App的速度


借助亚马逊云科技遍布全球的基础设施,帮助Reli在北美、欧洲等区域高效部署业务并安全运营。此前,欧洲用户反馈Reli App响应有时延,打开App并加载首页的时间需要5秒。亚马逊云科技迅速响应,借助其在欧洲的基础设施帮助欧洲用户访问加速,优化之后,用户访问Reli App并加载首页的时间控制在1秒以内。亚马逊云科技的多区域部署让Reli的业务更靠近用户,降低延迟的同时确保本地的安全合规要求。


目前,Reli和亚马逊云科技的合作还在加强。一方面,Reli正在积极扩大产品范围,比如开发喂鸟器、为家养鸟开发智能鸟笼等,利用生成式AI来分析鸟儿的习性,为用户提供相关推荐。另一方面,Reli还在北美之外的更多区域拓展业务,借助亚马逊云集遍布全球的基础设施,面向更多用户提供高效、稳定的服务。
















关于Reli


Reli创立于2021年,是一家专注于智能家居与野生动物相关的软硬件研发与生产科技公司,致力于通过创新技术重新定义人与自然的互动。


关于Ultrapower



Ultrapower在IT运维管理领域有着丰富的经验和产品解决方案,亚马逊云科技APN(Amazon Partner Network,亚马逊云科技合作伙伴网络)合作伙伴,已获得亚马逊云科技云运维、开发运维咨询、迁移、数据与分析咨询和生成式AI等多项能力能力认证,目前已累计服务四百余家企业。


系列往期内容







期待你的分享  收藏  在看  点赞

亚马逊的一小步,云计算的一大步!


点击阅读原文,获取更多精彩内容!

文章转载自亚马逊云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论