
Amazon SageMaker的可视化ETL现已新增9种内置数据转换操作,包括:
派生列(Derived column)
扁平化(Flatten)
添加当前时间戳(Add current timestamp)
数组或映射展开为行(Explode array or map into rows)
转换为时间戳(To timestamp)
数组转列(Array to columns)
交集(Intersect)
限制行数(Limit)
列合并(Concatenate columns)

Amazon SageMaker的可视化ETL提供图形化拖拽界面,开发者可以通过简单的操作流程,或借助Amazon Q Developer智能助手,快速构建和编辑数据流。此次新增的转换功能,进一步提升了构建数据管道的灵活性与效率,让开发者在无需编写自定义代码的前提下,轻松应对常见的数据处理任务。
每项新功能都针对不同的数据处理场景量身打造。例如,使用“派生列”可以基于数学公式或SQL表达式生成新字段;“转换为时间戳”可将字符串或数值字段转换为标准时间戳格式;而通过“列合并”功能,开发者还能将多个字段拼接为一个新的字符串列,并可自定义分隔符。
该功能现已在所有支持Amazon SageMaker的亚马逊云科技区域全面上线。如需查看完整的可用区域列表,欢迎访问亚马逊云科技官方站点。
了解更多详细信息,请参阅Amazon SageMaker官方文档。
参考链接:
https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html













期待你的分享 收藏 在看 点赞!
亚马逊的一小步,云计算的一大步!

点击阅读原文,获取更多精彩内容!
文章转载自亚马逊云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




