暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

使用Sqoop将HDFS数据导出到MySQL

BigData社区 2019-07-19
774

本篇文章主要举一些实时案例来展现Sqoop把HDFS数据导入到MySQL的功能实现。


1.数据类型如下:

    1 tom 20
    2 tomas 30
    3 tomason 40
    复制
      sqoop export --connect jdbc:mysql://192.168.79.1:3306/big14 --username root --password root --table user_test --columns id,name,age --export-dir test.txt -m 1 --input-fields-terminated-by '\t' --input-lines-terminated-by '\n'
      复制


      2.数据类型如下:

        tom  20
        tomas 30
        tomason 40
        复制

        //导出到mysql表中,表中含有id主键为自增字段

          sqoop export --connect jdbc:mysql://192.168.79.1:3306/big14 --username root --password root --table user_test --columns name,age --export-dir test2.txt -m 1 --input-fields-terminated-by '\t' --input-lines-terminated-by '\n'
          复制


          增量导出 allowinsert

            sqoop export --connect jdbc:mysql://192.168.79.1:3306/big14 --username root --password root --table user_test --columns id,name,age --export-dir /test.txt -m 1 --input-fields-terminated-by '\t' --input-lines-terminated-by '\n' --update-key name --update-mode allowinsert
            复制


            增量导出 updateonly

              sqoop export --connect jdbc:mysql://192.168.79.1:3306/big14 --username root --password root --table user_test --columns name,age --export-dir test.txt -m 1 --input-fields-terminated-by '\t' --input-lines-terminated-by '\n' --update-key name --update-mode updateonly
              复制



              将hive数据导出到mysql需要注意:

              ==========================================

              首先,判断hive文件存储格式

              1、如果是text,直接以分隔符方式,以hdfs文件导出形式进行导出

              2、如果不是text,则需要将其转储为text格式,并将其导出




              导出参数

              -------------------------------------------

              --batch //批量模式

              --columns <col,col,col...> //指定导出列

              --direct //使用直接模式,更快导出

              --export-dir <dir> //指定hdfs文件位置

              -m,--num-mappers <n>

              --table <table-name> //指定mysql表

              --update-key <key>               //

              --update-mode <mode>           //updateonly //指定--update-key的列进行检查,修改的数据会进行update操作

              //allowinsert //在以上基础上,如果有新数据产生,则会进行插入操作

              //弊端:必须在column中指定主键



              以上就是今天的所有内容啦。希望能在你学习的路上帮到你,要是觉得还不错请识别以下二维码关注或转发吧,感谢支持!

              推荐阅读:

              1. 使用Sqoop将MySQL数据导入到HDFS

              2. 正式使用Sqoop-相关参数和命令

              3. Hive内容整合目录

              4. Hadoop内容整合目录

              文章转载自BigData社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

              评论