暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【PG逻辑备份】 pg_dump 使用及示例

AsherHu 2022-02-27
2278

1.pg_dump 概述

1.1  pg_dump 介绍

https://www.postgresql.org/docs/14/app-pgdump.html


pg_dump是用于备份一种PostgreSQL数据库的工具。即使数据库正在被并发使用,它也能创建一致的备份。pg_dump不阻塞其他用户访问数据库(读取或写入)。


pg_dump只转储单个数据库。要备份一个集簇或者集簇中 对于所有数据库公共的全局对象(例如角色和表空间),应使用 pg_dumpall。

可以选择一个数据库或部分表进行备份,恢复过程可以跨平台迁移
可以在数据库正在使用时进行完整一致的备份,并不阻塞其它用户对数据库的访问
只能备份单个数据库,不会导出角色和表空间相关的信息


1.2 pg_dump四种转储格式

Plain、custom、directory、tar
Plain 是纯文本格式跟pg_dumpall转储一样。你可以用psql加载它,如果转储很大,提取部分可能会很复杂。
使用pg_restore程序恢复所有其他格式(custom,directory和tar)

Pg_dump四种转储格式:
-F t tar格式的转储输出格式,不支持压缩,在早期版本有单表8G限制,目前版本已经改善
-F d 以目录的格式创建备份,备份出来的是一个包含若干个目录的备份文件,可以指定并行备份-j
-F c 备份为二进制格式, 压缩存储. 并且可被pg_restore用于精细还原,输出输入 IO 比较稳定
-F p 备份为文本, 大库不推荐, 文本方式 ,对 IO 不可控,不稳定

复制

2.pg_dump 使用

    pg_dump --help
    复制

    2.1 Usage:

      pg_dump [OPTION]... [DBNAME]
      复制

      2.2 General

      复制
        一般选项:
        -f, --file=FILENAME 输出文件或目录名
        -F, --format=c|d|t|p 输出文件格式 (custom, dir, tar) tezt(默认值))
        -j, --jobs=NUM 执行多个并行任务进行备份转储工作
        -v, --verbose 详细模式
        -V, --version 输出版本信息,然后退出
          -Z, --compress=0-9           被压缩格式的压缩级别
        --lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败
        --no-sync 不需要等待,执行刷盘
        -?, --help 显示此帮助, 然后退出
        复制
        2.3 output content
        复制
        复制
          控制输出内容选项:
          -a, --data-only 只转储数据,不包括模式
          -b, --blobs 在转储中包括大对象
          -B, --no-blobs 在转储中排除大对象
          -c, --clean 在重新创建之前,先清除(删除)数据库对象 *****
          -C, --create 在转储中包括命令,以便创建数据库
          -E, --encoding=ENCODING 转储以ENCODING形式编码的数据
          -n, --schema=PATTERN 只转储指定名称的模式
          -N, --exclude-schema=PATTERN 不转储已命名的模式
          -O, --no-owner 在明文格式中, 忽略恢复对象所属者
          -s, --schema-only 只转储模式, 不包括数据
          -S, --superuser=NAME 在明文格式中使用指定的超级用户名
          -t, --table=PATTERN 只转储指定名称的表
          -T, --exclude-table=PATTERN 不转储指定名称的表
          -x, --no-privileges 不要转储权限 (grant/revoke)


          --binary-upgrade 仅供升级实用程序使用
          --column-inserts 以带有列名的INSERT命令形式转储数据
          --disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号
          --disable-triggers 在恢复数据的过程中禁用触发器
          --enable-row-security 启用行安全性(只转储用户能够访问的内容)
          --exclude-table-data=PATTERN 不转储指定名称的表中的数据
          --extra-float-digits=NUM 覆盖 extra_float_digits 的默认设置
          --if-exists 当删除对象时使用IF EXISTS
          --inserts 以INSERT命令,而不是COPY命令的形式转储数据


          --load-via-partition-root 通过根表加载分区
          --no-comments 不转储评论
          --no-publications 不转储出版物
          --no-security-labels 不转储安全标签分配
          --no-subscriptions 不转储订阅
          --no-synchronized-snapshots 在并行作业中不使用同步快照
          --no-tablespaces 不转储表空间分配
          --no-unlogged-table-data 不转储未记录的表数据
          --on-conflict-do-nothing 添加 ON CONFLICT DO NOTHING 到 INSERT 命令
          --quote-all-identifiers 引用所有标识符,即使不是关键字
          --rows-per-insert=NROWS 每个插入的行数;暗示 --inserts
          --section=SECTION 转储命名节(前数据、数据或后数据)
          --serializable-deferable 等到转储可以无异常运行
          --snapshot=SNAPSHOT 使用给定的快照进行转储
          --strict-names 要求表和/或模式包含模式以匹配每个至少一个实体
          --use-set-session-authorization
                                         使用 SET SESSION AUTHORIZATION 命令而不是 ALTER OWNER 命令来设置所有权
          复制

          复制

          2.4 Connection options

          复制
            Connection options
            -d, --dbname=DBNAME 对数据库 DBNAME备份
            -h, --host=HOSTNAME 数据库服务器的主机名或套接字目录
            -p, --port=PORT 数据库服务器的端口号
            -U, --username=NAME 以指定的数据库用户联接
            -w, --no-password 永远不提示输入口令
            -W, --password 强制口令提示 (自动)
            --role=ROLENAME 在转储前运行SET ROLE
            复制
             
            复制


            3. pg_dump  示例

            3.1 默认的文本方式

            复制
              # 备份数据库
              pg_dump -Fp-f/tmp/testdb.sql -C -E UTF8 -h 127.0.0.1 -U postgres testdb
              #或 简单语法 ,默认就是文本的方式
              pg_dump testdb >/tmp/testdb.sql


              # 将数据恢复到 testdb1 , 导入数据时首先创建数据库
              createdb testdb1
              psql testdb1</tmp/testdb.sql
              复制

              复制

              3.2 二进制备份文件


              复制
                #二进制格式备份文件, 指定类开 -F c
                pg_dump -F c -f tmp/testdb.dmp -C -EUTF8 -h 127.0.0.1 -U postgres testdb


                #可选,解析二进制格式的备份文件 ,查看二进制文件的备份内容
                pg_restore -f tmp/a.log tmp/testdb.dmp
                #可选,-l 生成备份集的toc例表,可以编辑该toc文件 ,注释其中的表,恢复部份对象
                pg_restore -l -f tmp/a.toc tmp/testdb.dmp


                # 二进制格式 ,tar 格式 ,目录格式 ,都需要用pg_restore 来恢复
                pg_restore -d testdb1 tmp/testdb.dmp #需要先创建目标库,还原恢复


                复制

                4.pg_dump  扩展

                4.1.生成toc文件进行选择性恢复

                1)根据二进制备份文件生成toc文件

                复制
                      pg_restore -l -f /tmp/toc1 /tmp/testdb.dmp
                  复制
                  2)修改 toc文件,以首行加分号“;”的方式注释掉不用还原的内容


                  复制
                    vi tmp/toc1 
                    265; 1259 25280 TABLE public postgres_log postgres
                    266; 1259 25293 TABLE public t2 postgres
                    213; 1259 16385 TABLE public test postgres
                    3660; 0 25280 TABLE DATA public postgres_log postgres
                    ;3661; 0 25293 TABLE DATA public t2 postgres # 这个表用; 注释了,不会恢复
                    ;3659; 0 16385 TABLE DATA public test postgres # 这个表用; 注释了,不会恢复
                    3520; 2606 25287 CONSTRAINT public postgres_log postgres_log_pkey postgres
                    3442; 1259 25269 INDEX public idx_test postgres
                    复制

                    3)以toc文件列表做恢复

                          pg_restore –F c -L tmp/toc -d testdb  tmp/testdb.dmp


                      复制

                      4.2使用unix管道备份恢复

                      1. 压缩与解压

                      复制
                        pg_dump testdb| gzip > /tmp/testdbbak.sql.gz      #操作系统压缩
                        gunzip -c /tmp/testdbbak.sql.gz | psql testdb2 #解压缩恢复
                        复制
                        2.备份恢复数据不落盘

                        复制
                          pg_dump testdb | psql testdb1      #备份testdb  ,马上又还原到 testdb1,testdb1库要先创建, 数据不落盘,这路对小数据进行测试是非常方便的。


                          复制
                          3.分割备份文件

                          复制
                            备份:pg_dump dbname | split-b1m- filename
                            恢复:catfilename* | psql dbname
                            复制


                            4.3.并行处理

                              pg_dump -Fd -j4 -f /tmp/db.dir testdb     #-F d 以目录的格式创建备份
                              pg_restore -d testdb3 -j4 /tmp/db.dir
                              -j 参数指定同时几个进程来同时执行,每个进程同时只处理一个表的数据。
                              复制


                              5.补充

                              逻辑备份,相对灵活,可以排除大表。可以结合物理备份使用。 
                              如果备份以默认的明文方式保存,输出输入 IO 不可控,生产环境中建议使用 -F c  二进制方式备份比较稳定 。


                              文章转载自AsherHu,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

                              评论