PostgreSQL高可用

介绍一种基于 pgpool-II 的方案，实现在双机条件下，pgpool-II 服务的高可用，PostgreSQL 的高可用和负载均衡等功能。

方案架构

在两台服务器上，分别部署 PostgreSQL 和 pgpool-II 。

PostgreSQL 通过流复制（streaming replication）实现数据同步。

pgpool-II 监控数据库集群的状态，并将用户请求分发到数据库节点上。 pgpool-II 主节点启动虚拟 IP，作为对外访服务的地址。

pgpool-II 服务高可用

当 pgpool-II 主节点停止后，standby 节点升级为主节点。

PostgreSQL 高可用和在线恢复

主数据库停止或所在服务器宕机，则进行主备切换，原主库服务器启动后自动切换为新主库的备库。

负载均衡

客户端通过 pgpool-II 访问 PostgreSQL 的写请求被发送给主库，而读请求可以随机发送给主库或备库。

复制类型

数据库高可用架构都会用到日志。如 mysql 的 binlog，oracle 的 redo，postgresql 的 wal。原理性质整体上相近：首先记录数据库变化并通过特定算法转换成可用的文本或记录方式的文件。其次这些日志文件都是循环或覆盖进行写入的。最后都会记录数据库的所有变化，就需要进行归档，因为他们是循环或覆盖写入的，通俗的讲就是日志文件持久化。

在PG中，流复制就是通过 WAL 日志传递的方法来保证主备数据库的同步、一致。

PostgreSQL 支持物理复制（流复制）及逻辑复制2种。

流复制

流复制同步方式有同步、异步两种，基于实例级的复制，只能复制整个 PostgreSQL 实例，而不能基于部分库及表。

异步流复制 Primary 库产生变换，只需成功传递 WAL 日志给备库即返回 commit。^[1]（这个描述有问题，若此，那么当备库宕机时，主库也无法完成操作。正确的应该是主库成功即提交完成。）

同步流复制是 9.1 后才有的。

逻辑复制

PostgreSQL10 开始，实现了基于表级别的复制

/etc/postgresql/15/main/

主库配置

postgresql.conf

listen_addresses = '*'
wal_level = replica
archive_mode = on
archive_command = 'cp "%p" /u01/pgdb/db/archive/%f'
max_wal_senders = 10
# wal_keep_segments = 1024
hot_standby = on

listen_addresses

可以按需配置网段或 IP(有些文档写成 listen_address，导致启动报错)

wal_level

设置流复制模式至少设置为replica

archive_mode

是否启用归档

archive_command

WAL 日志归档命令，"%p"用双引号以防止目录中有空格。

# 压缩的归档日志
如果担心归档存储的尺寸，你可以使用gzip来压缩归档文件：
 archive_command = 'gzip < %p > /var/lib/pgsql/archive/%f'
那么在恢复时你将需要使用gunzip：
 restore_command = 'gunzip < /mnt/server/archivedir/%f > %p'

max_wal_senders

最大WAL发送进程数，此数量需大于等于从库个数且比 max_connections 小

wal_keep_segments

pg_wal 目录下保留 WAL 日志的个数。每个 WAL 文件默认 16M，为保障从库能在应用归档落后时依旧能追上主库，可以设置较大一些。13.0 以后版本将 wal_keep_segments 重命名为 wal_keep_size。让用户指定 WAL 大小而不是 WAL 文件个数。

hot_standby

控制在恢复归档期间是否支持只读操作，设置为 ON 后从库为只读模式

pg_hba.conf

host all all 127.0.0.1/32 trust
host all all ::1/128 trust

host    all             all             0.0.0.0/0               md5
host    replication     postgres        192.168.0.0/0           md5

备库初始化同步主库数据

pg_basebackup -h 192.168.0.21 -U postgres -D /u01/pgdb/db/bidb -X stream -R -P
-R 为流复制写入相关配置，如：生成 standby.signal 空文件，在 postgresql.auto.conf 写入连接主库配置 primary_conninfo。

从 12 版本开始，去掉 recovery.conf，参数并入 postgresql.conf。不再使用 standby_mode。（在 12 以前，recovery.conf 文件的存在即触发恢复模式。）

参数说明

-h 指定连接的数据库的主机名或IP地址，这里就是主库的ip
-U 指定连接的用户名，专门负责流复制的repl用户
-F 指定了输出的格式，支持p（原样输出）或者t（tar格式输出）
-X 表示备份开始后，启动另一个流复制连接从主库接收 WA L日志
-P 表示允许在备份过程中实时的打印备份的进度
-R 表示会在备份结束后自动生成recovery.conf文件，这样也就避免了手动创建。（12.0有差异）
-D 指定把备份写到哪个目录（非空）
-l 表示指定一个备份的标识

从库配置

standby.signal # triggering files。同时存在优先，等待新的传入 WAL 并重播
recover.signal # 归档恢复，消耗所有 WAL 或达到恢复参数后立即停止 WAL 重播

拷贝主库 postgresql.conf、pg_hba.conf。
将 postgresql.auto.conf 内容写入 postgresql.conf（如果创建基础备份的时候，使用了 -R 参数）。
修改：

max_connections = 110 # 从库的 max_connections要大于主库 (change requires restart)
# recovery_target_timeline = 'latest' # 'current', 'latest', or timeline ID，默认为 latest。

同步复制

默认是异步复制，下列参数为同步复制。

# postgresql.conf
synchronous_commit = remote_write
synchronous_standby_names = '*'

参考

PostgreSQL主备流复制——异步