<div dir="ltr"><div><div>Hi folks,<br><br></div>I have a setup of two nodes with Streaming Replication, pgpool running on both nodes monitoring each other backends. Everything is working fine,  failover work and oneline recovery work like a charm. <br>
<br></div><div>Here is the problem, while server0 failover to server1, and server1 recover server0 had no problem; however, when i failover back, server1 failover to server0, server0 is not able to recover server1.<br><br>
</div><div>From the log on Primary:<br>Apr  1 16:14:52 se032c-94-30 pgpool[2456]: starting recovering node 1<br>Apr  1 16:14:52 se032c-94-30 pgpool[2456]: starting recovery command: "SELECT pgpool_recovery('basebackup.sh', 'se032c-94-31', '/opt/postgres/9.2/data')"<br>
Apr  1 16:14:52 se032c-94-30 postgres[3096]: [2-1] [unknown]postgres3096ERROR:  pgpool_recovery failed<br>Apr  1 16:14:52 se032c-94-30 postgres[3096]: [2-2] [unknown]postgres3096STATEMENT:  SELECT pgpool_recovery('basebackup.sh', 'se032c-94-31', '/opt/postgres/9.2/data')<br>
<br></div><div>The exact same script used on both node, so why one work but not the others.<br></div><div>And from the log, I have no idea why it fails, setting debug=[1,2,3] does not help on troubleshooting.<br><br></div>
<div>I then went to manually execute the pgpool_recovery statement, i see the following:<br><br>template1=# SELECT pgpool_recovery('basebackup.sh', 'se032c-94-31', '/opt/postgres/9.2/data');<br>ERROR:  pgpool_recovery failed<br>
template1=# SELECT pgpool_recovery('basebackup.sh', '10.89.94.31', '/opt/postgres/9.2/data');<br> pgpool_recovery<br>-----------------<br> t<br>(1 row)<br><br><br></div><div>If hostname is used, the command will failed, but IP works fine.<br>
<br></div><div>I double check the hostname is pingable from localhost.<br><br>[root@se032c-94-30 ~]# ping se032c-94-31<br>PING <a href="http://se032c-94-31.cisco.com">se032c-94-31.cisco.com</a> (10.89.94.31) 56(84) bytes of data.<br>
64 bytes from <a href="http://se032c-94-31.abc.com">se032c-94-31.abc.com</a> (10.89.94.31): icmp_seq=1 ttl=64 time=0.254 ms<br>64 bytes from <a href="http://se032c-94-31.abc.com">se032c-94-31.abc.com</a> (10.89.94.31): icmp_seq=2 ttl=64 time=0.311 ms<br>
<br></div><div>Please help!<br><br>Thanks~<br>Ning<br></div></div>