[pgpool-general-jp: 1479] Postgres10環境でregression test 011、012、013に失敗します

Kariatsumari, Kazuki ka.kariatsumari @ jp.fujitsu.com
2018年 1月 15日 (月) 16:46:58 JST


狩集です。

regression test 008の質問中ですが、
以下3件のregression testでも失敗したため、質問させてください。

----環境情報------
OS       :RHEL7.3
Postgres :10.1
pgpool-II:3.7.1
------------------

・011.watchdoc_quorum_failover...
  9件中1件失敗しています。

  Checking if the Standby2 fooled by fake error...
    "1	down"という記述を011.watchdoc_quorum_failover/standby2/log/backend_down_requestに出力後、
    011.watchdoc_quorum_failover/standby2/log/pgpool.logから"failover"という文字列を検索して
    いますが、見つからずにリトライ回数(10回)を超えて失敗しています。

---
Checking if the Standby2 fooled by fake error...
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---

・012.watchdog_failover_when_quorum_exists
  5件中2件失敗しています。

1件目
  Checking if the Master rejects the failover because quorum is not present...
    "1	down"という記述を012.watchdog_failover_when_quorum_exists/master/log/backend_down_requestに出力後、
    012.watchdog_failover_when_quorum_exists/master/log/pgpool.logから"Rejecting the failover request"
    というメッセージを検索していますが、見つからずにリトライ回数(10回)を超えて失敗しています。

---
Checking if the Master rejects the failover because quorum is not present...
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---

2件目
  Checking if all Pgpool-II agrees that the failover request is executed
    show pool_nodesでDBノードのリストを表示させ、standby側のノードの状態がdown状態になっていることを
    確認していますが、リトライ回数を超えても失敗しています。

---
Checking if all Pgpool-II agrees that the failover request is executed
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---


・013.watchdoc_test_failover_require_consensus
  7件中4件失敗しています。

1件目
  Checking if the standby successfuly process the failover request...
    "1	down"という記述を013.watchdoc_test_failover_require_consensus/standby/log/backend_down_requestに
    出力後、013.watchdoc_test_failover_require_consensus/standby/log/pgpool.logから
    "building consensus for request"という記述を探していますが、
    見つからずにリトライ回数(10回)を超えて失敗しています。

---
Checking if the standby successfuly process the failover request...
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---

2件目
  Checking if the Master receives the failover request and waiting for consensus...
    1件目が失敗しているため、続けて失敗しているように見えます。

---
Checking if the Master receives the failover request and waiting for consensus...
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---

3件目
  Checking if the node is quarantined on standby...
    1件目が失敗しているため、続けて失敗しているように見えます。

---
Checking if the node is quarantined on standby...
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---


4件目
  Checking if all Pgpool-II agrees that the failover request is executed
    show pool_nodesでDBノードのリストを表示させ、standby側のノードの状態がdown状態になっていることを
    確認していますが、失敗しています。

---
Checking if all Pgpool-II agrees that the failover request is executed
[check] 1 times
[check] 2 times
[check] 3 times
[check] 4 times
[check] 5 times
[check] 6 times
[check] 7 times
[check] 8 times
[check] 9 times
[check] 10 times
---

上記3つのテストですが、watchdocがテストDBが疑似エラーを検出できていないため、
failoverが実行されず、pgpool.logに期待している文字列が出力されてないように見えます。
テスト時に同様の現象が発生した方がおられましたら、対処方法等を教えて頂けないでしょうか。

以上です。宜しくお願いします。



pgpool-general-jp メーリングリストの案内