◆ BIG-IP : 3つのFailSafe機能
BIG-IPデバイスでは、HA構成で以下の3つのFailSafe機能(いわば安全装置)を併用することができます。
FailSafe機能 |
説明 |
Serial Fail-Safe |
専用シリアルケーブルとNetwork Failover用LANケーブルにより筐体障害を検知して切替。
機器間を接続するケーブルで筐体レベルの死活監視を行うことにより数秒以内の切替りを実現。
|
Network Fail-Safe |
ネットワーク障害を検知して切替。Network FailSafeには以下の4つの方式がある。
・VLAN FailSafe ・Gateway FailSafe ・HA Group (Pool) ・ HA Group(Trunk)
|
上記のFailSafe機能は、筐体障害やNW障害を検知した場合にFailoverの実行を行います。一方、以下の
System Fail-Safe機能はデーモンの不具合を検知してすぐにFailoverを実行するようなFail-Safe機能では
ありません。また、コンポーネントのFails時に、BIG-IPが実行するアクションを指定することができます。
FailSafe機能 |
説明 |
System Fail-Safe |
BIG-IPデバイスの自身のデーモン不具合を検知し、サービスリスタート等を実行するFailSafe。
大きく右記の2種類がある ⇒ スイッチボード障害のFail-Safe / プロセス障害のFailSafe
System Fail-Safeのためのコンフィグは設定済みであり、既存の設定を使用することが推奨。
|
◆ BIG-IP : Serial Fail-Safe
Serial FailSafeは筐体レベルの死活監視を行う方式です。筐体間を2種類のケーブルを使用して接続します。
Serial FailSafeには、シリアルフェイルオーバーとネットワークフェイルオーバーの2つの実装があります。
※ シリアルフェイルオーバーとネットワークフェイルオーバーは、両方とも実装することが推奨です。
専用シリアルケーブル(現在はCAT5ケーブル)を使用して、StandbyユニットがActiveポートのシリアル
ポートで電圧がかかっているかどうかを監視して、電圧がなくなればActiveユニットのダウンとみなして
切り替わるのがシリアルフェイルオーバーです。そしてLANケーブルを使用してActiveユニットとStandby
ユニットの間でハートビート通信が途絶えると、StandbyユニットはActiveユニットがダウンしたとみなし
切り替わる方式がネットワークフェイルオーバーです。
※ Active/Active構成やHA GroupのNetwork Failsafeを使用するためには、ネットワークフェイルオーバーは必須となります。
例えばシリアルフェイルオーバーだけを実装した場合、そのシリアルフェイルオーバーケーブルに故障が
発生した場合、BIG-IPデバイスはActive/Avtive状態になってしまいます。そこで下図のようにシリアル
フェイルオーバーとネットワークフェイルオーバーを組み合わせることで、二重障害が発生しない限りは
Active/Active状態になる事はありません。この構成の場合、両方の方式でActiveユニットのダウン検知を
した時に切替ります。つまり、Active機のハードウェア障害が発生した時に切り替わることを意味します。
シリアルフェイルオーバーとネットワークフェイルオーバーともに、機器間のケーブル接続は直結が推奨。
ネットワークフェイルオーバーのポートでは、UDPポート番号1026のトラフィックがやりとりされるので
PortLockdownで Allow Default、Allow All、Allow Custom のどれかにしUDPポート1026のトラフィック
を許可する必要があります。つまりAllow Noneが設定されていないことを確認します。なお、デフォルト
では、ネットワークフェイルオーバーは3秒間HeartBeatパケットが途絶えることで、切替が発生しますが
「tmsh modify sys db failover.nettimeoutsec value」コマンドで、この時間を変更することができます。
ちなみに、Serial FailSafeのために接続するFailoverケーブル(標準添付されたCAT5ケーブル)において
正常にハートビート通信が行われているかどうかは、 show sys failover cableコマンドにてステータスを
確認することができます。以下の通り、Active機が 0 と表示、Standby機が 1 と表示されるのが正常です。
◆ BIG-IP : Network FailSafe
BIG-IPにおいて、ネットワーク障害検知による「Failover」が実行される仕組みは以下4種類があります。
Network FailSafeの各実装の詳細は次ページ以降で解説していきます。
Network FailSafeの種類 |
説明 |
VLAN FailSafe |
指定したVLAN上でのトラフィックが一定期間以上を検知できなかった場合に切替 |
Gateway FailSafe |
Gateway Poolとして設定したPoolのDownを検知した場合に切替 |
HA Group (Pool) |
特定のPoolがDownした際にメンバー数がしきい値以下となりスコア値が逆転した場合に切替 |
HA Group (Trunk) |
I/Fがリンクダウンした際にメンバー数がしきい値以下となりスコア値が逆転した場合に切替 |
◆ BIG-IP : System Fail-Safe
System Fail-Safeには「スイッチボード障害のFail-Safeとプロセス障害のFail-Safe」の2種類があります。
この2種類のFail-Safeは「System」⇒「High Availability」⇒「Fail-safe」で設定することができます。
「スイッチボード障害のFail-Safe」は、Switch Board FailureでFail時のActionを選択することができます。
「プロセス障害のFail-Safe」は、System Servicesで各デーモンごとに不具合時におけるFailover Actionを
設定することができます。ただしこれらの値の設定変更は非推奨であることからデフォルト値を使用します。
スイッチボード障害のFail-SafeのActionには以下のような項目があります。
プロセス障害のFail-SafeのActionには、各デーモンごとに以下のような Failure Actionを選択できます。
|