操作ガイド

     前  次    新しいウィンドウで目次を開く     
コンテンツの開始位置

SNMP のコンフィグレーション

以下の節では、Oracle Communications Converged Application Server で SNMP サービスをコンフィグレーションおよび管理する方法について説明します。

 


Oracle Communications Converged Application Server の SNMP の概要

Oracle Communications Converged Application Server には、エンジン層と SIP データ層のサーバ インスタンスのアクティビティをモニタするための専用 SNMP MIB が用意されています。Oracle Communications Converged Application Server の MIB は、ドメインの管理サーバと管理対象サーバの両方で生成されます。ただし、Oracle Communications Converged Application Server のエンジン層と SIP データ層のトラップを生成するのは、各層を構成する管理対象サーバ インスタンスだけです。管理サーバが sipserver のカスタム リソースのための対象でなければ、(クラスタ内のサーバで障害が起きた場合などに) WebLogic Server の SNMP トラップのみが生成されます。管理者は、ドメイン全体の動作を評価するために、WebLogic Server と Oracle Communications Converged Application Server の両方のトラップをモニタする必要があります。

注意 : Oracle Communications Converged Application Server の MIB オブジェクトは読み込み専用です。SNMP を使って Oracle Communications Converged Application Server のコンフィグレーションを変更することはできません。

 


MIB の参照

Oracle Communications Converged Application Server の MIB ファイルは、WLSS_HOME/server/lib/wlss/BEA-WLSS-MIB.asn1 にインストールされています。このファイルの内容を表示するには、利用可能な SNMP 管理ツールまたは MIB ブラウザを使用してください。共有 SNMP トラップの説明については、「トラップの説明」を参照してください。

 


SNMP のコンフィグレーション

Oracle Communications Converged Application Server ドメイン全体の SNMP モニタを有効にするには、次の手順に従います。

  1. Oracle Communications Converged Application Server ドメインの Administration Console にログインします。
  2. 左ペインで、[Diagnostics|SNMP] ノードを選択します。
  3. 新しいエージェントを作成するには、Server SNMP エージェント テーブルで [New] ボタンをクリックしてください。
  4. 注意 : Domain-Scoped エージェントではなく新しい Server SNMP エージェントを作成することを確認します。
  5. 新しい SNMP エージェントに固有の名前 (例えば、「engine1snmp」) を入力して、「OK」をクリックします。
  6. Server SNMP エージェント テーブルから、作成した新しい SNMP エージェントを選択します。
  7. [コンフィグレーション|一般] タブで以下のように選択します。
    1. [有効化] チェック ボックスを選択し、エージェントを有効にします。
    2. SNMP UDP ポート フィールドで非使用のポート番号を入力します。
    3. 注意 : 複数の管理対象サーバ インスタンスを同じマシンで実行する場合、各サーバ インスタンスはユニークな SNMP ポート番号で専用 SNMP エージェントを使用する必要があります。
    4. [保存] をクリックします。
  8. デプロイメント内の各サーバ (SIP データ層サーバ、エンジン層サーバおよび管理サーバ)に対してユニークな SNMP エージェントを生成するには、上記の手順を繰り返します。

 


SNMP トラップの概要と応答

以下の節では、Oracle Communications Converged Application Server の SNMP トラップについて詳しく説明します。また、個々のトラップに対処するための回復手順についても必要に応じて説明します。

トラブルシューティングに役立つファイル

以下の Oracle Communications Converged Application Server のログ ファイルおよびコンフィグレーション ファイルはトラブルシューティングに役立つことが多く、テクニカル サポートへの問い合わせの際に必要になることがあります。

テクニカル サポート チームが問題を解決する上で、次のような一般情報が役立つことがあります。

トラップの説明

表  2-1 は、Oracle Communications Converged Application Server の各種 SNMP トラップをエンジン層のサーバで生成されるトラップと SIP データ層のサーバで生成されるトラップに分けて示したものです。それぞれのトラップについては、表に続く各節で説明します。

表 2-1 Oracle Communications Converged Application Server の SNMP トラップ
トラップが生成されるサーバ ノード
トラップ名
エンジン層サーバ
エンジン層サーバと SIP データ層サーバ (サーバがクラスタのメンバーである場合)
SIP データ層サーバ

connectionLostToPeer

説明

エンジン層のサーバ インスタンスが SIP データ層のレプリカに接続できなくなった場合は、そのエンジン層サーバでこのトラップが生成されます。エンジン層と SIP データ層の間でネットワーク接続の問題が起きている可能性があります。また、SIP データ層のサーバで障害が発生している場合は、このトラップと共に追加のトラップが生成されることがあります。

回復手順

サーバの障害を示す他のトラップとは無関係にこのトラップが発生している場合は、一般にネットワークで障害が起きています。ネットワーク コネクションは、関わっているエンジン層のサーバと SIP データ層のサーバの間に質しまたは直します。

SIP データ層のサーバの障害を示す追加のトラップ (たとえば dataTierServerStopped) と共に発生している場合は、そのトラップの回復手順に従います。

connectionReestablishedToPeer

説明

以前に接続に失敗したエンジン層のサーバ インスタンスが (connectionLostToPeer トラップが生成された後で) SIP データ層のサーバへの再接続に成功した場合は、そのエンジン層サーバでこのトラップが生成されます。このトラップが繰り返し発生する場合は、エンジン層と SIP データ層の間で断続的なネットワーク障害が起きている可能性があります。

回復手順

connectionLostToPeer」を参照してください。

dataTierServerStopped

説明

データ層に属する WebLogic Server インスタンスで回復不能なエラーが発生した場合は、Oracle Communications Converged Application Server の SIP データ層ノードでこのアラームが生成されます。このトラップは、エラーによって停止しようとしているサーバ自体で生成される場合と、同じパーティション内の別のレプリカで生成される場合があり、一部のケースでは両方のサーバで生成されることもあります (ネットワークの障害発生時には両方のサーバで同じトラップが生成されることがあります)。

回復手順

serverStopped」の回復手順を参照してください。

overloadControlActivated、overloadControlDeactivated

説明

Oracle Communications Converged Application Server のエンジン層ノードでは、処理される新しい SIP リクエストの数を制御できるように、コンフィグレーション可能なスロットル機能のメカニズムが使われています。コンフィグレーションされている過負荷状態に達すると、Oracle Communications Converged Application Server は新しい SIP リクエストを破棄し、呼び出し側に「“503 Service Unavailable」で応答します。コンフィグレーションされているしきい制御値に従って、過負荷状態が解消するまでサーバは新しいリクエストを破棄し続けます。このアラームは、スロットル機能のメカニズムがアクティブになっているときに生成されます。スロットル機能の動作により、サーバは最終的に過負荷でない状態に戻るので、それ以上のアクションは必要ありません。『コンフィグレーション リファレンス マニュアル』の「Overload」を参照してください。

回復手順

1. 他のサーバをチェックし、過負荷に近い状態かどうかを確認します。

2. ロード バランサがアプリケーション サーバ間で正しく負荷を分散しているかどうか、それとも 1 つまたは複数のサーバを過負荷状態にしているかどうかを確認します。追加のサーバが過負荷に近い状態の場合は、直ちに Tier 4 サポートに連絡してください。

3. 問題が 1 つのサーバに限られている場合は、1 時間以内に Tier 4 サポートに通知してください。

過負荷に関するその他の FAQ

質問 : 管理サーバを使って負荷をモニタするにはどうすればよいですか。しきい値に近い状態であることはどうすればわかりますか。

回答 : キューの長さを着信呼び出し過負荷制御として設定すると、Administration Console を使ってキューの長さをモニタすることができます。セッション レート制御を指定すると、Administration Console を使ってセッション レートをモニタできません。(Administration Console には、SIP セッションの現在の数だけが表示され、新しいセッションが生成されるレートは表示されません)。

replicaAddedToPartition

説明

サーバ インスタンスがデータ層のパーティションに追加された場合は、Oracle Communications Converged Application Server の SIP データ層ノードでこのアラームが生成されます。

回復手順

このトラップは、SIP データ層のサーバを起動した場合の通常の起動処理時に生成されます。

replicaRemovedEnginesRegistration

説明

登録されていない (または登録済みエンジンのリストから削除されている) エンジン サーバ クライアントは SIP データ層と通信しようとすると、SIP データ層ノードでこのアラームが生成されます。 一般に、このトラップはserverStopped トラップ後に続いています。これは、SIP データ層の一貫性を保持するためにエンジン層サーバはシャットダウンされていること示しています。

回復手順

エンジン層サーバを再起動します。このトラップが繰り返し発生する場合は、エンジン層と 1 つまたは複数のレプリカの間でネットワーク接続の問題が起きている可能性があります。

replicaRemovedFromPartition

説明

通常の停止操作によって、または障害が原因でサーバが SIP データ層から削除された場合は、Oracle Communications Converged Application Server の SIP データ層ノードでこのアラームが生成されます。このトラップが生成されるのは、サーバの削除後、そのパーティション内で少なくとも 1 つのレプリカが動作し続けている場合だけです。レプリカが 1 つしか存在しないパーティションでそのレプリカに障害が発生した場合は、トラップを生成できません。また、レプリカに障害が発生したことはエンジン層のノードによって検出されるので、このトラップが生成可能であるためには、いずれかのエンジン層ノードが実行されている必要があります。

回復手順

サーバ インスタンスの障害が原因でこのトラップが生成された場合は、例外を示す追加のトラップが生成されます。replicaRemovedFromPartition と共に生成されたトラップの回復手順を参照してください。

serverStopped

説明

このトラップは、WebLogic Server インスタンスが現在ダウンしていることを示します。このトラップはエンジン層と SIP データ層の両方のサーバ インスタンスに適用されますが、それは、サーバが名前付きの WebLogic Server クラスタのメンバーである場合に限られます。このトラップが、制御された停止によって発生したのではなく、自然に生成された場合は、次の手順に従います。

回復手順
  1. 次のコマンドを使用して、ハングしているプロセスを特定します。
  2. ps – ef | grep java

    マシンで実行中の WebLogic Server インスタンスごとに、対応する PID が 1 つだけあるはずです。

  3. 影響を受けている PID を特定したら、次のコマンドを使ってプロセスを強制停止します。
  4. kill -3 [pid]
  5. このコマンドを実行すると、実際のスレッド ダンプが生成されます。プロセスが直ちに停止しない場合は、潜在的なデッドロックの問題の診断に役立つように、プロセスが停止するまで 5 ~ 10 秒間隔でコマンドを何度か繰り返します。
  6. すぐに Oracle Communications Converged Application Server を再起動してみます。『Oracle WebLogic Server 10g Release 3 ドキュメント』の「障害の発生した管理対象サーバの再起動」を参照してください。
  7. トラブルシューティングに役立つように、影響を受けたサーバのすべての SIP ログのバックアップ コピーを作成します。ログの場所は、サーバのコンフィグレーションによって異なります。
  8. Tier 4 サポートが問題を解決する際に役立つように、各ログをコピーします。
  9. 注意 : Oracle Communications Converged Application Server のログは、システムのコンフィグレーションに従って切り捨てられます。重要なトラブルシューティングの情報が失われないように、バックアップ ログを直ちに作成してください。
  10. Tier 4 サポートに連絡し、トラブル チケットにログ ファイルを含めます。
  11. その後 24 時間にわたり、サーバを注意深くモニタします。ログ ファイルで問題の原因を特定できない場合は、ハードウェアやネットワークに問題があり、それが時間をおいて再発することがあります。
停止に関するその他の FAQ

質問 : サーバが停止した場合、サーバのすべての SNMP トラップが失われるのですか。

回答 : Administration Console が管理対象 WebLogic Server インスタンスの SNMP メッセージを生成するのは、ServerShutDown メッセージを受け取るまでです。それ以降は、追加のメッセージは生成されません。

sipAppDeployed

説明

SIP サーブレットがコンテナにデプロイされた場合は、Oracle Communications Converged Application Server のエンジン層ノードでこのアラームが生成されます。

回復手順

このトラップは、通常のデプロイメント処理時に生成されます。例外を示しているわけではありません。

sipAppUndeployed

説明

SIP アプリケーションが停止した場合、または SIP アプリケーションがアンデプロイされた場合は、Oracle Communications Converged Application Server のエンジン層ノードでこのアラームが生成されます。一般に、アクティブなリクエストがまだ存在するにもかかわらず Oracle Communications Converged Application Server が停止した場合に発生します。

回復手順

通常の停止の手順では、このアラームは除去されるため、通知されないはずです。通常の運用の最中にこのアラームが発生した場合は、誰かがアプリケーションまたはサーバを突然停止させたか、アプリケーションに問題があることを意味しています。直ちに Tier 4 サポートに連絡してください。

sipAppFailedToDeploy

説明

アプリケーションが Web アプリケーションとしては正しくデプロイされたが、SIP アプリケーションとしてデプロイされなかった場合は、Oracle Communications Converged Application Server のエンジン層ノードでこのトラップが生成されます。

回復手順

無効な sip.xml コンフィグレーション ファイルが原因で起きることが多く、ソフトウェアのインストール時またはアップグレード時にのみ発生します。この問題が発生した場合は、アプリケーションをアンデプロイし、sip.xml ファイルを検証した後、デプロイメントをやり直します。

注意 : 通常の運用時にこのアラームが発生することは決してないはずです。もし発生した場合は、直ちに Tier 4 サポートに連絡してください。

  ページの先頭       前  次