ヘッダーをスキップ
Oracle Clusterwareインストレーション・ガイド
11gリリース1(11.1)for Linux
E05831-04
  目次
目次
索引
索引

戻る
戻る
 
次へ
次へ
 

7 Oracle Clusterwareのインストール後の手順

この章では、Oracle Clusterwareソフトウェアをインストールした後に実行する、インストール後の作業について説明します。

この章の内容は次のとおりです。

7.1 インストール後に必要な作業

インストールを完了したら、次の作業を実行する必要があります。

7.1.1 インストール後の投票ディスクのバックアップ

Oracle Clusterwareのインストールを完了し、システムが正常に動作していることを確認したら、投票ディスクの内容をバックアップします。これには、ddユーティリティを使用します。次に例を示します。

# dd if=/dev/sda1 of=/dev/myvdisk1.bak

ノードの追加または削除、あるいはいずれかの削除手順を実行した後も、投票ディスクの内容をバックアップします。

7.1.2 入出力フェンシングの構成

次の項で、入出力フェンシングの構成について説明します。

7.1.2.1 入出力フェンシングについて

入出力フェンシング(I/Oフェンシング)は、クラスタから削除されたノードがクラスタの共有記憶域への書込みを行わないようにするために必要なメカニズムです。 フェンシングを提供するメカニズムは、hangcheck-timerカーネル・モジュールおよびOracle Clusterwareプロセス・モニター・デーモン(oprocd)です。 oprocdプロセスは、Oracle Clusterwareのインストール時にインストールされます。 両方のメカニズムが必要です。

hangcheck-timerおよびoprocdはそれぞれ独立したメカニズムです。 oprocdプロセスは、ハングアップをチェックする追加の機能を提供し、hangcheck-timerが見落としたハングアップの状態を検出できます。

7.1.2.2 hangcheck-timerモジュールの構成

insmodまたはmodprobeを使用して、rootとしてhangcheck-timerカーネル・モジュールをロードします。 この項の例ではmodprobeコマンドが使用されています。

次に示すhangcheck-timer設定を確認します。

  • hangcheck_tickパラメータ: このパラメータは、hangcheck-timerがノードのハングアップ状態を確認する頻度(秒)を定義します。 デフォルト値は60秒です。 hangcheck_tickの値を1に変更することをお薦めします。

  • hangcheck_marginパラメータ: このパラメータは、タイマーがカーネルからの応答を待機する時間(秒)を定義します。 デフォルト値は180秒です。 hangcheck_marginの値を10に変更することをお薦めします。

  • hangcheck_rebootパラメータは、カーネルがhangcheck_tickパラメータとhangcheck_marginパラメータの合計値内に応答しなかった場合に、hangcheck-timerがノードを再起動するかどうかを決定します。 hangcheck_rebootの値が1以上である場合、hangcheck-timerモジュールはハングアップが検出されるとシステムを再起動します。 hangcheck_rebootパラメータが0に設定されている場合、hangcheck-timerモジュールはハングアップが検出されてもノードを再起動しません。


    注意:

    Linux 2.6カーネルでは、hangcheck_rebootはデフォルトで0に設定されています。ハングアップが検出された場合にシステムを再起動するには、hangcheck_rebootの値を常に1に設定しておく必要があります。

これらの設定は、CSSミスカウントの値がリリース11gとリリース10gのそれぞれのデフォルトである30秒または60秒に設定されていることを前提としています。 CSSミスカウントの値は、常にhangcheck_tickhangcheck_marginの合計値よりも大きい値である必要があります。

クラスタのパフォーマンスを最適にするには、hangcheckパラメータを推奨値にしてアプリケーションをテストします。 これらの値によってクラスタが誤ってノードを削除していることがわかった場合は、Oracleサポート・サービスに連絡し、hangcheck_marginパラメータ値を増やします。

hangcheck-timerを構成するには、次の手順を実行します。

  1. rootユーザーでログインします。

  2. hangcheck-timerの設定がモジュールの構成ファイルに示されているかどうかを確認します。 Red HatおよびOracle Enterprise Linuxでは、このファイルは/etc/modprobe.confです。 SUSEでは、/etc/modprobe.conf.localです。次に例を示します。

    # more /etc/modprobe.conf |grep hang
    

    次のように表示されます。

    options hangcheck-timer hangcheck_tick=1 hangcheck_margin=10 hangcheck_reboot=1
    
  3. hangcheckの構成が存在しないか、存在しても推奨値が設定されていない場合は、次のようなコマンドを入力して構成ファイルにロードします。 次に、Red HatおよびOracle Enterprise Linuxの場合の例を示します。

    # echo "options hangcheck-timer hangcheck_tick=1 hangcheck_margin=10 \
    hangcheck_reboot=1" >>/etc/modprobe.conf
    
  4. 次のコマンドを入力して、hangcheck-timerの値を新しくロードします。

    # /sbin/modprobe -v hangcheck-timer
    
  5. 次のコマンドを入力して、hangcheckモジュールがロードされたことを確認します。

    # /sbin/lsmod | grep hang
    

    出力結果は次のようになります。

     hangcheck_timer         3289  0
    
  6. システムを再起動するたびにモジュールをロードするには、ローカル・システムの起動ファイルに/sbin/modprobe -v hangcheck-timerコマンドが含まれることを確認するか、または必要に応じて追加します。

    • Red Hat:

      Red Hat Enterprise Linuxシステムの場合は、/etc/rc.d/rc.localファイルにコマンドを追加します。

    • SUSE:

      SUSEシステムの場合は、/etc/init.d/boot.localファイルにコマンドを追加します。

  7. クラスタ・メンバーを作成する各ノードでこの手順を繰り返します。

7.1.2.3 Oracle Clusterwareプロセス・モニター・デーモンの構成

Oracle Clusterwareプロセス・モニター・デーモン(oprocd)プロセスは、Oracle Clusterwareソフトウェア・インストールの一部です。 システムのハングアップを検出するためにOracle Clusterwareによって自動的に起動されます。 システムのハングアップを検出すると、ハングアップしたノードを再起動します。

オペレーティング・システム間およびオペレーティング・システムのバージョン間で、様々なスケジューリング待機時間があることがわかっています。 このようなスケジューリング待機時間が原因で、特にシステム負荷が大きい場合にoprocdのデフォルト値では極端に不安定な状態になる可能性があり、その結果、oprocdによって不要な再起動(誤った再起動)が行われる場合があります。

スケジューリング待機時間は、その他の問題を引き起こす可能性があるため、オペレーティング・システム・ベンダーと協力して、この待機時間を可能なかぎり削減または排除することをお薦めします。

スケジューリング待機時間を回避するには、Oracle Clusterwareのdiagwaitパラメータ値を13に設定することをお薦めします。 この設定によって、障害が発生したノードが最終的なトレース・ファイルをフラッシュするまでの時間が増え、ノード障害の原因のデバッグに役立ちます。 diagwaitの設定を変更するにはクラスタを停止する必要があります。

より厳しいサービス・レベル要件を満たすためにフェイルオーバー回数を増やす必要がある場合は、Oracleサポート・サービスに対し、フェイルオーバーの設定を下げるためのチューニング方法についてアドバイスを受けるためのサービス・リクエストを行う必要があります。


注意:

diagwaitパラメータを変更するには、クラスタ全体を停止する必要があります。 初回インストール直後または計画された停止時に、diagwaitの設定を変更することをお薦めします。

diagwaitの設定を変更するには、次の手順を実行します。

  1. rootとしてログインし、すべてのノードで次のコマンドを実行します。CRS_homeは、Oracle Clusterwareインストールのホーム・ディレクトリです。

    # CRS_home/bin/crsctl stop crs
    
  2. 次のコマンドを入力します。CRS_homeは、Oracle Clusterwareホームです。

    # CRS_home/bin/oprocd stop
    

    すべてのノードでこのコマンドを繰り返します。

  3. クラスタの1つのノードで、rootとして次のコマンドを発行し、diagwaitパラメータ値を13秒に変更します。

    # CRS_home/bin/crsctl set css diagwait 13 -force
    
  4. すべてのノードで次のコマンドを実行し、Oracle Clusterwareを再起動します。

    # CRS_home/bin/crsctl start crs
    
  5. 次のコマンドを実行し、Oracle Clusterwareが正常に機能していることを確認します。

    # CRS_home/bin/crsctl check crs
    

7.1.3 パッチの更新のダウンロードおよびインストール

OracleMetaLink Webサイトを参照して、インストールした環境に必要なパッチの更新を確認します。必要なパッチの更新をダウンロードするには、次の手順を実行します。

  1. Webブラウザを使用して、次のOracleMetaLink Webサイトを表示します。

    https://metalink.oracle.com

  2. OracleMetaLinkにログインします。


    注意:

    OracleMetaLinkの登録ユーザーでない場合は、「Register for MetaLink」をクリックして登録してください。

  3. OracleMetaLinkのメイン・ページで「Patches&Updates」をクリックします。

  4. 「Patches & Update」ページで「Advanced Search」をクリックします。

  5. 「Advanced Search」ページで「Product or Product Family」フィールドの横にある検索アイコンをクリックします。

  6. 「Search and Select: Product Family」フィールドで「Search」リスト・フィールドの「Database and Tools」を選択し、テキスト・フィールドに「RDBMS Server」と入力して「Go」をクリックします。

    RDBMSサーバーが「Product or Product Family」フィールドに表示されます。現行のリリースが「Release」フィールドに表示されます。

  7. 「Platform」フィールドのリストからプラットフォームを選択して、選択リストの下の「Go」をクリックします。

  8. 「Results」ヘッダーの下に使用可能なパッチの更新が表示されます。

  9. ダウンロードするパッチの番号をクリックします。

  10. 「Patch Set」ページで「View README」 をクリックして、表示されるページを読みます。READMEページには、そのパッチ・セットに関する情報と、パッチの適用方法が記載されています。

  11. 「Patch Set」ページに戻って「Download」をクリックし、ファイルをシステムに保存します。

  12. Oracle Database 10gに付属のunzipユーティリティを使用して、OracleMetaLinkからダウンロードしたOracleパッチの更新を解凍します。unzipユーティリティは$ORACLE_HOME/binディレクトリにあります。

  13. パッチをインストールする準備としてデータベース・プロセスを停止する方法については、付録Bを参照してください。

7.2 インストール後の推奨作業

Oracle Clusterwareをインストールした後で、次の作業を行うことをお薦めします。

7.2.1 root.shスクリプトのバックアップ

インストールの完了後に、root.shスクリプトをバックアップすることをお薦めします。同じOracleホーム・ディレクトリに他の製品をインストールすると、Oracle Universal Installer(OUI)は、インストール中に既存のroot.shスクリプトの内容を更新します。元のroot.shスクリプトの情報が必要になった場合は、root.shファイルのコピーから元に戻すことができます。

7.2.2 CVUによるインストール後の確認の実行

Oracle Clusterwareをインストールした後に、cluvfy stage -post crsinstコマンドを使用して、Oracle Clusterwareインストールの状態を確認します。次の構文を使用します。

cluvfy stage -post crsinst -n node_list [-verbose]