Sun Microsystems Sun Fire High-Eng and Midrange Systems User's Guide [ja]

Sun Fire
ハイエンド/ミッドレンジシステム
Sun Microsystems, Inc. www.sun.com
Dynamic Reconfiguration
Part No. 819-3187-10 2005 8 , Revision A
コメントの送付: http://www.sun.com/hwdocs/feedback
Copyright 2005 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, California 95054, U.S.A. All rights reserved.
米国 Sun Microsystems, Inc. (以下、米国 Sun Microsystems 社とします) は、本書に記述されている技術に関する知的所有権を有していま す。これら知的所有権には、http://www.sun.com/patents に掲載されているひとつまたは複数の米国特許、および米国ならびにその他の 国におけるひとつまたは複数の特許または出願中の特許が含まれています。
本書およびそれに付属する製品は著作権法により保護されており、その使用、複製、頒布および逆コンパイルを制限するライセンスのもと において頒布されます。サン・マイクロシステムズ株式会社の書面による事前の許可なく、本製品および本書のいかなる部分も、いかなる 方法によっても複製することが禁じられます。
本製品のフォント技術を含む第三者のソフトウェアは、著作権法により保護されており、提供者からライセンスを受けているものです。 本製品の一部は、カリフォルニア大学からライセンスされている Berkeley BSD システムに基づいていることがあります。UNIX は、
X/Open Company Limited が独占的にライセンスしている米国ならびに他の国における登録商標です。 本製品は、株式会社モリサワからライセンス供与されたリュウミン L-KL (Ryumin-Light) および中ゴシック BBB (GothicBBB-Medium)
フォント・データを含んでいます。 本製品に含まれる HG 明朝 L HG ゴシック B は、株式会社リコーがリョービイマジクス株式会社からライセンス供与されたタイプフェー
スマスタをもとに作成されたものです。平成明朝体 W3 は、株式会社リコーが財団法人 日本規格協会 文字フォント開発・普及センターから ライセンス供与されたタイプフェースマスタをもとに作成されたものです。また、HG 明朝 L HG ゴシック B の補助漢字部分は、平成明 朝体W3 の補助漢字を使用しています。なお、フォントとして無断複製することは禁止されています。
SunSun MicrosystemsAnswerBook2docs.sun.comSun Fire は、米国およびその他の国における米国 Sun Microsystems 社の商標もし くは登録商標です。サンのロゴマークおよび Solaris は、米国 Sun Microsystems 社の登録商標です。
すべての SPARC 商標は、米国 SPARC International, Inc. のライセンスを受けて使用している同社の米国およびその他の国における商標また は登録商標です。SPARC 商標が付いた製品は、米国 Sun Microsystems 社が開発したアーキテクチャーに基づくものです。
OPENLOOKOpenBootJLE は、サン・マイクロシステムズ株式会社の登録商標です。 ATO K は、株式会社ジャストシステムの登録商標です。ATO K8 は、株式会社ジャストシステムの著作物であり、ATO K8 にかかる著作権そ
の他の権利は、すべて株式会社ジャストシステムに帰属します。ATOK Server/ATOK12 は、株式会社ジャストシステムの著作物であり、 ATOK Server/ATOK12 にかかる著作権その他の権利は、株式会社ジャストシステムおよび各権利者に帰属します。
本書で参照されている製品やサービスに関しては、該当する会社または組織に直接お問い合わせください。 OPEN LOOK および Sun™ Graphical User Interface は、米国 Sun Microsystems 社が自社のユーザーおよびライセンス実施権者向けに開発
しました。米国 Sun Microsystems 社は、コンピュータ産業用のビジュアルまたは グラフィカル・ユーザーインタフェースの概念の研究開 発における米国 Xerox 社の先駆者としての成果を認めるものです。米国 Sun Microsystems 社は米国 Xerox 社から Xerox Graphical User
Interface の非独占的ライセンスを取得しており、このライセンスは米国 Sun Microsystems 社のライセンス実施権者にも適用されます。 U.S. Government Rights—Commercial use. Government users are subject to the Sun Microsystems, Inc. standard license agreement and
applicable provisions of the FAR and its supplements.
本書は、「現状のまま」をベースとして提供され、商品性、特定目的への適合性または第三者の権利の非侵害の黙示の保証を含みそれに限 定されない、明示的であるか黙示的であるかを問わない、なんらの保証も行われないものとします。
本書には、技術的な誤りまたは誤植のある可能性があります。また、本書に記載された情報には、定期的に変更が行われ、かかる変更は本 書の最新版に反映されます。さらに、米国サンまたは日本サンは、本書に記載された製品またはプログラムを、予告なく改良または変更す ることがあります。
本製品が、外国為替および外国貿易管理法 (外為法) に定められる戦略物資等 (貨物または役務) に該当する場合、本製品を輸出または日本国 外へ持ち出す際には、サン・マイクロシステムズ株式会社の事前の書面による承諾を得ることのほか、外為法および関連法規に基づく輸出 手続き、また場合によっては、米国商務省または米国所轄官庁の許可を得ることが必要です。
原典: Sun Fire High-End and Midrange Systems Dynamic Reconfiguration User’s Guide
Part No: 819-1501-10 Revision A
Please
Recycle
目次
はじめに xi
1. DR の概要 1
Sun Fire ハイエンドおよびミッドレンジシステムでの DR 1
DR の機能 2
一般的な DR 操作の概要 3
DR を使用する 3
ホットプラグハードウェア 4
自動 DR (ADR) 5
Capacity on Demand (COD) 5
Solaris ソフトウェアでの DR 6
Solaris 9 または Solaris 10 OS を実行しているドメインでの DR 6
Solaris 8 OS を実行しているドメインでの DR 6
2. DR の概念 9
動的システムドメイン 10
接続点 10
接続点のクラス 11
ハイエンドシステムの接続点 12
ミッドレンジシステムの接続点 12
iii
接続点の変更 13
状態と条件 13
ボードとボードスロットの状態 14
ボードの条件 15
コンポーネントの状態 15
コンポーネントの条件 16
切り離し可能性 16
永続メモリーと非永続メモリー 17
コピーと名前の変更 17
メモリーインタリーブ 18
修正可能なメモリーエラー 18
休止 19
一時停止に対して安全なデバイスと一時停止に対して危険なデバイス 20
入出力ボードでの DR 21
ハイエンドシステムの入出力ボード、Golden IOSRAMMaxCPU、および
hsPCI+ 21
ミッドレンジシステムの I/O アセンブリ、PCI、および CompactPCI 22
CompactPCI に固有の制限事項 22
共通の DR ボード操作 23
接続操作 23
構成操作 24
切り離し操作 24
構成解除操作 25
DR の概念図 25
3. DR 操作を実行する前に 29
cfgadm(1M) コマンド 29
cfgadm(1M) コマンド (ハイエンドシステムのみ)31
デバイスのタイプ、状態、条件の確認 31
iv Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
状態、タイプ、条件を表示する 32
ボードスロットおよびコンポーネントの情報を表示する 32
ドメインで DR 操作を実行する前に 32
ドメインでボードが使用可能かどうかを表示する 32
システムボードのステータスの表示 33
システムボードのステータスを表示する 33
ボードのテスト 34
システムボードをテストする 34
入出力ボードをテストする (ミッドレンジシステムのみ)35
入出力ボードで DR 操作を実行する前に (ハイエンドシステムのみ)36
4. システムドメインからの DR 操作 39
システムボードの追加 40
システムボードを取り付ける 40
システムボードを接続するだけで構成はしない 41
接続されたシステムボードを構成する 41
システムボードの削除 42
システムボードを削除する 42
システムボードの構成解除は行うが切り離しは行わない 42
構成解除されたシステムボードを削除する 42
システムボードを一時的に削除する 42
ドメインの永続メモリーを搭載したシステムボードを検出する 43
永続メモリーを搭載したシステムボードの構成を解除する 43
システムボードの移動 44
システムボードを別のドメインに移動する 44
入出力ボードの追加 45
入出力ボードを追加する 45
入出力ボードを追加し接続するが、構成はしない 46
接続された入出力ボードを構成する 46
目次 v
入出力ボードを削除する 47
入出力ボードの構成解除は行うが切り離しは行わない 47
構成解除された入出力ボードを切り離す 47
メモリーと CPU の追加、削除、追跡 47
システムボード上の CPU を構成する 47
システムボード上のメモリーを構成する 48
システムボード上のすべての CPU とメモリーを構成する 48
システムボード上の CPU の構成を解除する 48
システムボード上のメモリーの構成を解除する 48
システムボード上のすべての CPU とメモリーの構成を解除する 49
メモリー構成解除操作を追跡する 49
PCI アダプタカードの操作 49
入出力ボード上の PCI スロットに接続する 50
入出力ボード上の PCI スロットを構成する 50
入出力ボード上の PCI スロットを切り離す 50
入出力ボード上の PCI スロットの構成を解除する 51
5. SC からの SMS DR 操作 (ハイエンドシステムのみ)53
デバイス情報の表示 54
デバイス情報を表示する 54
プラットフォーム情報の表示 56
プラットフォーム情報を表示する 57
ボード情報の表示 57
SC 状態モデル 57
showboards(1M) コマンド 58
ボード情報を表示する 59
ボードの追加 59
ドメインにボードを追加する 60
ボードの削除 60
vi Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ドメインからボードを削除する 61
ボードの移動 61
ボードを移動する 62
アクティブなシステムボードの交換 62
アクティブなシステムボードを交換する 63
SMS DR コマンドとオプション 63
addboard(1M) 64
deleteboard(1M) 66
moveboard(1M) 68
rcfgadm(1M) 70
scdrhelp(1M) 71
showboards(1M) 72
showdevices(1M) 72
showplatform(1M) 73
エラーメッセージヘルプシステム 74
JavaHelp の目次 75
JavaHelp の索引 75
JavaHelp の検索 75
6. DR の内部 77
ドメイン上のソフトウェアコンポーネント 77
ドメイン構成サーバー (ハイエンドシステムのみ)77
DR ドライバ 78
Reconfiguration Coordination Manager (RCM) 78
システムイベントフレームワーク 78
SC 上のソフトウェアコンポーネント
(ハイエンドシステムのみ)79
DR 管理モデル 79
DR プロセスとデーモン 79
目次 vii
ドメイン構成エージェント (DCA) 79
プラットフォーム構成デーモン (PCD) (ハイエンドシステムのみ)80
ドメイン X サーバー (DXS) 80
A. DR コマンドの一覧 81
B. トラブルシューティング 85
構成解除操作の障害 85
システムボードの構成解除の障害 86
メモリーが複数のボードにインタリーブされている場合、ボードの構成
を解除できない 86
プロセスが割り当てられている CPU の構成は解除できない 86
すべてのメモリーの構成を解除しないと、CPU の構成を解除できない
(ミッドレンジシステムのみ)87
永続メモリーを搭載したボード上のメモリーの構成を解除できない 87
CPU の構成を解除できない 88
ボードを切り離せない 89
入出力ボードの構成解除の障害 89
デバイスビジー 89
入出力デバイスでの問題 89
RPC または TCP のタイムアウトと接続ロス 91
構成操作の障害 91
メモリーの構成の障害 (ミッドレンジシステムのみ)91
入出力ボードの構成の障害 91
用語集 93
索引 97
viii Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
表目次
1-1 主な DR 操作 3
2-1 ボードとボードスロットの状態 14
2-2 ボードの構成と構成解除 14
2-3 SC からのみ確認できるボードの状態 15
2-4 ボードとボードスロットの条件 15
2-5 接続されたコンポーネント:構成された状態または構成解除された状態 16
2-6 CPU またはメモリーモジュールの条件 16
3-1 cfgadm オプション 30
3-2 システムボードのステータス表示例 33
3-3 診断レベル 35
5-1 showdevices による CPU 情報の出力例 54
表 5-2 showdevices による UltraSPARC IV+ の情報の出力例 (showdevices -d G)54
5-3 showdevices によるメモリードレイン状況の出力例 55
5-4 showdevices による入出力デバイス情報の出力例 55
5-5 Sun Fire ハイエンドシステムの SC で確認できるボードの状態 58
5-6 addboard コマンドオプション 64
5-7 addboard コマンドを実行するために必要な特権 65
5-8 deleteboard コマンドオプション 66
5-9 deleteboard コマンドを実行するために必要な特権 67
5-10 moveboard コマンドオプション 68
ix
5-11 moveboard コマンドを実行するために必要な特権 69
5-12 rcfgadm コマンドオプション 70
5-13 rcfgadm コマンドを実行するために必要な特権 71
5-14 showboards コマンドオプション 72
5-15 showdevices コマンドオプション 73
5-16 showplatform コマンドオプション 73
A-1 DR 操作と DR コマンドの一覧 81
x Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
はじめに
このマニュアルでは、Solaris™ オペレーティングシステム (Solaris OS) を実行してい る Sun Fire™ E25K/E20K/15K/12K システムおよび Sun Fire E6900/E4900/6800/4810/4800/3800 システムの動的再構成 (DR) ソフトウェアにつ いて説明します。
このマニュアルは、以下のユーザーマニュアルに代わるマニュアルです。
Sun Fire ハイエンドシステム Dynamic Reconfiguration ユーザーマニュアル』
Sun Fire ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュア
ル』
System Management Services (SMS) Dynamic Reconfiguration ユーザーマニュ
アル』
お読みになる前に
このマニュアルは、UNIX® システム、特に Solaris オペレーティング環境のシステ ムでの作業経験を持つ Sun Fire ハイエンド/ミッドレンジシステム管理者を対象にし ています。このような経験がない場合は、まずこのシステムに付属の Solaris ユー ザー向けおよびシステム管理者向けマニュアルを読み、UNIX システム管理のトレー ニングの受講を検討してください。
xi
UNIX コマンド
このマニュアルには、システムの停止、システムの起動、およびデバイスの構成など に使用する基本的な UNIX® コマンドと操作手順に関する説明は含まれていない可能 性があります。これらについては、以下を参照してください。
使用しているシステムに付属のソフトウェアマニュアル
下記にある Solaris™ オペレーティングシステムのマニュアル
http://docs.sun.com
シェルプロンプトについて
シェル プロンプト
UNIX C シェル
UNIX Bourne シェルと Korn シェル
スーパーユーザー (シェルの種類を問わない)
machine_name%
$
#
xii Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
書体と記号について
書体または記号
AaBbCc123
AaBbCc123
AaBbCc123
『 』 参照する書名を示します。 Solaris ユーザーマニュアル』
「 」 参照する章、節、または、強調
\
1 使用しているブラウザにより、これらの設定と異なって表示される場合があります。
1
意味
コマンド名、ファイル名、ディ レクトリ名、画面上のコン ピュータ出力、コード例。
ユーザーが入力する文字を、画 面上のコンピュータ出力と区別 して表します。
コマンド行の可変部分。実際の 名前や値と置き換えてくださ い。
する語を示します。
枠で囲まれたコード例で、テキ ストがページ行幅を超える場合 に、継続を示します。
.login ファイルを編集します。 ls -a を実行します。
% You have mail.
マシン名% Password:
rm filename と入力します。
6 章「データの管理」を参照。 この操作ができるのは「スーパーユー
ザー」だけです。
% grep ‘^#define \ XV_VERSION_STRING’
su
はじめに xiii
関連マニュアル
オンラインマニュアルは、下記の URL から参照できます。
http://www.sun.com/products-n-solutions/hardware/docs/
分類 マニュアル名
プラットフォーム固有の マニュアル
プラットフォーム固有の 補足情報
cfgadm(1M) を含む Solaris コマンド
Sun Management Center
Capacity on Demand (COD)
Sun Fire ミッドレンジシステムプラットフォーム管理ガイ ド』
Sun Fire High-End Systems Administration Manual』System Management Services (SMS) 管理者マニュアル』 『SMS リファレンスマニュアル』
『Solaris Sun ハードウェアマニュアル (補足)』 (Solaris 8 およ び 9)』
『Solaris 10 ご使用にあたって』 『System Management Services (SMS) ご使用にあたって』
Solaris Command Reference Manual
Sun Management Center ユーザーガイド』
System Management Services (SMS) 管理者マニュアル』
マニュアル、サポート、およびトレーニ ング
Sun のサービス
マニュアル
サポートおよび トレーニング
xiv Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
URL
http://jp.sun.com/documentation/
http://jp.sun.com/supportraining/
説明
PDF HTML マニュアルをダウンロード する、印刷マニュアルを注文する
テクニカルサポートを受ける、パッチをダ ウンロードする、Sun のコースについて情 報を入手する
Sun 以外の Web サイト
このマニュアルで紹介する Sun 以外の Web サイトが使用可能かどうかについては、 Sun は責任を負いません。このようなサイトやリソース上、またはこれらを経由して
利用できるコンテンツ、広告、製品、またはその他の資料についても、Sun は保証し ておらず、法的責任を負いません。また、このようなサイトやリソース上、またはこ れらを経由して利用できるコンテンツ、商品、サービスの使用や、それらへの依存に 関連して発生した実際の損害や損失、またはその申し立てについても、Sun は一切の 責任を負いません。
コメントをお寄せください
マニュアルの品質改善のため、お客様からのご意見およびご要望をお待ちしておりま す。コメントは下記よりお送りください。
http://www.sun.com/hwdocs/feedback
ご意見をお寄せいただく際には、下記のタイトルと Part No. を記載してください。
Sun Fire ハイエンド/ミッドレンジシステム Dynamic Reconfiguration ユーザーマ ニュアル』、Part No. 819-3187-10
はじめに xv
xvi Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
1
DR の概要
「はじめに」で紹介した Sun Fire ハイエンドシステムおよびミッドレンジシステム は、固有のオペレーティングシステムを実行し、独立したコンピュータとして機能す る複数のドメインに配備することができます (10 ページの「動的システムドメイン」 を参照)。動的再構成 (DR) 機能では、ドメインを実行しながら、そのシステムボー ド、入出力ボード、および特定のコンポーネントの有効/無効を切り替えることがで きます。
DR の一部はドメイン内の Solaris ソフトウェアで実行され、cfgadm(1M) コマンド で管理されます。DR の別の部分は、システムコントローラ (SC) で実行されます。
この章では、以下のトピックについて説明します。
1 ページの「Sun Fire ハイエンドおよびミッドレンジシステムでの DR
2 ページの「DR の機能」
3 ページの「DR を使用する」
4 ページの「ホットプラグハードウェア」
5 ページの「自動 DR (ADR)
5 ページの「Capacity on Demand (COD)
6 ページの「Solaris ソフトウェアでの DR
Sun Fire ハイエンドおよびミッドレンジ システムでの DR
ミッドレンジシステムのシステムボードは、「CPU/メモリーボード」とも呼ばれま す。これらは、ハイエンドシステムのボードと同じものです。このマニュアルでは、 「システムボード」という用語で統一して記述します。システムボードは、ハイエン ドプラットフォームとミッドレンジプラットフォーム間で交換可能です。
1
ハイエンドシステムの入出力ボードとミッドレンジシステムの I/O アセンブリに は、共通点と相違点があります。このマニュアルでは、特に区別する必要がないかぎ り、どちらも「入出力ボード」という用語で統一して記述します。
ハイエンドシステムの入出力ボード上の入出力バスは、PCI カードまたは hsPCI+ カードと、MaxCPU ボードをサポートします。MaxCPU ボードには CPU 2 つあ りますが、メモリーは搭載されていません。このボードは、スロット 1 に入ります。
ミッドレンジシステムの入出力ボードは、PCI カードまたは CompactPCI カードを サポートします。
このマニュアルでは、特に区別する必要がないかぎり、hsPCI+ カードと CompactPCI カードをどちらも「PCI」と呼びます。
DR の機能
DR には、以下のような機能があります。
システムまたは入出力ボードのステータスおよび状態と、DR 操作の準備に役立つ
いくつかのコンポーネントを表示します。
ライブボードをテストします。
システムまたは入出力ボードを、別のドメインに接続したりシステムから削除し
たりする目的で、実行中のドメインから論理的に (電気的に) 切り離します。この 切り離しの操作を「ボードの削除アクション」と呼びます。
リソースを追加したり、削除したボードを交換したりする目的で、実行中のドメ
インにシステムまたは入出力ボードを論理的に接続します。この接続の操作を 「ボードの追加アクション」と呼びます。
システムボード上に CPU またはメモリーモジュールを構成したり、これらの構成
を解除したりすることによって、ドメインの電源や容量を制御し、障害が発生し たコンポーネントを特定します。
PCI カードまたは関連のコンポーネントおよびスロットの有効/無効を切り替えま
す。
たとえば、障害の発生したシステムボードを論理的に切り離したあと、システムの ホットプラグ機能を使って物理的に取り外すことができます。交換用ボードの取り付 けが完了したら、DR を使って、このボードをドメイン用に構成することができま す。DR 機能を使ってシステムボードやコンポーネントを追加または削除すると、こ れらのボードまたはコンポーネントは、常に既知の構成状態になります。システム ボードとコンポーネントの構成状態については、13 ページの「状態と条件」を参照 してください。
負荷均衡処理を行なったり、特定のタスクの追加機能を利用するため、システムボー ドや入出力ボードを別のドメインに割り当てることもできます。
2 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
一般的な DR 操作の概要
DR ソフトウェアでは、以下のタスクを実行できます。
システムボードや入出力ボードの追加、削除、またはドメイン間での移動。
システムボード上の CPU やメモリーモジュールの構成または構成解除。
PCI カードの入出力ボードへの接続および構成、PCI カードの入出力ボードからの
切断および構成解除。
上記のアクションをサポートする DR 操作は、大きく分けて、接続、構成、構成解 除、および切り離しの 4 種類です。
1-1 主な DR 操作
操作 説明
Connect
Configure
Unconfigure
Disconnect
ボードが取り付けられているスロットに電力が供給され、ボード温度の監 視が開始されます。
オペレーティングシステムにより、ボードに機能上の役割が割り当てら れ、このボードとこのボードに接続されているデバイスのデバイスドライ バが読み込まれます。構成操作には、接続操作が含まれます。
オペレーティングシステムからボードが論理的に切り離されて、関連する デバイスドライバがオフラインになります。環境の監視は引き続き行われ ますが、システムはボード上のいずれのデバイスも利用することはできま せん。
ボードが取り付けられているスロットの電源が切断され、ボードの監視が 停止します。切断操作には、構成解除操作が含まれます。
注 – 使用中のシステムボードの電源を切断するには、まず使用を中断し、ボードを
ドメインから切り離す必要があります。新しいシステムボードまたはアップグレード したシステムボードをスロットに挿入し、電源を投入したら、接続点 (10 ページの 「接続点」を参照) を接続し、オペレーティングシステムで使用できるように構成し ます。DR 操作の詳細は、23 ページの「共通の DR ボード操作」を参照してくださ い。
DR を使用する
DR 操作は、以下のいずれかの方法で実行できます。
Sun™ Management Center ソフトウェア付属の GUI を使用します。詳細は、
Sun Management Center ユーザーガイド』を参照してください。
1 DR の概要 3
ドメイン内で、適切なオプションとフラグを指定して Solaris コマンド
cfgadm(1M) を使用します。DR 関連のオプションを指定して cfgadm を実行する 方法は、タスク別に、39 ページの「システムドメインからの DR 操作」に記載さ れています。
ハイエンドシステムでは、SC 上で System Management Services (SMS) DR コマ
ンド rcfgadm(1M) を使用します。rcfgadm(1M) DR 関連のオプションは、 cfgadm(1M) と共通です。ただし、通常、rcfgadm(1M) のほうには、-d
domain_id パラメタを追加指定する必要があります。rcfgadm(1M) の詳細は、70 ページの「rcfgadm(1M)」を参照してください。
ハイエンドシステムでは、SC 上で、rcfgadm(1M) コマンドに加えて SMS DR
マンドも使用します。SMS DR コマンドには、addboard(1M) moveboard(1M)deleteboard(1M) などがあります。これらのコマンドについ
ては、『SMS リファレンスマニュアル』の「53 ページの「SC からの SMS DR 操 作 (ハイエンドシステムのみ)」」を参照してください。SMS ソフトウェアを実行 している SC ウィンドウで man(1) コマンドを実行しても、必要な情報を参照でき ます。
ミッドレンジシステム上で DR を実行するときは、DR 操作の前、または実行中に、 showplatformshowboards のようなミッドレンジシステムの SC コマンドを 1 つ以上実行する必要が生じることがあります。これらのコマンドの使用方法は、この マニュアルにも簡単に記載されていますが、詳細は、『Sun Fire ミッドレンジシステ ムコントローラコマンドリファレンスマニュアル』を参照してください。
注意 – ミッドレンジシステムの SC コマンド addboard および deleteboard は、
ハイエンドシステムの同名の SMS コマンドとは違って、DR コマンドではありませ ん。これらのミッドレンジシステムの SC コマンドを安全に使用できるのは、ドメイ ンへの電力供給が停止している場合だけです。上記のコマンドを含むミッドレンジシ ステムの各種 SC コマンドについては、『Sun Fire ミッドレンジシステムコントロー ラコマンドリファレンスマニュアル』を参照してください。
ホットプラグハードウェア
ホットプラグ可能なデバイスは、システムの実行中に論理的に接続または切断するこ とができます。ホットスワップ可能なデバイスは、システムの実行中に物理的に接続 または切断することができます。ホットプラグ可能なボードとモジュールには、ボー ドまたはモジュールに電力を供給してからデータピンに電流を通す特殊なコネクタが あります。ホットプラグコネクタのあるボードやデバイスは、システムの実行中に着 脱できます (ホットスワップ可能)。
システムボードと入出力ボードは、ホットプラグデバイスです。しかし、周辺電源装 置など、ホットプラグ対応モジュールでないデバイスもあり、これらのデバイスは、 システムの実行中には着脱できません。
4 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
自動 DR (ADR)
自動 DR (ADR) を使用すると、ユーザーの介入なしで、アプリケーションが自動的 に DR 操作を実行できます。ADR は、Reconfiguration Coordination Manager (RCM) とシステムイベント機能 sysevent を含む拡張 DR フレームワークを使用し ます。RCM は、アプリケーション固有のロード可能なモジュールがコールバックを 登録できるようにします。これらのコールバックは、DR 操作前の準備タスク、DR 操作中のエラー回復アクション、DR 操作後のクリーンアップを実行できます。シス テムイベントフレームワークでは、アプリケーションにシステムイベントを登録して おくことで、これらのイベントの通知を受けることができます。
ADR は、RCM および sysevent と連携して、アプリケーションがリソースの構成 を解除する前に自動的にそれらを解放したり、ドメインに新しいリソースが構成され たときに自動的にそれらを獲得できるようにします。
アプリケーションがドメインから cfgadm(1M) コマンドを実行することを「ローカ ル ADR」と呼びます。また、ハイエンドシステムで、アプリケーションが SC から SMS DR コマンドを実行することを「グローバル ADR」と呼びます。ハイエンドシ ステムでは、グローバル ADR を使って、システムボードを別のドメインに移動した り、ドメインにホットスワップ可能なボードを構成したり、ドメインからシステム ボードを削除したりできます。
Capacity on Demand (COD)
Capacity on Demand (COD) オプションを使って、Sun Fire システムに取り付けた COD システムボードに CPU リソースを追加できます。Sun Fire COD システムに
は、標準システムボードと COD システムボードの両方を取り付けることができま す。システムの各ドメインにアクティブな CPU 1 つ以上必要です。
DR を使用する場合も、標準システムボードの場合と同じ方法で、COD ボードをド メインに取り付けたり、ドメインから取り外したりできます。ただし、COD ボード 上の CPU を使用するには、そのための RTU (right-to-use) ライセンスを購入する必 要があります。COD RTU ライセンスごとに COD RTU ライセンスキーを取得でき、 これにより、単一のシステムの COD ボード上で特定の数の CPU を使用できるよう になります。
DR を使ってドメインに COD ボードを構成するときは、対象ドメインの RTU ライセ ンス数に十分余裕があり、COD ボード上のアクティブな CPU をすべて有効にでき ることを確認してください。COD ボードの追加時に RTU ライセンス数が不足してい ると、ドメイン内で有効にできない CPU ごとにステータスメッセージが表示されま す。
1 DR の概要 5
ハイエンドシステムの COD オプションについては、『System Management Services (SMS) 管理者マニュアル』を参照してください。
Solaris ソフトウェアでの DR
このマニュアルでは、Solaris 8Solaris 9、および Solaris 10 ソフトウェアリリース で実行される最新の DR バージョンについて説明しています。最新のパッチについて は、SunSolve い。
注 – 優れたパフォーマンスを実現し、最新の拡張機能を利用するためには、Sun
すべてのソフトウェアを最新版にすることをお勧めします。
以下の節では、特定の Solaris リリースで DR を使用する場合の注意事項を示しま す。
Solaris 9 または Solaris 10 OS を実行しているド メインでの DR
SM
のデータベース (http://sunsolve.sun.com) で確認してくださ
UltraSPARC IV+ システムボードは、Solaris 10 ソフトウェアでは Solaris 10 3/05 HW1 OS 以降、Solaris 9 ソフトウェアでは Solaris 9 9/05 OS 以降でサポートされま
す。古いボードが構成されているドメインに UltraSPARC IV+ ボードを追加すること は可能ですが、すべて UltraSPARC IV+ ボードで起動されたドメインに、DR を使っ て古いボードを追加することはできません。あらかじめドメインを停止しておけば UltraSPARC IV+ ボードで起動されたドメインに古いボードを追加することができま す。
Sun Fire ミッドレンジシステム上の UltraSPARC IV+ ボードでのドメイン制限に関す る追加情報は、Firmware Release 5.19 の『Sun Fire ミッドレンジシステムプラット フォーム管理ガイド』を参照してください。
Solaris 8 OS を実行しているドメインでの DR
入出力ボードの DR は、Solaris 8 ソフトウェア リリースの Solaris 8 2/02 以降でサ ポートされます。また、DR は、Sun Fire ハイエンドシステム上の System Management Services (SMS) 1.3 以降で完全にサポートされます。Solaris 8 2/02 以降 のバージョンを実行しているドメインで DR の全機能を利用するためには、ドメイン
6 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
にパッチと新しいカーネルアップデートをインストールし、ハイエンドサーバーのシ ステムコントローラ (SC) に最新版の SMS ソフトウェアをインストールする必要があ ります。UltraSPARC IV+ ボードは、Solaris 8 OS ではサポートされません。
1 DR の概要 7
8 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
2
DR の概念
この章では、DR を使用する前に理解しておくべき DR の概念について説明します。
ハイエンドサーバーのシステムコントローラ (SC) で、SMS DR コマンドを使って DR 操作を実行する場合は、第 5 章の 53 ページの「SC からの SMS DR 操作 (ハイエ ンドシステムのみ)」を必ずお読みください。この章の内容と第 5 章の内容は一部重 複していますが、説明の視点が異なっています。両方の章をお読みいただくことで、 DR の機能の全体像を把握しやすくなります。
この章では、以下のトピックについて説明します。
10 ページの「動的システムドメイン」
10 ページの「接続点」
13 ページの「状態と条件」
16 ページの「切り離し可能性」
17 ページの「永続メモリーと非永続メモリー」
19 ページの「休止」
20 ページの「一時停止に対して安全なデバイスと一時停止に対して危険なデバイ
ス」
21 ページの「入出力ボードでの DR
23 ページの「共通の DR ボード操作」
25 ページの「DR の概念図」
UltraSPARC IV+ ボードには、デュアルコア CPU が搭載されています。このマ
ニュアルに記載されている CPU やプロセッサは、シングルコアタイプかダブルコア タイプのどちらか一方を指している場合があります。このマニュアルに記載されてい るすべての手順は、この両方のタイプに共通です。
9
動的システムドメイン
Sun Fire システムは、いくつかのドメインに分割できます。各ドメインは、そのドメ インに割り当てられるシステムボードスロットに対応しています。これらのドメイン は、いくつかのハードウェアパーティションに電気的に分離されます。したがって、 あるドメインで障害が発生しても、サーバーのほかのドメインに影響はありません。
各ドメインの構成は、SC 上の構成データベース内で決定されます。構成データベー ス (ハイエンドシステムの場合、プラットフォーム構成データベース (PCD)) は、シ ステムボードスロットを複数のドメインに論理的に分割する方法を制御します。ドメ イン構成とは、予定のドメイン構成を表します。したがって、ドメイン構成には、空 のスロットと占有状態のスロットを含めることができます。物理ドメインは論理ドメ インによって決定されます。
特定のドメインで使用できるスロットの数は、ACL で制御されます。ACL は、ハイ エンドシステムドメインでは使用可能なコンポーネントのリスト、ミッドレンジシス テムドメインではアクセス制御リストを意味します。すべてのドメインの ACL は、 SC で管理されます。スロットの状態を変更するには、まずスロットをドメインに割 り当て、使用可能な状態にする必要があります。ドメインに割り当てられたスロット はそのドメインには見えますが、他のドメインからは使用できず、また見えません。 逆に言えば、スロットをほかのドメインに割り当てて接続するには、あらかじめその スロットを元のドメインから切り離し、割り当てを解除しておく必要があります。
論理ドメインとは、ドメインに属する一連のスロットのことです。物理ドメインと は、物理的に相互接続された一連のボードのことです。論理ドメインのメンバーのス ロットが、必ずしも物理ドメインに含まれるとは限りません。ドメインが起動した ら、システムボードと空スロットを論理ドメインに割り当てたり、論理ドメインから 割り当て解除したりできます。ただし、オペレーティングシステムから要求があるま では、物理ドメインの一部にすることはできません。いずれのドメインにも割り当て られていないシステムボードやスロットは、すべてのドメインで使用できます。プ ラットフォーム管理者は、これらのボードをドメインに割り当てることができます。 SC ACL の設定を行い、適切な特権を持つユーザーが使用可能なボードをドメイ ンに割り当てられるようにすることもできます。
接続点
「接続点」とは、ボードやデバイスとそれらが取り付けられているスロット、および ボード上のあらゆるコンポーネントをまとめて表す用語です。スロットは、「受容 体」とも呼ばれます。
Sun Fire システムは、以下の接続点をサポートします。
10 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ボード接続点 – システムボードスロットまたは入出力ボードスロットとスロット
内に取り付けられているボード、およびボードに接続されているあらゆるデバイ ス。
PCI 接続点 – PCI カードと、カードを PCI バスに取り付けるためのカードアタッ
チメント。
コンポーネント接続点 – CPU またはメモリーモジュールとシステムボードとの接
続。コンポーネント接続点は、「動的接続点」とも呼ばれます。
注 – 多くのユーザーは、ボードやデバイスのステータスの変化しか確認しません。
そこで、このマニュアル内の手順では簡略化のために、ボード接続点を「ボード」、 PCI 接続点を「PCI カード」、コンポーネント接続点を「CPU またはメモリーモ ジュール」と表記することがあります。ただし、混乱を招く可能性のある箇所では、 正式な名称を使用します。
「占有装置」とは、ボードとそれに接続されているデバイス (インタフェースケーブ ルで接続されているすべての外部記憶装置を含む) の組み合わせを指す用語です。
ボードスロットには、スロット番号に従って名前を付けることができます。また、
SCSI チェーンで使用する場合などは、匿名にすることもできます。
DR で認識される接続点の名前は、以下の 2 種類です。
物理接続点 – スロットのソフトウェアドライバと位置。
論理接続点 – 物理接続点を参照するためにシステムによって生成される簡易名。
すべての使用可能な論理接続点のリストを取得するには、ドメイン内で以下のコマン ドを実行します。
# cfgadm -l
接続点のクラス
Sun Fire システムは、接続点のクラスをサポートします。DR ユーザーは、「sbd と「pci」の 2 つのクラスについて知る必要があります。
sbd – システムボード、CPU またはメモリーモジュール、およびこれらのモ
ジュールとシステムボードとの接続。入出力ボード、PCI バス、および PCI バス と入出力ボードの接続も含まれます。
pci – PCI バスに接続している PCI カード。
2 DR の概念 11
接続点とそれぞれに関連付けられているボードのタイプのリストを表示するには、 スーパーユーザーになって、以下のコマンドを実行します。
# cfgadm -s -a “cols=ap_id:class”
ハイエンドシステムの接続点
ハイエンドシステムの物理接続点の名前の例を示します。
/devices/pseudo/dr@0:SBx (スロット 0 のシステムボードの場合) /devices/pseudo/dr@0:IO
0 はノード 0SB はシステムボード、IO は入出力ボード、x は特定のボードのボー
ド番号または拡張ボード番号です。システムボードと入出力ボードには、0 から 17 までの番号が付けられています。
注 – システムボードを取り付けることができるのはスロット 0 のみです。入出力
ボードや Max CPU ボードを取り付けることができるのはスロット 1 のみです。
ハイエンドシステムの論理接続点は、以下の 2 つのいずれかの形式です。
x (スロット 1 の入出力ボードの場合)
SBx (システムボードの場合) IOx (入出力ボードまたは Max CPU ボードの場合)
ミッドレンジシステムの接続点
ミッドレンジシステムの物理接続点の名前の例を示します。
/devices/ssm@0,0:N0.SBx /devices/ssm@0,0:N0.IBx (入出力ボードの場合)
N0 はノード 0SB はシステムボード、IB は入出力ボード、x はスロット番号 (シス
テムボードは 0 から 5、入出力ボードは 6 から 9) です。
12 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
(システムボードの場合)
ミッドレンジシステムの論理接続点は、以下の 2 つのいずれかの形式です。
N0.SBx (システムボードの場合) N0.IBx (入出力ボードの場合)
接続点の変更
cfgadm(1M) コマンドを使って、接続点を変更できます。以下の変更が可能です。
接続点の状態の変更。cfgadm(1M) コマンドに、以下のオプションを指定して実
行します。
configure
unconfigure
connect
disconnect
接続点に接続されているボードの可用性の変更。cfgadm(1M) コマンドに、以下
のオプションを指定して実行します。
assign
unassign
接続点のボードスロットの条件の変更。cfgadm(1M) コマンドに、以下のオプ
ションを指定して実行します。
poweron
poweroff
test
状態については、以下の節で説明します。接続点について詳細は、cfgadm(1M) のマ ニュアルページを参照してください。
状態と条件
この節では、ボード、スロット、コンポーネント、および接続点の状態と条件につい て説明します。
状態とは、ボードスロットまたはスロットに取り付けられた占有装置の動作状態
を表します。
条件とは、接続点の動作状態を表します。
cfgadm(1M) コマンドでは、9 種類の状態および条件を表示できます。詳細は、15 ページの「コンポーネントの状態」および 16 ページの「コンポーネントの条件」を 参照してください。
2 DR の概念 13
注 – 以下に示すボードとボードスロットに関する情報は、それらに取り付けられて
いる PCI カードと PCI バスにも適用されます。
ボードとボードスロットの状態
ボードスロットにボードが取り付けられていない場合、スロットは空の状態 (empty) になります。スロットにボードが取り付けられている場合、ボードは切り離された状 態 (disconnected) または接続された状態 (connected) になります。
2-1 ボードとボードスロットの状態
状態 説明
empty
disconnected
connected
スロットにボードが取り付けられていません。
スロットにボードが取り付けられていますが、このボードはシステ ムバスに接続されていません。ボードの電源を切断しなくても、切 り離された状態にすることができます。ただし、ボードをスロット から取り外すときは、ボードの電源を切断し、切り離された状態に する必要があります。取り付けられた直後のボードは、切り離され た状態 (disconnected) です。
スロットにボードが取り付けられ、ボードに電源が投入され、シス テムバスに接続されています。ボード上のコンポーネントは、ボー ドを接続された状態 (connected) にするまで表示されません。
注意 – 接続された状態 (connected) のボードや、電源が入ったままで切り離された
状態 (disconnected) のボードを物理的に取り外すと、オペレーティングシステム がクラッシュして、システムボードに永続的な損傷が生じるおそれがあります。
接続された状態 (connected) のボードは、構成された状態 (configured) または構 成解除された状態 (unconfigured) です。切り離された状態 (disconnected) の ボードは、常に構成解除された状態 (unconfigured) です。
2-2 ボードの構成と構成解除
名前 説明
configured
unconfigured
14 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ボードは Solaris ソフトウェアで使用できる状態です。
ボードは Solaris ソフトウェアで使用できない状態です。
以下の状態は、SC からのみ確認できます。
2-3 SC からのみ確認できるボードの状態
名前 説明
Available
Assigned
Active
スロット (ボードが取り付けられているかどうかを問わない) は、ど のドメインにも割り当てられていません。
スロット (ボードが取り付けられているかどうかを問わない) は、特 定のドメインに割り当てられています。しかし、スロットを使用で きるようにハードウェアが構成されていません。
スロットに取り付けられたボードが、割り当て先のドメインによっ て実際に使用されています。アクティブなボードを再割り当てする ことはできません。
ボードの条件
ボードは、unknownok、または failed のいずれかの条件になります。ボードが取 り付けられているスロットが、unusable に指定されている場合があります。
2-4 ボードとボードスロットの条件
名前 説明
unknown
ok
failed
unusable
ボードはまだテストされていません。
ボードは正常に動作しています。
ボードのテストに失敗しました。
ボードスロットが使用できません。
コンポーネントの状態
ボードとは違って、CPU やメモリーモジュールは、個別に接続したり切り離したり できません。したがって、こうしたコンポーネントはすべて接続された状態 (connected) になります。
2 DR の概念 15
接続された状態のコンポーネントは、構成された状態 (configured) または構成解除さ れた状態 (unconfigured) になります。
2-5 接続されたコンポーネント:構成された状態または構成解除された状態
名前 説明
configured
unconfigured
コンポーネントは Solaris OS で使用できる状態です。
コンポーネントは Solaris OS で使用できない状態です。
コンポーネントの条件
CPU またはメモリーモジュールは、unknownok、または failed のいずれかの条件 になります。
2-6 CPU またはメモリーモジュールの条件
名前 説明
unknown
ok
failed
コンポーネントはまだテストされていません。
コンポーネントは正常に動作しています。
コンポーネントのテストに失敗しました。
切り離し可能性
切り離し可能なデバイスとは、以下の規則を満たすデバイスのことです。
デバイスドライバが DDI_DETACH をサポートしている必要があります。
重要なリソースは冗長構成にするか、代替パスを介してアクセスできるようにす
る必要があります。たとえば CPU とメモリーバンクは、冗長構成にすることがで きる重要なリソースです。また、ディスクドライブは、代替パスを介してアクセ スできる重要なリソースです。
一部のボードは、そのリソースを移動することができないので、切り離すことができ ません。たとえば、ドメインに CPU ボードが 1 つしかない場合、この CPU ボード は切り離せません。また、起動ドライブを制御している入出力ボードは切り離せませ ん。
入出力ボードに代替パスがない場合は、以下のいずれかの方法で切り離すことができ ます。
16 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
独立した入出力ボードにディスクチェーンを挿入します。これで、二次入出力
ボードの切り離しが可能になります。
二次入出力ボードを介したデバイスへの二次パスを追加します。これで、二次
ディスクチェーンへのアクセスを保持したまま入出力ボードの切り離しが可能に なります。
注 – デバイスの切り離しが可能かどうか明確でない場合は、ご購入先にお問い合わ
せください。
永続メモリーと非永続メモリー
ボードを削除するには、まずオペレーティングシステムがそのボード上のメモリーを 空にする必要があります。ボードの無効化には、非永続メモリーの内容をスワップ空 間にフラッシュし、永続メモリーの内容 (つまり、カーネルと OpenBoot™ PROM ソ フトウェア) を別のメモリーボードにコピーすることが伴います。
永続メモリーを再配置するときは、ドメインのオペレーティングシステムを一時的に 休止する必要があります。休止期間は、ドメインの入出力構成と実行中の作業負荷に よって異なります。
オペレーティングシステムは永続メモリーのあるボードを切り離すときにのみ休止さ れるため、永続メモリーの存在する場所を把握しておき、ドメインの操作に重大な影 響を与えないようにするべきです。永続メモリーの容量を表示するには、 cfgadm(1M) コマンドを -av オプション付きで実行します。永続メモリーを搭載し たボードを無効にする場合、オペレーティングシステムは十分な容量の使用可能メモ リーブロック (ターゲットメモリー) を見つけ出して、そこに永続メモリー (ソースメ モリー) の現在の内容をコピーする必要があります。
コピーと名前の変更
ユーザープロセスは、メモリーをスワップデバイスに追い出す (ページアウト) こと により、メモリーを解放できます。しかし、永続メモリー上の Solaris カーネルは、 この方法では解放できません。代わりに、cfgadm は、コピーと名前の変更という方 式を使用してメモリーを解放します。OS が適切なターゲットボード (移動対象の永 続メモリーを十分に格納できるメモリー容量があるボード) を検出すると、DR ソフ トウェアにより、以下の手順が実行されます。
1. ターゲットボード上のメモリーをスワップに追い出して (ページアウト)、空にし ます。
2. オペレーティングシステムを休止します。
2 DR の概念 17
3. ソースボードの内容 (永続メモリー) をターゲットボードにコピーします。これ が、「コピーと名前の変更」操作の「コピー」部分です。
4. ハードウェアを再プログラムして、ソースボードとターゲットボードのメモリー アドレス範囲をスワップします。これが、「コピーと名前の変更」操作の「名前 の変更」部分です。
5. オペレーティングシステムの休止状態を解除します。
メモリーインタリーブ
システムメモリーが複数のシステムボード上でインタリーブされている場合、システ ムボードを動的に再構成することはできません。PCI カードと入出力ボードは、メモ リーのインタリーブが行われているかどうかに関係なく、動的に再構成することがで きます。
ハイエンドシステムでのメモリーインタリーブについては、『Sun Fire High-End Systems Administration Manual』を参照してください。ミッドレンジシステムの場 合、setupdomain コマンドの interleave-scope パラメタを参照してください。 これについては、『Sun Fire ミッドレンジシステムプラットフォーム管理ガイド』と 『Sun Fire ミッドレンジシステムコントローラコマンドリファレンスマニュアル』に 記載されています。
修正可能なメモリーエラー
修正可能なメモリーエラーは、システムボード上のメモリー (単一または複数の DIMM (Dual Inline Memory Module) やハードウェアの相互接続部分) に障害があ
り、修復が必要な状態である可能性があることを示しています。SC は、修正可能な メモリーエラーを検出すると、診断データの保存を目的としたレコード停止ダンプを 開始します。このため、DR 操作に影響が出る場合があります。
修正可能なメモリーエラーによりレコード停止が発生した場合は、レコード停止ダン プ処理が完了してから、DR 操作を開始します。
障害の発生したコンポーネントから修正可能なメモリーエラーに関するメッセージが 繰り返し報告されると、SC はレコード停止ダンプを複数回実行します。この場合 は、SC 上のダンプ検出機構を一時的に無効にし、実行中のダンプ処理が完了してか ら DR 操作を開始することをお勧めします。DR 操作が完了したら、ダンプ検出機構 を再度有効にします。
18 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
休止
永続メモリー (OpenBoot™ PROM またはカーネルメモリー) を搭載したシステム ボードでの構成解除操作中、オペレーティングシステムは一時停止します。これは、 オペレーティングシステムの「休止」と呼ばれています。この重要な操作段階では、 ドメインのすべてのオペレーティングシステムとデバイスの動作を停止する必要があ ります。
ボードに永続メモリーが搭載されているかどうかを簡単に判定するには、以下のコマ ンドを実行します。
# cfgadm -av | grep permanent
ミッドレンジシステム上のシステムボード 0 (ゼロ) を示す次のような出力が表示され ます。
N0.SB0::memory connected configured ok base address 0x0, 4194304 KBytes total, 668072 KBytes permanent
オペレーティングシステムを休止できない場合、以下のような原因が考えられます。
実行スレッドを中断できなかった。
オペレーティングシステムで一時停止できないデバイスが存在する。
注 – リアルタイムプロセスによって、休止が妨げられることはありません。
プロセスが中断できない状況は、通常、一時的なものです。障害の原因を調べ、オペ レーティングシステムがプロセスを中断できない状態になった場合は、その操作を再 試行します。
休止中、システムは停止し、ネットワークパケットなどの外部イベントに応答しなく なります。休止期間は、2 つの要因によって決定されます。1 つは停止する必要があ る入出力デバイスとスレッドの数、もう 1 つはコピーする必要があるメモリーの量で す。通常、必要な休止期間は入出力デバイスの数によって決まります。これは、入出 力デバイスを一時停止または一時停止解除する必要があるからです。通常、休止状態 は 2 分より長く続きます。
休止にはかなりの影響力があります。したがって、cfgadm は、休止を行う前に確認 を要求します。次のように入力するとします。
# cfgadm -c unconfigure N0.SB0
2 DR の概念 19
以下の確認プロンプトが表示されます。
System may be temporarily suspended, proceed (yes/no)?
Sun Management Center を使って DR 操作を実行する場合は、ポップアップウィン ドウにこのプロンプトが表示されます。
休止の影響を確認してから Yes と入力し、作業を進めてください。
一時停止に対して安全なデバイスと一時 停止に対して危険なデバイス
DR によってオペレーティングシステムが一時停止する場合、オペレーティングシス テムに接続されたデバイスドライバも一時停止する必要があります。ドライバを一時 停止できない (または再開できない) 場合、DR 操作は失敗します。
一時停止に対して安全なデバイスは、オペレーティングシステムが休止状態にある 間、メモリーへのアクセスもシステムへの割り込みも行いません。オペレーティング システムの休止をサポートする (オペレーティングシステムを一時停止後、再開でき る) ドライバは、一時停止に対して安全です。また、一時停止に対して安全なドライ バでは、一時停止要求が正常に完了すると、このドライバの管理下のデバイスは、一 時停止要求が出された時点で開かれた状態にある場合でも、メモリーへのアクセスを 試みません。
一時停止に対して危険なデバイスは、オペレーティングシステムが休止状態にあって も、メモリーへのアクセスやシステムへの割り込みを実行できます。
ハイエンドシステムでの DR では、dr.conf ファイルにある「危険なドライバリス ト」を使って、DR 操作中に危険なデバイスがメモリーにアクセスしたりオペレー ティングシステムへの割り込み処理を行なったりするのを防ぎます。dr.conf ファ イルは /platform/SUNW,Sun-Fire-model_number/kernel/drv/ ディレクトリに あります (model_number は 15000 などのマシン名)。危険なドライバリストとは、
dr.conf ファイル内の以下の形式のプロパティーのことです。
unsupported-io-drivers=”driver1”,”driver2”,”driver3”;
DR は、メモリーコンポーネントの構成を解除するため、オペレーティングシステム の一時停止の準備中にこのリストを読み取ります。危険なドライバリスト内でアク ティブドライバが検出されると、DR 操作は中止され、エラーメッセージが表示され
20 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ます。このメッセージには、危険なアクティブドライバの識別情報が含まれていま す。以下のタスク (1 つでも複数でも可) を実行して、デバイスの使用を手動で中止す る必要があります。
該当デバイスを使用しているプロセスを強制終了する。
modunload(1M) コマンドを使って、該当ドライバの読み込みを解除する。
ケーブルを取り外す (デバイスの種類によって異なる)
デバイスの使用を中止したら、DR 操作を再試行できます。
注 – 一時停止に対して安全なデバイスかどうか明確でない場合は、ご購入先にお問
い合わせください。
入出力ボードでの DR
入出力デバイスが接続されているボードの追加と削除は、慎重に行う必要がありま す。入出力デバイスが接続されているボードを削除するには、そのすべてのデバイス を終了し、すべてのファイルシステムのマウントを解除する必要があります。
入出力デバイスが接続されているボードをドメインから一時的に削除し、入出力デバ イスが接続されているほかのボードを追加する前に再び追加する場合、再構成は不要 です。この場合、ボードデバイスのデバイスパスはそのままです。一方、入出力デバ イスが接続されている第 1 のボードを削除してから、入出力デバイスが接続されてい る第 2 のボードを追加し、第 1 のボードを再び追加する場合、第 1 のボードのデバイ スパスは変更されているので、再構成が必要です。
注 – ドメイン内の入出力ボードで DR 操作を実行する前に、このドメインで使用可
能な CPU 2 つ以上あることを確認します。さらに、そのうちの少なくとも 1 つの CPU がシステムボード上にあり、プロセスが 1 つも割り当てられていないことを確
認します。プロセスの割り当てについては、pbind(1M) のマニュアルページを参照 してください。
ハイエンドシステムの入出力ボード、Golden IOSRAMMaxCPU、および hsPCI+
ハイエンドシステムドメイン内のすべての入出力ボードは、IOSRAM デバイスを備 えています。ただし、SC とドメインの通信で一度に使用されるのは、「Golden IOSRAM」と呼ばれる IOSRAM デバイス 1 つだけです。この Golden IOSRAM に は、SC とドメインの通信に使用される「トンネル」があります。DR では入出力
2 DR の概念 21
ボードを削除できるため、使用中の Golden IOSRAM を停止して、ほかの IOSRAM デバイスを Golden IOSRAM にする処理が必要になることがあります。この処理は 「トンネルスイッチ」と呼ばれ、使用中の Golden IOSRAM DR によって構成解 除されるたびに実行されます。通常、ドメインの起動時には、ドメイン内でもっとも ボード番号の小さい入出力ボードが最初の Golden IOSRAM として選択されます。
DR は、ハイエンドシステムの入出力ボード上の入出力バスと、任意の PCI カード、 およびそれらを取り付ける MaxCPU ボードをサポートします。DR は、hsPCI+ カー ドの動的再構成をサポートします。hsPCI+ カードには、XMITS ASIC 2 つずつ、 ホットプラグ可能な hsPCI+ スロットが 4 つずつあります。
ミッドレンジシステムの I/O アセンブリ、PCI、お よび CompactPCI
Sun Fire ミッドレンジシステムの DR は、SAI/P (BugID 4466378) HIPPI/P のい ずれもサポートしません。これまでのリリースでは、SunHSI/P ドライバをサポート していませんでしたが、このサポートを妨げていたバグ 4496362 は、パッチ 106922 (2.0) 109715 (3.0) で修正されました。詳細は、SunSolve のサイトと devfsadm(1M) のマニュアルページを参照してください。
1 つ以上の UltraSPARC IV+ システムボードで構成されたシングルパーティショ
ンのミッドレンジシステムでは、DR の接続操作や構成操作を使って、ドメインに入 出力ボードを追加することはできません。これは、入出力ボードをテストできる二次 ドメインが存在しないからです。しかし、このようなシステムの入出力ボード上で、 DR の構成解除コマンドや切り離しコマンドを実行することは可能です。詳細は、34 ページの「ボードのテスト」と、Firmware Release 5.19.0 の『Sun Fire ミッドレンジ システムプラットフォーム管理ガイド』を参照してください。
CompactPCI に固有の制限事項
以下の制限事項は、CompactPCI アセンブリ関連の再構成に対して適用されます。
CompactPCI I/O アセンブリは、ボード内のすべてのカードが構成解除された状
態にある場合にのみ構成解除できます。plumbed/up インタフェースやマウント されたディスクなどによって使用中の CompactPCI カードがある場合、ボードの 構成解除操作は「ビジー」状態になって失敗します。すべての CompactPCI カー ドを構成解除してから、CompactPCI I/O アセンブリを構成解除するべきです。
マルチパスディスクが 2 つの CompactPCI カードに接続されている場合、何もな
い状態でも、これらのカードでディスクが動作していると示される可能性があり ます。このため、リソースのローカルサイドで何も動作していないことを確認し
22 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
てください。この現象は、多くの場合、リソースのローカルサイドで何も動作し ていないのに、ビジー状態の CompactPCI カードに対して DR 操作を実行しよう とすると発生します。しばらくしてから DR を再試行してください。
ユーザーが -a オプション付きで cfgadm(1M) コマンドを実行して CompactPCI
ボードの接続点を一覧表示した場合、CompactPCI スロットと PCI バスはすべて 接続点として表示されます。cfgadm -a コマンドは、PCI バスの接続点を N0.IB8::pci0 と表示します。このような接続点は CompactPCI ボードごとに 4 つずつあります。ユーザーは、これらの接続点に対しても、cfgadm -a コマンド が N0.IB8::sghsc4 と表示する sghsc 接続点に対しても、DR 操作を実行して はいけません。これは、DR が実際には実行されず、内部リソースの一部が削除さ れるためです。これらの接続点 (bus および sghsc) では DR を使用しないこと を、強くお勧めします。
DR で CompactPCI カードを正常に機能させるには、Solaris OS 起動時に挿入され
たすべての CompactPCI カードのレバーを完全に下げて固定する必要がありま す。
CompactPCI カードを構成解除すると、自動的に切り離しも行われます。自動構成機 能が有効になっている場合、CompactPCI カードを接続すると構成も行われます。 自動構成機能が無効になっている場合には、手動で構成する必要があります。
共通の DR ボード操作
接続操作
スロットのシステムボードが使用可能で、論理ドメインに割り当てられていない場 合、DR はボードの接続操作中に、ドメインにボードスロットを割り当てようとしま す。スロットの割り当てが完了すると、DR SC に電源をオンにしてボードをテス トするように要求します。ボードのテストが完了すると、DR SC にボードを電気 的にシステムに接続し、物理ドメインに割り当てるように要求します。すると、オペ レーティングシステムにより、ボード上のコンポーネントの検査が行われます。
DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の
状態に戻りません。エラーが回復可能であれば、失敗したコマンドを再試行できま す。エラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する 必要があります。
ボードが挿入される前の接続点の状態と条件は、以下のとおりです。
受容体の状態 — Empty
占有装置の状態 — Unconfigured
条件 — Unknown
2 DR の概念 23
ボードが物理的に挿入されると、状態と条件は以下のように変わります。
受容体の状態 — Disconnected
占有装置の状態 — Unconfigured
条件 — Unknown
接続点が論理的に接続されると、状態と条件は以下のように変わります。
受容体の状態 — Connected
占有装置の状態 — Unconfigured
条件 — OK
構成操作
構成操作中、ボードスロットの状態が disconnected であれば、DR はボードスロット を接続しようとします。さらに、接続操作中に作成されたデバイスツリー をたどり ます。DR は必要に応じて Solaris OS のデバイスツリーノードを作成して、デバイス ドライバを接続します。
CPU CPU リストに追加され、メモリーは初期化されて、システムメモリープール に追加されます。構成機能が正常に完了すると、CPU とメモリーが使用可能な状態 になります。
入出力デバイスの場合は、mount(1M) コマンドと ifconfig(1M) コマンドを実行し てからでないと、デバイスを使用できません。
cfgadm を使ってボードをドメイン内に構成すると、そのボードは自動的に接続さ れ、構成されます。
切り離し操作
切り離し操作中、DR フレームワークは SC との通信を通じて、システムボードが物 理ドメインから削除されるように、相互接続をプログラミングします。さらに、構成 解除操作に関連するタスクを実行しようとします。
ボードは、電源を切断しなくても、切り離された状態にすることができます。ただ し、ボードをスロットから取り外すときは、ボードの電源を切断し、切り離された状 態にする必要があります。
ボードが切り離される前の状態と条件は、以下のとおりです。
受容体の状態 — Connected
占有装置の状態 — Configured
条件 — OK
ボードが切り離されると、状態と条件は以下のように変わります。
受容体の状態 — Disconnected
24 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
占有装置の状態 — Unconfigured
条件 — Unknown
構成解除操作
構成解除操作は、永続メモリーの有無によって、単一の操作か、異なる 2 つの操作に なります。システムボードに永続メモリーが搭載されている場合、DR は構成解除操 作の前に、メモリーの内容を指定のボードからドメイン内の別のターゲットボード上 の使用可能なメモリーに移動します。永続メモリーを搭載したボードについて詳細 は、17 ページの「永続メモリーと非永続メモリー」を参照してください。
DR の概念図
DR では、システムを停止せずにシステム回路基盤を切り離し、接続しなおすことが できます。DR を使用すれば、システムを稼働させた状態で、システムリソースを追 加したり削除したりできます。
以下は Sun Fire ハイエンドシステムの例ですが、基本的な考え方はミッドレンジシ ステムにも共通しています。
Sun Fire E25K システムと Sun Fire 15K システムでは、同時に 18 枚までのシス
テムボードと入出力ボード (番号 0 17) をサポートします。
ドメイン A には、システムボード 0 2、入出力ボード 2 があります。ドメイン B には、システムボード 1 3、入出力ボード 1、3、および 4 があります。
2 DR の概念 25
A
B
2-1 再構成前のドメイン A とドメイン B
ドメイン A にシステムボード 4 と入出力ボード 0 を割り当て、ドメイン B からドメ イン A へ入出力ボード 4 を移動するには、Sun Management Center ソフトウェアの GUI を使用できます。または、各ドメインで cfgadm(1M) を実行する方法もありま す。
1. ドメイン B で以下のコマンドを実行して、入出力ボード 4 を切り離します。
# cfgadm -c disconnect -o nopoweroff,unassign IO4
2. ドメイン A で以下のコマンドを実行して、ドメイン A にシステムボード 4 と入出力 ボード 0 および 4 を割り当て、接続し、構成します。
# cfgadm -c configure SB4 IO0 IO4
以下のようなシステム構成になります。変更されたのはボードの接続方法だけで、 キャビネット内のボードの物理的配置は変わっていません。
26 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
A
B
2-2 再構成後のドメイン A とドメイン B
2 DR の概念 27
28 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
3
DR 操作を実行する前に
この章では、第 1 章、第 2 章に引き続き、DR 操作を正常に実行するために把握して おくべき情報や手順について説明します。
注意DR 操作の実行手順が不適切だと、DR の実行に失敗して、システムコンポー
ネントに損傷が生じるおそれがあります。
この章では、以下のトピックについて説明します。
29 ページの「cfgadm(1M) コマンド」
31 ページの「cfgadm(1M) コマンド (ハイエンドシステムのみ)
31 ページの「デバイスのタイプ、状態、条件の確認」
32 ページの「ドメインで DR 操作を実行する前に」
33 ページの「システムボードのステータスの表示」
34 ページの「ボードのテスト」
cfgadm(1M) コマンド
cfgadm(1M) コマンドは、ドメインに対して DR 操作を実行します。DR 操作は、 libcfgadm(3LIB) ライブラリインタフェースに渡されます。このインタフェース
は、実際に DR 操作を実行するハードウェア固有のライブラリプラグインを動的に読 み込みます。
DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の
状態に戻りません。エラーが回復可能であれば、失敗したコマンドを再試行できま す。エラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する 必要があります。
29
ハードウェア固有のプラグイン sbd.so.1 は、各種 DR 機能 (システムボードの接 続、構成、構成解除、切り離し) を提供します。これにより、システムを再起動する ことなく、稼動中のシステムに対するシステムボードの接続や切り離しを行うことが 可能になります。
cfgadm(1M) コマンドは、/usr/sbin ディレクトリにあります。 詳細は、cfgadm(1M) のマニュアルページを参照してください。
各ボードスロットは、デバイスツリー内の単一の接続点として表示されます。各コン ポーネントのタイプ、状態、および条件と、各ボードスロットの状態および条件を表 示するには、cfgadm(1M) コマンドを -a オプション付きで実行します。
以下のオプションまたはオペランドを指定することにより、さまざまな機能を実現で きます。ap_id は、システムボードまたはコンポーネントの接続点を表しています。
3-1 cfgadm オプション
オプションとオペランド 機能
-c connect ap_id
-c disconnect ap_id
-c configure ap_id
-c unconfigure ap_id
-x assign ap_id
-x unassign ap_id
-x poweron ap_id
-x poweroff ap_id
-l ap_id
-h [ap_id]
-v
-n
-y
受容体の状態を connected に変更します。
受容体の状態を disconnected に変更します。
占有装置の状態を configured に変更します。
占有装置の状態を unconfigured に変更します。
占有装置の状態を assigned に変更します。
占有装置の状態を unassigned に変更します。
占有装置の状態を powered on に変更します。
占有装置の状態を powered off に変更します。
システムボードとコンポーネントの状態、 ステータス、および条件を表示します。
ヘルプメッセージテキストを出力します。ap_id が指定 された場合は、引数によって示された接続点のハード ウェア固有ライブラリのヘルプルーチンが呼び出され ます。
冗長モードで実行します。
確認プロンプトを非表示にして、自動的に no と応答し ます。
確認プロンプトを非表示にして、自動的に yes と応答 します。
30 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
3-1 cfgadm オプション (続き)
オプションとオペランド 機能
-s listing_options
-o hardware_options
-t ap_id
listing_options に基づいて、接続点の状態を表示しま す。-l フラグにリストオプションを渡します。 listing_options の引数は、getsubopt(3C) のマニュア ルページの構文規則に準拠しており、以下の内容を指 定します。
接続点の選択基準 (select=select_string)
対象の照合タイプ (match=match_type)
一覧表示の順序 (sort=field_spec)
表示対象のデータ (cols=field_spec および
cols2=field_spec)
列の区切り文字 (delim=string)
列見出しの非表示 (noheadings)
メインのコマンドオプションに対してハードウェア固 有のオプションを渡します。hardware_options 文字列の 書式と内容は完全にハードウェア固有であり、 getsubopt(3C) のマニュアルページの構文規則にも準 拠しています。
1 つ以上の接続点のテストを実行します。テスト機能 では、接続点の条件を再評価することができます。 hardware_options でテストレベルを指定しないと、ハー ド障害を特定する、実行時間がもっとも短いテストが 実行されます。
cfgadm(1M) コマンド (ハイエンドシス テムのみ)
SMS コマンド rcfgadm(1M) SC 上で実行され、オプションおよびオペランドは cfgadm(1M) と共通です。ただし、通常、-d domain_id オプションを追加指定する必 要があります。70 ページの「rcfgadm(1M)」を参照してください。
デバイスのタイプ、状態、条件の確認
ドメインのボードまたはコンポーネントに対して DR 操作を実行する前に、対象とな るボードまたはコンポーネントの状態および条件を判定します。
3 DR 操作を実行する前に 31
状態、タイプ、条件を表示する
cfgadm(1M) コマンドを -la オプション付きで実行します。
# cfgadm -la
ボードスロットおよびコンポーネントの情報を
表示する
prtdiag(1M) コマンドを実行します。
# prtdiag
prtdiag(1M) コマンドは、ボード番号を表示します。
ドメインで DR 操作を実行する前に
ドメインの起動後、初めて DR 操作を実行する前に、このドメインでボードが使用可 能であることを確認します。
ドメインでボードが使用可能かどうかを表示す
cfgadm(1M) コマンドを -l オプション付きで実行します。
# cfgadm -l
ハイエンドシステム上の各ドメインは、使用可能なコンポーネントのリストを保持し ています。ミッドレンジシステム上のドメインは、アクセス制御リストを保持してい ます。どちらも、「ACL」という略称で呼ばれます。
以下のようなボード上で DR 操作を実行しようとすると、エラーが発生する可能性が あります。
ドメインの ACL に記載されておらず、ドメインに割り当てられていない。
32 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ドメインの ACL には記載されているが、別のドメインに割り当てられている。
どちらの場合でも、このドメインでボードを使用することはできません。ハイエンド システムで使用可能なコンポーネントのリストを表示する方法については、 『System Management Services (SMS) 管理者マニュアル』を参照してください。 ミッドレンジシステム上の ACL については、『Sun Fire ミッドレンジシステムプ ラットフォーム管理ガイド』を参照してください。
システムボードのステータスの表示
システムボードのステータスを表示する
cfgadm(1M) コマンドを実行します。
# cfgadm -a -s “select=class(sbd)”
cfgadm(1M) コマンドは、このドメインに割り当てられたボード、または ACL に記
載されていて別のドメインに割り当てられていないボードの情報を表示します。-a オプションを指定すると、ボードスロット、SCSI バス、および PCI スロットを含む 既知のすべての接続点が一覧表示されます。
以下は、ミッドレンジシステムドメインで得られる標準的な出力例です。
3-2 システムボードのステータス表示例
Ap_Id
N0.IB6 PCI_I/O_Boa connected configured ok
N0.IB7 PCI_I/O_Boa connected configured ok
N0.IB8 PCI_I/O_Boa connected configured ok
N0.IB9 PCI_I/O_Boa disconnected unconfigured unknown
N0.SB0 CPU_Board connected configured unknown
N0.SB1 CPU_Board disconnected unconfigured failed
N0.SB2 CPU_Board connected configured ok
タイプ 受容体 占有装置 条件
3 DR 操作を実行する前に 33
3-2 システムボードのステータス表示例
Ap_Id
N0.SB3 unknown empty unconfigured unknown
N0.SB4 unknown empty unconfigured unknown
N0.SB5 unknown empty unconfigured unknown
詳細情報を表示するには、cfgadm(1M) コマンドに -v オプションを追加します。
タイプ 受容体 占有装置 条件
ボードのテスト
システムボードをテストする
cfgadm(1M) コマンドを -t オプション付きで実行します。
# cfgadm -t ap_id
ap_id は接続点の識別子です。
cfgadm(1M) コマンドを -t および -o オプション付きで使用し、診断レベルを指定
してテストを実行します (ミッドレンジシステムのみ)。
# cfgadm -o platform=diag=<level> -t ap_id
level は診断レベル、ap_id は接続点の識別子です。
34 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ミッドレンジシステムで診断レベルを指定しないと、setupdomain コマンドにより デフォルトの診断レベルが設定されます。これについては、『Sun Fire ミッドレンジ システムプラットフォーム管理ガイド』と『Sun Fire ミッドレンジシステムコント ローラコマンドリファレンスマニュアル』に記載されています。診断レベルは、以下 の表のとおりです。
3-3 診断レベル
診断レベル 説明
init
quick
default または max
mem1
mem2
システムボード初期化コードを実行しますが、テストは実行しません。 このため、短時間で POST を実行できます。
すべてのシステムボードコンポーネントをテストします。ただし、少数 のテストを少数のパターンで実行するだけとなります。
メモリーと Ecache モジュールを除くすべてのシステムボードコンポー ネントをテストします。すべてのテストをすべてのパターンで実行しま す。
デフォルトのレベルのすべてのテストを実行します。さらに、DRAM SRAM のテストアルゴリズムも徹底的に実行します。メモリーと Ecache モジュールについては、複数のパターンですべての位置をテスト します。このレベルでは、これ以上に時間のかかるアルゴリズムは実行 されません。
mem1 のすべてのテストと、DRAM データを明示的に比較する DRAM テストを実行します。
入出力ボードをテストする (ミッドレンジシステ
ムのみ)
注 – 1 つ以上の UltraSPARC IV+ システムボードで構成されたシングルパーティショ
ンのミッドレンジシステムでは、DR の接続操作や構成操作を使って、ドメインに入 出力ボードを追加することはできません。これは、入出力ボードをテストできる二次 ドメインが存在しないからです。しかし、このようなシステムの入出力ボード上で、
DR の構成解除コマンドや切り離しコマンドを実行することは可能です。詳細は、 Firmware Release 5.19.0 の『Sun Fire ミッドレンジシステムプラットフォーム管理ガ
イド』を参照してください。
以下の手順では、ドメイン A を現在のアクティブドメイン、ドメイン B をスペアド メインとします。
1. スペアドメイン (ドメイン B) のドメインシェルに入ります。
2. Ctrl キーを押したまま ] キーを押して、telnet> プロンプトを表示します。
3 DR 操作を実行する前に 35
3. telnet> プロンプトに send break と入力して、システムコントローラのドメイン
シェルを表示します。
4. スペアドメイン (ドメイン B) のシェルで、このドメインに I/O アセンブリを追加し ます。
schostname:B> addboard IBx
x 678、または 9 です。
5. スペアドメインの仮想キースイッチをオンにします。
schostname:B> setkeyswitch on
. .
{x} ok
x CPU です。仮想キースイッチをオンにすると、ドメイン上で POST が実行され
ます。入出力ボードまたは I/O アセンブリが正常に機能している場合、
ok プロンプ
トが表示されます。
6. 待機モードに設定します。
schostname:B> setkeyswitch standby
7. ボードを削除します。
schostname:B> deleteboard ibx
8. アクティブドメイン (ドメイン A) にボードを追加します。
# cfgadm -c configure N0.IBx
入出力ボードで DR 操作を実行する前に (ハイエ
ンドシステムのみ)
ハイエンドシステムドメインの入出力ボードで DR 操作を実行する前に、以下の条件 が満たされていることを確認します。
このドメインに使用可能な CPU 2 つ以上ある。
36 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
それらの CPU のうち少なくとも 1 つがシステムボード上にある。
その CPU にプロセスが割り当てられていない。
プロセスの割り当てについては、pbind(1M) のマニュアルページを参照してくださ い。
DR を使ってドメインに入出力ボードを構成する (または、cfgadm(1M) コマンドを
-t オプション付きで実行して入出力ボードを明示的にテストする) 場合、システム
ボード上の占有装置になっている単一の CPU がボードのテスト用として選択されま す。この CPU には、プロセスを割り当てることができません。また、このドメイン には、1 つ以上の追加 CPU を残しておく必要があります。テスト用の CPU がない場 合、以下のようなメッセージが表示されます。
WARNING:No CPU available for I/O cage test
CPU がドメインから構成解除され、入出力ボードのテストが行われます。テストが 完了すると、構成解除された CPU がドメインに再構成されます。CPU が正常に再構 成された場合、psrinfo(1M) コマンドで出力されるタイムスタンプと、ドメイン内 のほかの CPU のタイムスタンプが一致しなくなります。
3 DR 操作を実行する前に 37
38 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
4
システムドメインからの DR 操作
この章では、ハイエンドシステムまたはミッドレンジシステムで、Sun Fire システム ドメインから DR 操作を実行する手順について説明します。どちらかのプラット フォームにしか適用されない手順には、その旨を明記します。「システムボード」、 「入出力ボード」という用語は、どちらのプラットフォームでも使用します。
注意 – ボードまたはコンポーネントに対して DR 操作を実行する前に、31 ページの
「デバイスのタイプ、状態、条件の確認」の説明に従って、対象となるボードまたは コンポーネントの状態および条件を判定します。
この章で紹介する手順を実行する前に、第 1 章から第 3 章の内容を理解しておく必要 があります。
ドメイン内で DR を実行するには、スーパーユーザーになる必要があります。
SBx、IOx などの記述で、x はボード ID 番号を表します。
この章では、以下のトピックについて説明します。
40 ページの「システムボードの追加」
42 ページの「システムボードの削除」
44 ページの「システムボードの移動」
45 ページの「入出力ボードの追加」
47 ページの「メモリーと CPU の追加、削除、追跡」
49 ページの「PCI アダプタカードの操作」
39
システムボードの追加
ドメインにボードを追加する前に、ボードをドメインに割り当てておくか、ACL 内 に記載しておく必要があります。ACL とは、ハイエンドシステムドメインでは使用 可能なコンポーネントリスト、ミッドレンジシステムドメインではアクセス制御リス トを表す省略語です。
ハイエンドシステムの ACL については、『System Management Services (SMS) 管理 者マニュアル』を参照してください。ミッドレンジシステムの ACL については、 『Sun Fire ミッドレンジシステムプラットフォーム管理ガイド』を参照してくださ い。
システムボードを取り付ける
1. 指定されたボードスロットがボードを受け入れられることを確認します。
# cfgadm -a -s “select=class(sbd)”
状態と条件は、以下のいずれかになります。
受容体の状態 — Empty
占有装置の状態 — Unconfigured
条件 — Unknown
または
受容体の状態 — Disconnected
占有装置の状態 — Unconfigured
条件 — Unknown
2. ボードをスロットに取り付け、ボードの接続と構成を行います。
# cfgadm -v -c configure SBx
システムによるボードのテストが実行され、しばらくすると、ドメインコンソールロ グに、コンポーネントの構成が完了したことを知らせるメッセージが表示されます。 接続され、構成された接続点の状態と条件は、以下のようになります。
受容体の状態 — Connected
占有装置の状態 — Configured
40 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
条件 — OK
これで、システムがボード上の使用可能なデバイスを認識するようになり、これらの デバイスが使用可能な状態になります。
DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の
状態に戻りません。エラーが回復可能であれば、失敗したコマンドを再試行できま す。エラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する 必要があります。
システムボードを接続するだけで構成はしない
1. 指定されたボードスロットがボードを受け入れられることを確認します。
# cfgadm -a -s “select=class(sbd)”
状態と条件は、以下のいずれかになります。
受容体の状態 — Empty
占有装置の状態 — Unconfigured
条件 — Unknown
または
受容体の状態 — Disconnected
占有装置の状態 — Unconfigured
条件 — Unknown
2. ボードを接続します。
# cfgadm -v -c connect SBx
接続されたシステムボードを構成する
接続されたボードを構成します。
# cfgadm -c configure SBx
x はボード番号です。
4 章 システムドメインからの DR 操作 41
システムボードの削除
システムボードを削除する
ボードの構成を解除し、ボードを切り離します。
# cfgadm -c disconnect SBx
システムボードの構成解除は行うが切り離しは
行わない
ボードの構成を解除します。
# cfgadm -c unconfigure SBx
構成解除されたシステムボードを削除する
ボードを切り離します。
# cfgadm -c disconnect SBx
システムボードを一時的に削除する
この手順では、たとえば、ボードで障害が発生し、交換用のボードや、システムボー ドのフィラーパネルを使用できない場合に、ボードの電源を切り、そのまま使用でき るようにします。
1. ボードの接続点の ID を確認します。
# cfgadm -l -s "select=class(sbd)"
42 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
2. ボードを切り離し、電源を切ります。
# cfgadm -c disconnect ap_id
ap_id は、手順 1 で返された接続点の ID です。
ドメインの永続メモリーを搭載したシステム
ボードを検出する
永続メモリーを搭載したボードを特定します。
# cfgadm -val | grep permanent
永続メモリーを搭載したシステムボードの構成
を解除する
1. 永続メモリーを搭載したボードを特定します。
# cfgadm -val | grep permanent
2. 永続メモリーを搭載したボードの構成を解除します。
# cfgadm -c unconfigure -y SB0
ここでの -y オプションは、休止を妨げません。
4 章 システムドメインからの DR 操作 43
システムボードの移動
システムボードを別のドメインに移動する
1. 削除対象のボードのスロット番号を特定します。
# cfgadm -l -s "select=class(sbd)"
2. ボードの構成を解除します。このとき、電源は入れたままでテストステータスを保持 します。
# cfgadm -o unassign,nopoweroff -c disconnect ap_id
ap_id は、手順 1 で返された接続点の ID です。 この時点では、スロットはどのドメインにも割り当てられておらず、すべてのドメイ
ンに見えます。
3. ボードの移動先ドメインで、ボードが切り離された状態になっていることを確認しま す。
# cfgadm -al -s “select=class(sbd)”
注 – この手順には、割り当て操作が含まれるため、新しいドメインでボードが見え
ない場合、ACL に関連する問題が発生している可能性があります。ハイエンドシス テムドメインの ACL については、『System Management Services (SMS) 管理者マ ニュアル』を参照してください。ミッドレンジシステムドメインの ACL について は、『Sun Fire ミッドレンジシステムプラットフォーム管理ガイド』を参照してくだ さい。
4. 新しいドメインでボードを構成します。
# cfgadm -c configure
44 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ap_id
入出力ボードの追加
入出力ボードを追加する
1. 指定されたボードスロットがボードを受け入れられることを確認します。
# cfgadm -a -s “select=class(sbd)”
状態と条件は、以下のいずれかになります。
受容体の状態 — Empty
占有装置の状態 — Unconfigured
条件 — Unknown
または
受容体の状態 — Disconnected
占有装置の状態 — Unconfigured
条件 — Unknown
2. ボードをスロットに取り付けます。
3. ミッドレンジシステムを使用している場合は、ここで入出力ボードのテストを行いま
す。ハイエンドシステムを使用している場合は次の手順に進みます。
ミッドレンジシステムへボードを追加する場合は、35 ページの「入出力ボードをテ ストする (ミッドレンジシステムのみ)」を参照してください。
4. ボードを接続し、構成します。
# cfgadm -v -c configure IOx
システムによるボードのテストが実行され、しばらくすると、ドメインコンソールロ グに、コンポーネントの構成が完了したことを知らせるメッセージが表示されます。 接続され、構成された接続点の状態と条件は、以下のようになります。
受容体の状態 — Connected
占有装置の状態 — Configured
条件 — OK
これで、システムがボード上の使用可能なデバイスを認識するようになり、これらの デバイスが使用可能な状態になります。
4 章 システムドメインからの DR 操作 45
注 – DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の
状態に戻りません。エラーが回復可能であれば、失敗したコマンドを再試行できま す。エラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する 必要があります。
入出力ボードを追加し接続するが、構成はしな
1. 指定されたボードスロットがボードを受け入れられることを確認します。
# cfgadm -a -s “select=class(sbd)”
状態と条件は、以下のいずれかになります。
受容体の状態 — Empty
占有装置の状態 — Unconfigured
条件 — Unknown
または
受容体の状態 — Disconnected
占有装置の状態 — Unconfigured
条件 — Unknown
2. ボードをスロットに取り付けます。
3. ミッドレンジシステムを使用している場合は、ここで入出力ボードのテストを行いま
す。ハイエンドシステムを使用している場合は次の手順に進みます。
ミッドレンジシステムへボードを追加する場合は、35 ページの「入出力ボードをテ ストする (ミッドレンジシステムのみ)」を参照してください。
4. ボードを接続します。
# cfgadm -v -c connect IOx
接続された入出力ボードを構成する
接続された入出力ボードを構成します。
# cfgadm -c configure IOx
46 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
入出力ボードを削除する
入出力ボードの構成を解除し、切り離します。
# cfgadm -c disconnect IOx
入出力ボードの構成解除は行うが切り離しは行わな
入出力ボードの構成を解除します。切り離しは行いません。
# cfgadm -c unconfigure IOx
構成解除された入出力ボードを切り離す
構成解除された入出力ボードを切り離します。
# cfgadm -c disconnect IOx
メモリーと CPU の追加、削除、追跡
注 – 以下の手順は、シングルコアの CPU とデュアルコアの CPU に共通です。
システムボード上の CPU を構成する
CPU を構成します。
# cfgadm -c configure SBx::cpuy
4 章 システムドメインからの DR 操作 47
x はボード番号、y CPU 番号です。Sun Fire ハイエンドシステムおよびミッドレ ンジシステムの CPU 番号は、0 3 です。
システムボード上のメモリーを構成する
メモリーを構成します。
# cfgadm -c configure SBx::memory
x はボード番号です。このコマンドは、システムボード上のすべてのメモリーに適
用されます。
システムボード上のすべての CPU とメモリーを
構成する
ボード上のすべての CPU とメモリーを構成します。
# cfgadm -c configure SBx
システムボード上の CPU の構成を解除する
CPU の構成を解除します。
# cfgadm -c unconfigure SBx::cpuy
x はボード番号、y CPU 番号です。Sun Fire ハイエンドシステムおよびミッドレ
ンジシステムの CPU 番号は、0 3 です。
システムボード上のメモリーの構成を解除する
メモリーを構成解除します。
# cfgadm -c unconfigure SBx::memory
48 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
x はボード番号です。このコマンドは、システムボード上のすべてのメモリーに適 用されます。
システムボード上のすべての CPU とメモリーの
構成を解除する
ボード上の CPU とメモリーの構成を解除する
# cfgadm -c unconfigure SBx
メモリー構成解除操作を追跡する
cfgadm(1M) コマンドでは、メモリーの構成解除操作の進捗状況を追跡できます。以 下のコマンドは、削除されたメモリー容量とまだ削除されずに残っているメモリー容 量のスナップショットを表示します。
メモリー削除プロセスを追跡します。
# cfgadm -a -s “select=type(memory),cols=ap_id:o_state:info”
PCI アダプタカードの操作
入出力ボードのホットプラグスロットは、接続、構成、構成解除、切り離しを個別に 行うことができます。ホットプラグスロットの接続点 (スロットとスロットに挿入さ れたアダプタカード) は、入出力ボードをドメインに構成すると作成されます。
Sun Fire ハイエンドシステムは、PCI カードと hsPCI カードをサポートします。Sun Fire ミッドレンジシステムは、PCI カードと CompactPCI カードをサポートしま す。以下の手順では、これらのカードをまとめて、「PCI」と呼びます。
4 章 システムドメインからの DR 操作 49
入出力ボード上の PCI スロットに接続する
PCI スロットに接続します。
# cfgadm -c connect pci_ap_id
pci_ap_id PCI スロットの ID です。
たとえば、入出力ボードのスロット 1 のアダプタをドメインに接続するだけで構成は 行わない場合、以下のようなコマンドを実行します。
# cfgadm -c connect pcisch0:e01b1slot1
入出力ボード上の PCI スロットを構成する
PCI スロットを構成します。
# cfgadm -c configure pci_ap_id
pci_ap_id PCI スロットの ID です。
たとえば、入出力ボードのスロット 1 のアダプタをドメインに構成するには、以下の ようなコマンドを実行します。
# cfgadm -c configure pcisch0:e01b1slot1
入出力ボード上の PCI スロットを切り離す
PCI スロットを切り離します。
# cfgadm -c disconnect pci_ap_id
pci_ap_id PCI スロットの ID です。
50 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
たとえば、入出力ボードのスロット 1 のアダプタを取り外す前に切り離すには、以下 のようなコマンドを実行します。
# cfgadm -c disconnect pcisch13:eo1b1slot1
入出力ボード上の
PCI
スロットの構成を解除す
PCI スロットの構成を解除します。
# cfgadm -c unconfigure pci_ap_id
pci_ap_id PCI スロットの ID です。
たとえば、入出力ボードのスロット 1 のアダプタをドメインから構成解除するには、 以下のようなコマンドを実行します。
# cfgadm -c unconfigure pcisch0:e01b1slot1
詳細は、cfgadm_pci(1M) のマニュアルページを参照してください。
4 章 システムドメインからの DR 操作 51
52 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5
SC からの SMS DR 操作 (ハイエン ドシステムのみ)
この章では、SMS ソフトウェアを実行する Sun Fire ハイエンドサーバーのシステム コントローラ (SC) から DR 操作を実行する手順について説明します。
注意 – ボードまたはコンポーネントに対して DR 操作を実行する前に、29 ページの
DR 操作を実行する前に」の説明に従って、対象となるボードまたはコンポーネン トの状態および条件を判定します。
この章では、以下のトピックについて説明します。
54 ページの「デバイス情報の表示」
56 ページの「プラットフォーム情報の表示」
57 ページの「ボード情報の表示」
59 ページの「ボードの追加」
60 ページの「ボードの削除」
61 ページの「ボードの移動」
62 ページの「アクティブなシステムボードの交換」
63 ページの「SMS DR コマンドとオプション」
74 ページの「エラーメッセージヘルプシステム」
DR 操作中に SMS DR コマンドの実行が失敗すると、対象のボードは元の状態
に戻りません。エラーが回復可能であれば、失敗したコマンドを再試行できます。エ ラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要が あります。
SMS DR コマンド rcfgadm(1M) は、ドメインで実行される cfgadm(1M) コマンドと よく似ており、同じオプションを指定できます。ただし、通常、rcfgadm(1M) のほ うには、-d domain_id パラメタを追加指定する必要があります。この章では、別の コマンドを中心に説明します。rcfgadm(1M) の詳細は、70 ページの 「rcfgadm(1M)」を参照してください。
53
デバイス情報の表示
DR 操作を実行する前に、SMS コマンド showdevices(1M) を実行してデバイス情 報を表示します。この操作は、特にデバイスを削除する場合に重要です。
デバイス情報を表示する
ドメインのデバイス情報を表示します。
# showdevices -v -d domain_id
showdevices(1M) は、ドメイン内の全デバイスのデバイス情報を表示し、以下のよ
うな出力を生成します。
5-1 showdevices による CPU 情報の出力例
ドメイン
A SB1 40 online 400 4
A SB1 41 online 400 4
A SB1 42 online 400 4
A SB1 43 online 400 4
A SB2 55 online 400 4
A SB2 56 online 400 4
A SB2 57 online 400 4
A SB2 58 online 400 4
ドメイン
G SB0 0 on-line 1050 8
G SB0 1 on-line 1050 8
G SB0 2 on-line 1050 8
G SB0 3 on-line 1050 8
board id
5-2 showdevices による UltraSPARC IV+ の情報の出力例 (showdevices -d
G)
board id
状態
状態
speed ecache usage
speed ecache usage
54 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5-2 showdevices による UltraSPARC IV+ の情報の出力例 (showdevices -d
G) (続き)
ドメイン
board id
状態
speed ecache usage
G SB0 4 on-line 1050 8
G SB0 5 on-line 1050 8
G SB0 6 on-line 1050 8
G SB0 7 on-line 1050 8
G SB9 288 on-line 900 8
G SB9 289 on-line 900 8
G SB9 290 on-line 900 8
G SB9 291 on-line 900 8
G SB12 384 on-line 900 8
G SB12 385 on-line 900 8
G SB12 386 on-line 900 8
G SB12 387 on-line 900 8
5-3 showdevices によるメモリードレイン状況の出力例
ドメイン
board board
mem MB
perm mem MB
base addr domain
mem MB
A SB1 2048 933 0x600000 4096
A SB2 2048 0 0x200000 4096
target board
C2 250 1500
deleted MBremaining
MB
5-4 showdevices による入出力デバイス情報の出力例
ドメイン
board device resource usage
A 101 sd0
A 101 sd1
A 101 sd2
A 101 sd3 /dev/dsk/c0t3d0s0 mounted from
filesystem “/”
A 101 sd3 /dev/dsk/c0t3d0s1 dump device (swap)
A 101 sd3 /dev/dsk/c0t3d0s1 swap area
A 101 sd3 /dev/dsk/c0t3d0s3 mounted filesystem
“/var”
第 5 章 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 55
5-4 showdevices による入出力デバイス情報の出力例 (続き)
A 101 sd3 /var/run mounted filesystem
“/var/run”
A 101 sd4
A 101 sd5
詳細は、72 ページの「showdevices(1M)」 を参照してください。このコマンドで 使用できるオプションと引数の一覧、およびデバイス固有情報の表示方法について は、showdevices(1M) のマニュアルページを参照してください。
プラットフォーム情報の表示
特定ドメインへのボードの追加、ドメイン間でのボードの移動、ドメインからのボー ドの削除を行うときは、まず showboards(1M) コマンドを使って、ドメイン ID、こ のドメインで使用できるボード、およびドメインのステータスを確認します
ドメイン ID は、すべての DR コマンドで使用できます。ボードリストを使って、特 定のボードの割り当て先ドメインを判別できます。さらに、そのドメインのステータ スから、ドメインへのボードの追加、ドメイン間でのボードの移動、またはドメイン からのボードの削除が可能かどうかを確認できます。コンポーネントが使用可能なコ ンポーネントのリスト (ACL) に記載されているかどうかを調べるには、
showplatform(1M) コマンドを使用します。
showplatform(1M) コマンドを使用するには、適切な特権が必要です。このコマン
ドを使用できるユーザーグループの一覧など、このコマンドの詳細は、73 ページの 「showplatform(1M)」を参照してください。
56 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
プラットフォーム情報を表示する
ドメイン情報と ACL 情報を一覧表示します。
# showplatform
showplatform(1M) コマンドは、以下の例のように、ドメイン ID、使用可能なコン
ポーネントのリスト、およびドメインのステータスを表示します。
ACLs for domain domainA:
slot0: SB0, SB1, SB2, SB3 slot1: IO0, IO1, IO2, IO3
ACLs for domain domainB:
slot0: None slot1: None
Domain Solaris Nodename Domain Status
domainA sms3-b0 Powered Off domainB sms3-b1 Running Solaris
ボード情報の表示
システムボードを削除または移動する前に、ボードを照会して、ボードとボードの割 り当て先ドメインの状態を確認する必要があります。showboards(1M) コマンドを使 用できるユーザーグループなど、showboards(1M) コマンドの詳細は、72 ページの 「showboards(1M)」と、showboards(1M) のマニュアルページを参照してくださ い。
SC 状態モデル
Sun Fire ハイエンドサーバーの SC では、ボードの状態は、unavailable、available、 assignedactive のいずれかになります。
第 5 章 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 57
注 – SC で確認できるボードの状態は、ドメインで確認できるボードの状態とは異な
ります。ドメインで確認できるボードの状態については、9 ページの「DR の概念」 を参照してください。
5-5 Sun Fire ハイエンドシステムの SC で確認できるボードの状態
名前 説明
unavailable
available
assigned
active
ボードはドメインで使用できません (unavailable)。このボードは、 指定されたドメインの ACL に記載されていません。または、別のド メインに割り当てられています。ドメインの ACL に記載されていな いボードは、そのドメインに見えません。unavailable 状態の ボードは、そのドメインの一部とはみなされません。
ボードはドメインに追加可能な状態 (available) です。ボードは、ド メインの ACL に記載されています。同じボードを複数のドメインで 使用することができます。available 状態のボードは、論理ドメイ ンの一部とみなされません。
ボードはドメインに割り当て済みであり、このドメインの ACL に記 載されている可能性があります。ボードは、このドメイン以外のド メインで使用できません。assigned 状態のボードは、論理ドメイ ンの一部とみなされます。
ボードは接続されています。つまり、このボードは接続され、 Solaris OS に組み込まれ、Solaris OS で使用できる状態にあります
active 状態のボードは、物理ドメインの一部とみなされます。
showboards(1M) コマンド
削除または移動対象のボードを含むドメインの ID が確認できたら (または特定の ボードがすでにあるドメインに割り当てられていることがわかったら)、 showboards(1M) コマンドを使ってボードの状態を確認します。ボードは、削除も 移動もできない状態にある場合があります。
showboards(1M) コマンドの出力結果は、ユーザーが持っている特権によって
異なります。たとえば、プラットフォーム管理者はサーバー内のすべてのボードに関 する情報を取得できます。これに対して、ドメイン管理者とドメイン構成者は、自分 がアクセス権を持っているドメインに割り当てられた使用可能なボードに関する情報 しか取得できません。詳細は、72 ページの「showboards(1M)」と、 showboards(1M) のマニュアルページを参照してください。
58 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ボード情報を表示する
ドメインのボード情報を表示します。
# showboards -d domain_id
上記のコマンドは、以下のようなデバイス情報を表示します。
Slot Power Board Type Board Status Test Status Domain
SB0 On CPU Board Active Passed A
SB1 - Empty Slot Assigned - A
showboards(1M) コマンドでは、割り当て済みの使用可能なすべてのシステムボー ドと、ドメイン内のすべての入出力ボードを表示できます。ボード情報の表示方法に ついては、showboards(1M) のマニュアルページを参照してください。
ボードの追加
ドメインにボードを追加すると、ボードの状態は何回か変化します。ボードがまだ割 り当てられていない場合は、まずドメインに割り当てられます。次に、ドメインに接 続され、Solaris OS に組み込まれます。接続されたボードは、物理ドメインの一部と みなされ、OS で使用可能です。
ドメインにボードを追加するには、適切な特権が必要です。addboard(1M) コマンド を使用するために必要な特権など、このコマンドの詳細は、64 ページの 「addboard(1M)」と、addboard(1M) のマニュアルページを参照してください。
DR を使ってドメインに COD ボードを追加するときは、対象ドメインの RTU
ライセンス数に十分余裕があり、COD ボード上のアクティブな CPU をすべて有効 にできることを確認してください。この条件が満たされていないと、ドメイン内で有 効にできない CPU が検出されるたびに、DR によってメッセージが表示されます。 COD オプションについては、『System Management Services (SMS) 管理者マニュア ル』を参照してください。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 59
ドメインにボードを追加する
ボードをドメインに追加します。
# addboard -d domain_id board_id
以下の例では、ドメイン A にシステムボード 2 (SB2) を追加します。この処理の再試 行は、必要に応じて、10 (600 秒) ごとに 2 回まで行われます。
# addboard -d A -r 2 -t 600 SB2
DR 操作中に addboard(1M) コマンドの実行が失敗すると、対象のボードは元
の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに記録 されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラー が回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要があり ます。
ボードの削除
ドメインからボードを削除すると、そのボードは、現在割り当てられていて、場合に よっては有効 (active) 状態にあるドメインから削除されます。ボードを削除するに は、そのボードが割り当て済み (assigned) か有効 (active) でなければなりません。
必ずボード上のコンポーネントの使用状態を確認した上で、ドメインから削除してく ださい。ボードに永続メモリーが搭載されている場合は、ボードを削除する前に、メ モリーを同じドメイン内の別のボードに移動しておきます。同様に、使用中のデバイ スがある場合は、そのデバイスがシステムで使用されなくなるまで待ってから、ボー ドを削除する必要があります。
ドメイン管理者は、ボードの構成を解除して切り離すことができますが、ドメインの
ACL に記載されていないボードの割り当てを解除することはできません。 deleteboard(1M) コマンドを使用するために必要な特権など、このコマンドの詳細
は、66 ページの「deleteboard(1M)」と、deleteboard(1M) のマニュアルページ を参照してください。
60 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
ドメインからボードを削除する
ボードをドメインから削除します。
# deleteboard board_id
以下は、deleteboard(1M) コマンドを使って現在のドメインからシステムボード 2 (SB2) を削除する例です。この処理の再試行は、必要に応じて、15 分 (900 ) ごとに 2 回まで行われます。
# deleteboard -r 2 -t 900 SB2
DR 操作中に deleteboard(1M) コマンドの実行が失敗すると、対象のボード
は元の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに 記録されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エ ラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要が あります。
ボードの移動
ボードを別のドメインに移動する処理は、いくつかの段階を経て行われます。まず、 ボードが現在割り当てられており、アクティブになっている可能性があるドメインか ら、ボードを切り離します。このとき、ボードの状態は assigned または active であ る必要があります。次に、ボードを対象のドメインに割り当てます。その後、ボード を対象のドメインに接続し、Solaris OS に組み込みます。これで、ボードが使用可能 な状態になります。
必ずボード上のメモリーとデバイスの使用状態を確認した上で、ボードを移動してく ださい。ボードに永続メモリーが搭載されている場合は、ボードを別のドメインに移 動する前に、メモリーを同じドメイン内の別のボードに移動しておく必要がありま す。同様に、使用中のデバイスがある場合は、そのデバイスがシステムで使用されな くなるまで待ってから、ボードを移動する必要があります。
moveboard(1M) コマンドを使用するために必要な特権など、このコマンドの詳細 は、68 ページの「moveboard(1M)」と、moveboard(1M) のマニュアルページを参 照してください。
第 5 章 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 61
注 – DR を使って別のドメインに COD ボードを移動するときは、対象ドメインの
RTU ライセンス数に十分余裕があり、COD ボード上のアクティブな CPU をすべて 有効にできることを確認してください。この条件が満たされていないと、ドメイン内 で有効にできない CPU が検出されるたびに、DR によってメッセージが表示されま す。COD オプションについては、『System Management Services (SMS) 管理者マ ニュアル』を参照してください。
ボードを移動する
ボードを別のドメインに移動します。
# moveboard -d domain_id board_id
以下は、moveboard(1M) コマンドを使って、現在オンドメインからドメイン A へシ ステムボード 2 (SB2) を移動する例です。この処理の再試行は、必要に応じて、15 分 (900 秒) ごとに 2 回まで行われます。
# moveboard -d A -r 2 -t 900 SB2
DR 操作中に moveboard(1M) コマンドの実行が失敗すると、対象のボードは元
の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに記録 されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラー が回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要があり ます。
アクティブなシステムボードの交換
この節では、ドメイン内のアクティブなシステムボードを交換する方法について説明 します。
62 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
アクティブなシステムボードを交換する
1. 現在のドメインからシステムボードを削除します。
# deleteboard board_id
以下の例では、現在のドメインからシステムボード 2 (SB2) を削除します。
# deleteboard -r 2 -t 900 SB2
2. 交換用ボードをドメインに追加します。
# addboard -d domain_id board_id
以下の例では、ドメイン A にシステムボード 3 (SB3) を追加します。この処理の再試 行は、必要に応じて、15 (900 秒) ごとに 2 回まで行われます。
# addboard -d A -r 2 -t 900 SB3
SMS DR コマンドとオプション
この節では、SMS DR コマンドと関連オプションについて説明します。SMS DR コマ ンドについては、『System Management Services (SMS) リファレンスマニュアル』 を参照してください。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 63
addboard(1M)
addboard(1M) コマンドは、ボードをドメインに接続します。詳細は、59 ページの 「ボードの追加」と、addboard(1M) のマニュアルページを参照してください。
5-6 addboard コマンドオプション
オプションとオペランド 機能
board_id
-c function
-d domain_id
-f
-h
-n
-q
-r retry_count
-t timeout
-y
追加対象のボードの ID。ボード ID はボードの位置に対 応しています。たとえば SB2 はスロット 2 のボードで す。複数のボード IDを使用できます。
次に移行するボードの構成状態を指定します。ボードの 追加は、いくつかの段階に分けて行うことができます。 たとえば、ボードを割り当て、接続し、その後構成する ことができます。
指定されたドメインで DR 操作を実行します。
指定されたアクションを強制的に実行します。通常、こ れはハードウェア固有の処理で、安全性の確保より優先 して行われます。強制的に状態を変更すると、条件が ok または unknown 以外の占有装置のハードウェアリソース を、ハードウェア固有の安全性チェックとは無関係に使 用できるようになります。
ヘルプ情報 (使用法) を表示します。
すべてのプロンプトに対して No で答えます。
非出力モードで実行します。メッセージやプロンプトは 標準出力に書き出されません。-q を単独で使用すると、
-n オプションを指定した場合と同じ結果になります。
操作に失敗した場合、指定された回数だけ再試行できま す。
再試行までの待機時間を秒単位で指定します。
すべてのプロンプトに対して Ye s で答えます。
64 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5-7 に、addboard(1M) コマンドを使用するために必要な特権を一覧します。 platform operator グループ、platform service グループ、superuser グループのユー
ザーは、このコマンドを実行できません。
5-7 addboard コマンドを実行するために必要な特権
プラットフォーム管理者 ドメイン管理者 ドメイン構成者
assign を -c オプショ ン付きで実行して、ドメ インにボードを割り当て ることができます。
ボードがドメインに割り当てら れている場合、またはドメイン の使用可能なコンポーネントの リストに記載されていて、かつ ほかのドメインに割り当てられ ていない場合、このドメインに ボードを接続したり、構成した りできます。
ボードがドメインに割り当て られている場合、またはドメ インの使用可能なコンポーネ ントのリストに記載されてい て、かつほかのドメインに割 り当てられていない場合、こ のドメインにボードを接続し たり、構成したりできます。
以下の例では、ドメイン A にシステムボード 2 (SB2) を接続します。この処理の再試 行は、必要に応じて、10 (600 秒) ごとに 2 回まで行われます。
# addboard -d domainA -r 2 -t 600 SB2
DR 操作中に addboard(1M) コマンドの実行が失敗すると、対象のボードは元
の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに記録 されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラー が回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要があり ます。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 65
deleteboard(1M)
deleteboard(1M) コマンドは、特定のボードを特定のドメインから切り離します。
詳細は、60 ページの「ボードの削除」と、deleteboard(1M) のマニュアルページ を参照してください。
5-8 deleteboard コマンドオプション
オプションとオペランド 機能
board_id
-c function
-f
-h
-n
-q
-r retry_count
-t timeout
-y
削除対象のボードの ID。ボード ID はボードの位置に対 応しています。たとえば SB2 はスロット 2 のシステム ボードです。複数のボード ID を使用できます。
次に移行するボードの構成状態を指定します。ボードの 削除は、いくつかの段階に分けて行うことができます。 たとえば、ボードの構成を解除し、ボードを切り離し、 その後割り当てを解除することができます。
指定されたアクションを強制的に実行します。通常、こ れはハードウェア固有の処理で、安全性の確保より優先 して行われます。強制的に状態を変更すると、条件が ok または unknown 以外の占有装置のハードウェアリソース を、ハードウェア固有の安全性チェックとは無関係に使 用できるようになります。
ヘルプ情報 (使用法) を表示します。
すべてのプロンプトに対して No で答えます。
非出力モードで実行します。メッセージやプロンプトは 標準出力に書き出されません。-q を単独で使用すると、
-n オプションを指定した場合と同じ結果になります。
操作に失敗した場合、指定された回数だけ再試行できま す。
再試行までの待機時間を秒単位で指定します。
すべてのプロンプトに対して Ye s で答えます。
66 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5-9 に、deleteboard(1M) コマンドを使用するために必要な特権を一覧します。 platform operator グループ、platform service グループ、superuser グループのユー
ザーは、このコマンドを実行できません。
5-9 deleteboard コマンドを実行するために必要な特権
プラットフォーム管理者 ドメイン管理者 ドメイン構成者
unassign を -c オプ ション付きで実行して、 ドメイン内のアクティブ でないボードの割り当て を解除できます。ユー ザーがドメイン特権を 持っている場合、 deleteboard を実行す ると、ボードの構成解除 と切り離しが行われたあ と、割り当てが解除され ます。
ドメインからのボードの構成解 除、切り離し、または割り当て 解除を実行できます。ドメイン からボードを割り当て解除でき るのは、そのボードがそのドメ インの ACL に記載されている 場合に限られます。
ドメインからのボードの構成 解除、切り離し、または割り 当て解除を実行できます。ド メインからボードを割り当て 解除できるのは、そのボード がそのドメインの ACL に記 載されている場合に限られま す。
以下は、deleteboard(1M) コマンドを使って現在のドメインからシステムボード 2
(SB2) を切り離す例です。この処理の再試行は、必要に応じて、15 分 (900 ) ごとに 2 回まで行われます。
# deleteboard -r 2 -t 900 SB2
DR 操作中に deleteboard(1M) コマンドの実行が失敗すると、対象のボード
は元の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに 記録されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エ ラーが回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要が あります。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 67
moveboard(1M)
moveboard(1M) コマンドは、ドメインからボードを切り離し、このボードを別のド
メインに接続します。詳細は、61 ページの「ボードの移動」と、moveboard(1M) の マニュアルページを参照してください。
5-10 moveboard コマンドオプション
オプションとオペランド 機能
board_id
-c function
-d domain_id
-f
-h
-n
-q
-r retry_count
-t timeout
-y
移動対象のボードの ID。ボード ID はボードの位置に対応 しています。たとえば SB2 はスロット 2 のシステムボー ドです。複数のボード ID を使用できます。
次に移行するボードの構成状態を指定します。ボードの移 動は、いくつかの段階に分けて行うことができます。たと えば、ボードを割り当て、接続し、その後構成することが できます。
指定されたドメインで DR 操作を実行します。
指定されたアクションを強制的に実行します。通常、これ はハードウェア固有の処理で、安全性の確保より優先して 行われます。強制的に状態を変更すると、条件が ok また は unknown 以外の占有装置のハードウェアリソースを、 ハードウェア固有の安全性チェックとは無関係に使用でき るようになります。
ヘルプ情報 (使用法) を表示します。
すべてのプロンプトに対して No で答えます。
非出力モードで実行します。メッセージやプロンプトは標 準出力に書き出されません。-q を単独で使用すると、-n オプションを指定した場合と同じ結果になります。
操作に失敗した場合、指定された回数だけ再試行できま す。
再試行までの待機時間を秒単位で指定します。
すべてのプロンプトに対して Ye s で答えます。
68 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5-11 に、moveboard(1M) コマンドを使用するために必要な特権を一覧します。 platform operator グループ、platform service グループ、superuser グループのユー
ザーは、このコマンドを実行できません。
5-11 moveboard コマンドを実行するために必要な特権
プラットフォーム管理者 ドメイン管理者 ドメイン構成者
assign を -c オプショ ン付きで実行して、ある ドメインのボードを別の ドメインに割り当てるこ とができます。ただし、 該当するボードが最初の ドメイン内で無効になっ ている (active 状態でな い) 必要があります。
ボードを別のドメインに割り当 て、接続し、構成することがで きます。ボードが別のドメイン で有効になっている場合、 moveboard コマンドを実行す ると、そのドメインからボード が構成解除され、切り離されま す。moveboard を使ってボー ドの割り当てを解除し、再度割 り当てるには、そのボードが ACL に記載されている必要が あります。moveboard コマン ドは、ボードを接続し、構成す ることができます。
ドメイン管理者は、 moveboard(1M) コマンドを使 用する両方のドメインのドメイ ン特権を持っている必要があり ます。
ボードを別のドメインに割り 当て、接続し、構成すること ができます。ボードが別のド メインで有効になっている場 合、moveboard コマンドを 実行すると、そのドメインか らボードが構成解除され、切 り離されます。moveboard を使ってボードの割り当てを 解除し、再度割り当てるに は、そのボードが ACL に記 載されている必要がありま す。moveboard コマンド は、ボードを接続し、構成す ることができます。
ドメイン構成者は、 moveboard(1M) コマンドを 使用する両方のドメインのド メイン特権を持っている必要 があります。
以下は、moveboard(1M) コマンドを使って、システムボード 5 (SB5) を現在のドメ インからドメイン B に移動する例です。この処理の再試行は、必要に応じて、15 分 (900 秒) ごとに 2 回まで行われます。
# moveboard -d domainB -r 2 -t 900 SB5
DR 操作中に moveboard(1M) コマンドの実行が失敗すると、対象のボードは元
の状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに記録 されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラー が回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要があり ます。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 69
rcfgadm(1M)
rcfgadm(1M) コマンドは、SC から DR 操作を実行するコマンドです。このコマンド
では、接続点 (デバイスツリー内のデバイスノード) に対して、リモートで構成管理 操作を行うことができます。rcfgadm(1M) コマンドの詳細と使用例については、マ ニュアルページを参照してください。
5-12 に、rcfgadm(1M) コマンドのオプションとオペランドを一覧します。
5-12 rcfgadm コマンドオプション
オプションとオペランド 機能
-a
-c function
-d domain_id
-f
-h
-h ap_id
-h ap_type
-l ap_id | ap_type
-n
-o hardware_options
-r retry_count
-s listing_options
-T timeout
-t
-v
-x hardware_function
-y
動的接続点を一覧表示します。
次に移行するボードの構成状態を指定します。
connectdisconnectconfigure、または unconfigure を実行できます。
指定されたドメインで DR 操作を実行します。
指定のアクションを強制的に実行します。
指定のヘルプメッセージを出力します。ap_id または ap_type を指定すると、接続点に関するハードウェア固有 のヘルプが表示されます。
指定の接続点の状態と条件を一覧表示します。
すべてのプロンプトに対して No で答えます。
指定のハードウェア固有オプションを使用します。
操作に失敗した場合、指定された回数だけ再試行できま す。
指定のリストオプションを一覧表示します。
再試行までの待機時間を秒単位で指定します。
いくつかの接続点をテストします。
冗長モードで実行します。
ハードウェア固有の機能を使用します。
すべてのプロンプトに対して Ye s で答えます。
70 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
5-13 に、rcfgadm(1M) コマンドを使用するために必要な特権を一覧します。 platform operator グループ、platform service グループ、superuser グループのユー
ザーは、このコマンドを実行できません。
5-13 rcfgadm コマンドを実行するために必要な特権
プラットフォーム管理者 ドメイン管理者 ドメイン構成者
assign または unassign を -x オプション付きで実行 して、ドメインにボードを割 り当てたり、ドメインから ボードの割り当てを解除した りできます。unassign を実 行するには、実行中のドメイ ンからボードの割り当てが解 除され、このボードが無効 (active 状態でない) になって いる必要があります。
ドメインからのボードの切り 離し、ドメインへのボードの 接続と構成、またはドメイン からボードの構成解除を実行 できます。ドメインの ACL にボードが記載されていれ ば、ドメインにボードを割り 当てたり、ドメインからボー ドの割り当てを解除したりで きます。
ドメインからのボードの切り 離し、ドメインへのボードの 接続と構成、またはドメイン からボードの構成解除を実行 できます。ドメインの ACL にボードが記載されていれ ば、ドメインにボードを割り 当てたり、ドメインからボー ドの割り当てを解除したりで きます。
DR 操作中に rcfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の
状態に戻りません。dxs または dca のエラーメッセージが、ドメインログに記録さ れます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラーが 回復不能な場合、対象のボードを使用するには、ドメインを再起動する必要がありま す。
scdrhelp(1M)
scdrhelp(1M) シェルスクリプトは、Sun Fire ハイエンドサーバーの動的再構成エ
ラーヘルプシステムを起動します。このヘルプシステムは、JavaHelp™ hsviewer スクリプトを使用します。
ドメイン管理者とドメイン構成者を除くすべてのユーザー特権のグループは、このコ マンドを使用できます。
詳細は、74 ページの「エラーメッセージヘルプシステム」と、scdrhelp(1M) のマ ニュアルページを参照してください。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 71
showboards(1M)
showboards(1M) コマンドは、ドメイン内のシステムボードの割り当て情報とス
テータスを表示し、ボードが COD (Capacity On Demand) ボードであるかどうかを 示します。詳細は、57 ページの「ボード情報の表示」と、showboards(1M) のマ ニュアルページを参照してください。
showboards(1M) は DR 固有のコマンドではありませんが、DR コマンドと組み合わ せて使用することをお勧めします。以下の表 5-14 に、showboards(1M) のコマンド オプションを示します。
5-14 showboards コマンドオプション
オプション 機能
-d domain_id
-h
-v
このコマンドは、すべてのユーザー特権のグループで使用できます。ただし、ドメイ ン管理者とドメイン構成者は、特権を持っているドメインでのみボードを表示できま す。
指定されたドメインで DR 操作を実行します。
ヘルプ情報 (使用法) を表示します。
冗長モードで実行します。このモードでは、ドメイン構 成ユニット (DCU) など、すべてのコンポーネントが表示 されます。なお、DCU には、CPUPCISC などがあ ります。
showdevices(1M)
showdevices(1M) コマンドは、システムボード上の構成済み物理デバイスと、これ
らのデバイスで使用できるリソースを表示します。showdevices(1M) コマンドは DR 固有のコマンドではありませんが、DR コマンドと組み合わせて使用することを
お勧めします。詳細は、54 ページの「デバイス情報の表示」と、showdevices(1M) のマニュアルページを参照してください。
72 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
使用情報は、システムリソースをアクティブに管理しているアプリケーションおよび サブシステムによって提供されます。システムボードの DR 操作がどのような影響を 及ぼすかは、管理対象のリソースをオフラインで照会することによって確認できます
5-15 showdevices コマンドオプション
オプションとオペランド 機能
board_id
-d domain_id
-h
-p reports
-v
追加対象のボードの ID。ボード ID はボードの位置に対 応しています。たとえば SB2 はスロット 2 のシステム ボードです。複数のボード ID を使用できます。
指定されたドメインで DR 操作を実行します。
ヘルプ情報 (使用法) を表示します。
オフライン照会情報を表示します。
すべての入出力デバイスの情報を表示します。
ドメインのデバイス情報を表示できるのは、ドメイン管理者とドメイン構成者だけで す。ただし、ドメイン管理者とドメイン構成者が特権を持っているドメインのデバイ ス情報しか表示できません。
showplatform(1M)
showplatform(1M) コマンドは、ACL、各ドメインのドメイン状態、COD
(Capacity On Demand) 情報を表示します。showplatform(1M) コマンドは DR 固 有のコマンドではありませんが、DR コマンドと組み合わせて使用することをお勧め します。詳細は、56 ページの「プラットフォーム情報の表示」と、 showplatform(1M) のマニュアルページを参照してください。
5-16 showplatform コマンドオプション
オプションとオペランド 機能
-d domain_id
-h
-p domains | available ethernet | cod
-v
指定されたドメインで DR 操作を実行します。
ヘルプ情報 (使用法) を表示します。
以下の項目ごとに、COD 情報を含むレポートを表示しま す。
ドメイン状態 (domains)
ドメインの ACL (available)
ドメインの Ethernet アドレス (ethernet)
使用可能な全コマンドの情報を表示します。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 73
platform service グループと superuser グループを除くすべてのユーザー特権のグ ループは、このコマンドを使用できます。ただし、ドメイン管理者とドメイン構成者 は、自分が特権を持っているドメインでのみプラットフォーム情報を表示できます。
エラーメッセージヘルプシステム
SMS ソフトウェアには、特定のエラーメッセージの説明とそのエラーからの回復方 法を検索できる、エラーメッセージヘルプシステムがあります。
DR エラーメッセージヘルプシステムを起動するには、以下のコマンドを実行しま す。
# /opt/SUNWSMS/jh/scdrhelp/scdrhelp &
標準 JavaHelp システムビューア hsviewer により、DR エラーメッセージヘルプシ ステムが表示されます。このビューアには、図 5-1 に示すように、ツールバーと 2 つ の区画 (内容区画とナビゲーション区画) があります。
索引ボタン
検索ボタン
内容ボタン
ナビゲーション
区画
5-1 hsviewer GUI コンポーネント
内容区画
74 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
JavaHelp の目次
DR エラーメッセージは、図 5-1 に示すように、エラーのタイプ別に論理グループに 分けられます。これらのグループは、目次の最上位の見出し項目として表示される主 要トピックになります。各グループ名の下に、エラーメッセージの番号と簡易テキス トが表示されます。
JavaHelp の索引
DR エラーメッセージは索引が付いているため、索引に主要トピックが表示されます ( 5-2)。索引トピックは、必要に応じて組み込みトピックになります。組み込みト
ピックだけが、エラーメッセージへのリンクになっています。
索引ボタン
組み込みトピック
5-2 JavaHelp の索引の表示
JavaHelp の検索
DR エラーメッセージヘルプシステムには、全文検索機能があります。エラーメッ セージヘルプファイルに索引を付けることにより、検索データベースが作成されま す。
5 SC からの SMS DR 操作 ( ハイエンドシステムのみ ) 75
特定のエラーメッセージを検索する前に、エラーメッセージに含まれるテキスト文字 列を検索してください。また、数値の使用は避けてください。数値は、置換可能なテ キストとして処理されます。以下は、JavaHelp システムのエラーウィンドウの表示 例です。
検索ボタン
5-3 JavaHelp の検索の表示
置換可能テキスト
76 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
6
DR の内部
この章では、DR の単なるユーザの視点からではなく、技術ユーザの視点から考えた とき有用な DR の機能について説明します。
この章では、以下のトピックについて説明します。
77 ページの「ドメイン上のソフトウェアコンポーネント」
79 ページの「SC 上のソフトウェアコンポーネント (ハイエンドシステムのみ)
ドメイン上のソフトウェアコンポーネント
この節では、DR 操作を遂行する、ドメイン上の DR 関連のソフトウェアコンポーネ ントについて説明します。
ドメイン構成サーバー (ハイエンドシステムのみ)
ドメイン構成サーバー (DCS) は、ハイエンドシステムドメインで実行されるデーモ ンプロセスであり、最初のリモート DR 要求を受け取った時点で inetd(1M) によっ て起動されます。各ドメインで、DCS 1 つずつ実行されます。DCS は、SC で実行 されるドメイン構成エージェント (DCA) から DR 要求を受け入れます。DCS は、 DR 操作を受け入れると要求を実行して結果を DCA に渡します。79 ページの「ドメ イン構成エージェント (DCA)」を参照してください。
Solaris 10 OS が動作しているドメインでは、inetd.conf ファイルに DCS
エントリはありません。それ以前のバージョンの Solaris が動作しているドメインで は、inetd.conf ファイルに DCS の エントリが 1 つあります。後者の場合、
inetd.conf ファイルの sun-dr エントリを変更または削除するときは、 ipsecinit.conf ファイルの sun-dr エントリにも同じ変更を加えてください。
77
DR ドライバ
ハイエンドシステム上の DR ドライバは、プラットフォームに依存しないドライバ dr とプラットフォーム固有のモジュール drmach からなります。ミッドレンジシス テムの DR ドライバは sbd で、プラットフォーム固有のモジュールは sbdp です。 DR ドライバは、DR 操作の制御が可能な場合には Solaris ソフトウェアの標準機能を 使用し、必要に応じてプラットフォーム固有のモジュールを呼び出します。DR ドラ イバは、DR 操作の接続点として使用される、ファイルシステム内のマイナーノード を作成します。
Reconfiguration Coordination Manager (RCM)
Reconfiguration Coordination Manager (RCM) は、ドメイン内のリソースに対する DR 操作を調整するデーモンプロセスです。RCM デーモンは、汎用アプリケーショ ンプログラムインタフェース (API) を使って、DR 開始元と RCM クライアント間で DR 操作を調整します。
RCM コンシューマは、DR 操作を要求する DR 開始元と、DR 要求に応答する DR
ライアントからなります。通常、DR 開始元は構成管理コマンド cfgadm(1M) です。 しかし、Sun Management Center などの GUI の場合もあります。
DR クライアントは以下のいずれかになります。
1 つ以上のハードウェアデバイスからなる高度なリソースをエクスポートするソフ
トウェア層 (マルチパスアプリケーションなど)
DR 操作を監視するアプリケーション (Sun Management Center など)
リモートシステム上のエンティティー (サーバー上のシステムコントローラなど)
システムイベントフレームワーク
DR は、Solaris システムイベントフレームワークを使って、ほかのソフトウェアエン ティティーに対して、DR 操作による変更の発生を通知します。この操作では、ま ず、DR からシステムイベントデーモン syseventd に DR イベントが送信され、次 にこのデーモンから DR イベントの加入者にイベントが送信されます。システムイベ ントデーモンについては、syseventd(1M) のマニュアルページを参照してくださ い。
78 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
SC 上のソフトウェアコンポーネント (ハイエンドシステムのみ)
この節では、DR 操作を遂行する、ハイエンドシステムの SC 上の DR 関連のソフト ウェアコンポーネントについて説明します。
DR 管理モデル
使用可能なコンポーネントのリストは、ユーザーの名前とグループ識別子に基づい て、実行可能な管理タスクを制御します。各 DR 操作の特権モデルの概要は、53 ページの「SC からの SMS DR 操作 (ハイエンドシステムのみ)」に記載されていま す。各 SMS コマンドを実行するために必要な特権については、『System Management Services (SMS) 管理者マニュアル』を参照してください。
DR プロセスとデーモン
DR 操作は、Sun Fire ハイエンドシステムコントローラ (SC) 上のさまざまなプロセ スやデーモンの連携によって行われます。どのプロセス、どのデーモンが使用される かは、どこから DR 操作を実行するかによって決定されます。たとえば、SC から DR 操作を実行する場合、システムは、ドメインから DR 操作を実行する場合より多 くのプロセスまたはデーモンを使用します。
ドメイン上のプロセスとデーモンについては、このマニュアルのほかの章で詳しく説 明しています。SC 上の SMS ソフトウェア内のプロセスとデーモンについては、 『System Management Services (SMS) 管理者マニュアル』を参照してください。
ドメイン構成エージェント (DCA)
ドメイン構成エージェント (DCA) は、Sun Management CenterSMS などのアプリ ケーションが、Sun Fire ハイエンドシステムドメインで DR 操作を開始できるように します。DCA SC 上で実行され、SC 上で実行中のソフトウェアアプリケーション とドメイン上のドメイン構成サーバー間の DR 通信を管理します。DCA は、Sun Fire ハイエンドシステムの各ドメインの SC 1 つずつ実行されます。DCA につい ては、『System Management Services (SMS)管理者マニュアル』を参照してくださ い。
6 DR の内部 79
注 – inetd.conf ファイルの sun-dr エントリを変更または削除するときは、
ipsecinit.conf ファイルの sun-dr エントリにも同じ変更を加えてください。
プラットフォーム構成デーモン (PCD) (ハイエン ドシステムのみ)
プラットフォーム構成デーモン (PCD) は、PCD データベースを構成するいくつかの フラットファイルを使って、個々の Sun Fire ハイエンドシステムの構成を管理しま す。Sun Fire ハイエンドシステムの構成の変更は、すべて PCD から行う必要があり ます。PCD については、『System Management Services (SMS)管理者マニュアル』 を参照してください。
ドメイン X サーバー (DXS)
ドメイン X サーバー (DXS) は、ドメインの SC DR モジュール (drmach) 間の通信 を管理します。DXS は、Sun Fire ハイエンドシステムの各ドメインの SC 1 つずつ 実行されます。DXS については、『System Management Services (SMS)管理者マ ニュアル』を参照してください。
80 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
付録 A
DR コマンドの一覧
この章では、主な DR 操作と DR コマンドの一覧を示します。ハイエンドシステム上 の一般的な DR 操作は、この付録で紹介するいくつかの SMS コマンドで実行できま す。ハイエンドシステムのユーザーの多くは、これらのコマンドを優先的に使用しま す。
注意DR コマンドの実行方法を誤ると、システムが無効になることがあります。以
下の表に示すコマンドを実行するときは、必ず、事前に必要な手順 (このマニュアル の随所で説明) を実行してください。この付録は、DR の使用方法に習熟したユー ザーのみを対象としています。
A-1 DR 操作と DR コマンドの一覧
DR 操作
ボードの状態、タイプ、および 条件を表示する
ボードスロットとボード コンポーネントの情報を表示する
ハイエンドシステムのボードの 状態を表示する
ミッドレンジシステムのボードの 状態を表示する
ドメインで使用可能なボードを 表示する
特定のドメインのシステムボード の状態を表示する
ハイエンドシステムの SMS コマンド cfgadm コマンド
rcfgadm -la
-d domain_id
なし
5 章を参照
なし
5 章を参照
5 章を参照
cfgadm -la
prtdiag
cfgadm -a -v -s “select= class(sbd)”
cfgadm -a -v
cfgadm -l
cfgadm -a -v -s “select= class(sbd)”
81
A-1 DR 操作と DR コマンドの一覧 (続き)
ハイエンドシステムの
DR 操作
システムボードまたは 入出力ボードのクラスを表示する
接続点に関連付けられたクラスを 表示する
システムボードをテストする
入出力ボードをテストする なし 35 ページの「入出力ボードをテストする (
ドメインにボードを追加する
ドメインからボードを削除する
SMS コマンド cfgadm コマンド
rcfgadm -d domain_id
-s “cols=ap_id:class”
rcfgadm -a -d domain_id
-s “cols=ap_id:class”
rcfgadm -d domain_id
-t ap_id
addboard -d domain_id
board_id
deleteboard board_id cfgadm -v -c disconnect board_id
cfgadm -s “cols=ap_id:class”
cfgadm -a -s “cols=ap_id:class”
cfgadm -t ap_id
ミッドレンジシステムのみ)」を参照
cfgadm -v -c configure board_id
または
cfgadm -v -c configure ap_id
または
cfgadm -v -c disconnect ap_id
ボードを別のドメインに移動する 62 ページの「ボードを移動す
る」を参照
システムボード上に CPU を構成 する
システムボード上にメモリーを 構成する
システムボード上の CPU と メモリーの構成を解除する
メモリーの構成解除の状況を追跡 する
永続メモリーが搭載された システムボードの構成を解除する
システムボードまたは 入出力ボードを切り離す
入出力ボード上の PCI スロットに 接続する
rcfgadm -c configure
-d domain_id SBx::cpuy
rcfgadm -c configure
-d domain_id SBx::memory
rcfgadm -c unconfigure -d domain_id SBx
rcfgadm -a -d domain_id
-s “select=type (memory), cols=ap_id:o_state:info”
rcfgadm -c unconfigure
-d domain_id -y SBO
rcfgadm -c disconnect
-d domain_id board_id
rcfgadm -c connect
-d domain_id pci_ap_id
44 ページの「システムボードを別のドメイ ンに移動する」を参照
cfgadm -c configure SBx::cpuy
cfgadm -c configure SBx::memory
cfgadm -c unconfigure SBx
cfgadm -a -s “select=type (memory),
cols=ap_id:o_state:info”
cfgadm -c unconfigure -y SBO
cfgadm -c disconnect board_id
cfgadm -c connect pci_ap_id
82 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
A-1 DR 操作と DR コマンドの一覧 (続き)
DR 操作
入出力ボード上の PCI スロットを 構成する
入出力ボード上の PCI スロットを 切り離す
入出力ボード上の PCI スロットの 構成を解除する
ハイエンドシステムの SMS コマンド cfgadm コマンド
rcfgadm -c configure
-d domain_id pci_ap_id
rcfgadm -c disconnect
-d domain_id pci_ap_id
rcfgadm -c unconfigure
-d domain_id pci_ap_id
cfgadm -c configure pci_ap_id
cfgadm -c disconnect pci_ap_id
cfgadm -c unconfigure pci_ap_id
付録 ADR コマンドの一覧 83
84 Sun Fire ハイエンド / ミッドレンジシステム Dynamic Reconfiguration ユーザーマニュアル • 2005 8
Loading...