Sun Microsystems Sun Fire High-Eng and Midrange Systems User's Guide [zh]

Sun Microsystems, Inc. www.sun.com
Sun Fire 高階與中階系統動態重新配置
使用者指南
文件號碼:819-3190-10 2005 8 月, 修訂版 A
請將您對本文件的意見提交至: http://www.sun.com/hwdocs/feedback
Sun Microsystems, Inc. 對於本文件所述相關技術擁有智慧財產權。這些智慧財產權包含 http://www.sun.com/patents 上所列的一項或多項美
國專利,以及在美國或其他國家/地區擁有的一項或多項其他專利或申請中專利。但並不以此為限。
本文件及相關產品在限制其使用、複製、發行及反編譯的授權下發行。未經 Sun 及其授權人 (如果有) 事先的書面許可,不得使用任何方法、任 何形式來複製本產品或文件的任何部分。
協力廠商軟體,包含字型技術,其版權歸 Sun 供應商所有,經授權後使用。
本產品中的某些部分可能源自加州大學授權的 Berkeley BSD 系統的開發成果。UNIX 是在美國及其他國家/地區的註冊商標,已獲得 X/Open
Company, Ltd. 專屬授權。
SunSun MicrosystemsSun 標誌、AnswerBook2docs.sun.comSun Fire Solaris™ Sun Microsystems, Inc. 在美國及其他國家的商標
或註冊商標。
所有 SPARC 商標都 SPARC International, Inc. 在美國和其他國家/地區的商標或註冊商標,經授權後使用。凡具有 SPARC 商標的產品都是採用
Sun Microsystems, Inc. 所開發的架構。
OPEN LOOK Sun™ Graphical User Interface (Sun 圖形化使用者介面) 都是由 Sun Microsystems,Inc. 為其使用者與授權者所開發的技術。 Sun 感謝 Xerox 公司在研究和開發視覺化或圖形化使用者介面之概念上,為電腦工業所做的開拓性貢獻。Sun 已向 Xerox 公司取得 Xerox 圖形 化使用者介面之非獨占性授權,該授權亦適用於使用 OPEN LOOK GUI 並遵守 Sun 書面授權合約的 Sun 公司授權者。
本文件以其 「原狀」提供,對任何明示或暗示的條件、陳述或擔保,包括對適銷性、特殊用途的適用性或非侵權性的暗示保證,均不承擔任何 責任,除非此免責聲明的適用範圍在法律上無效。
請回收
目錄
前言 xi
1. DR 之簡介 1
DR Sun Fire 高階與中階系統上 1
DR 的功能 2
共用 DR 作業簡介 2
如何使用 DR 3
熱插式硬體 4
自動式 DR (ADR) 4
需求容量 (COD) 4
Solaris 軟體上的 DR 5
網域上的 DR 執行 Solaris 9 作業系統或 Solaris 10 作業系統 5
網域中的 DR 執行 Solaris 8 作業系統 5
2. DR 概念 7
動態系統網域 8
附接點 8
附接點類別 9
高階系統附接點 9
中階系統附接點 10
iii
變更至附接點 10
狀態與情況 11
板與板插槽狀態 11
板情況 12
元件狀態 12
元件情況 13
可分離性 13
永久和非永久記憶體 13
複製重新命名 14
記憶體交錯 14
可修改之記憶體錯誤 14
靜止 15
安全暫停和非安全暫停裝置 16
I/O 板上的 DR 17
高階系統 I/O 板、Golden IOSRAMMaxCPU hsPCI+ 17
中階系統 I/O 組件、PCI CompactPCI 17
CompactPCI 之說明 18
一般 DR 板作業 19
連接作業 19
配置作業 19
中斷連線作業 20
取消配置作業 20
DR 概念圖示 20
3. 準備使用 DR 23
cfgadm(1M) 指令 23 rcfgadm(1M) 指令 (僅適用於高階)25
檢查裝置類型、狀態和情況 25
顯示狀態、類型和情況 25
iv Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
顯示有關板插槽和元件的資訊 25
準備在網域裡使用 DR 26
顯示網域裡可用的板 26
顯示系統板狀況 26
顯示系統板狀況 26
測試板 27
測試系統板 27
測試 I/O 板 (僅適用於中階系統)28
DR 準備一張 I/O 板 (僅適用於高階系統) 29
4. DR 程序 從系統網域 31
增加系統板 31
新增系統板 32
連結系統板但不進行配置 32
配置已連線的系統板 33
刪除系統板 33
刪除系統板 33
取消系統板之配置但不中斷連線 34
刪除未配置之系統板 34
暫時刪除系統板 34
尋找含有網域永久記憶體之系統板 34
取消配置含有永久記憶體的系統板 35
搬移系統板 35
在網域之間搬移系統板 35
新增 I/O 36
新增 I/O 36
新增和連結 I/O 板但是不進行配置 37
配置已連結的 I/O 38
刪除 I/O 38
目錄 v
取消配置 I/O 板但不中斷連線 38
中斷取消配置的 I/O 板之連線 38
新增/刪除/追蹤記憶體和 CPU 39
配置系統板上的 CPU 39
配置系統板上的記憶體 39
配置系統板上所有的 CPU 和記憶體 39
取消配置系統板上的 CPU 40
取消配置系統板上的記憶體 40
取消配置系統板上所有的 CPU 和記憶體 40
追蹤取消配置記憶體的作業 40
PCI 配接卡作業 41
I/O 板上連結 PCI 插槽 41
配置 I/O 板上的 PCI 插槽 41
中斷 I/O 板的 PCI 插槽連線 42
取消配置 I/O 板上的 PCI 插槽 42
5. SMS DR 程序 從系統控制器 (SC) 執行 (僅限高階)43
顯示裝置資訊 44
顯示裝置資訊 44
顯示平台資訊 46
顯示平台資訊的方法 47
顯示板資訊 47
SC 狀態模型 47 showboards(1M) 指令 48
顯示板資訊的方法 49
新增板 49
新增一個板至一個網域 50
刪除板 50
從網域刪除一個板 51
vi Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
移動板 51
移動板的方法 52
更換作用中的系統板 52
更換作用中系統板的方法 52
SMS DR 指令和選項 53
addboard(1M) 53 deleteboard(1M) 55 moveboard(1M) 56
rcfgadm(1M)指令 57 scdrhelp(1M) 59
showboards(1M) 59 showdevices(1M) 60 showplatform(1M) 60
錯誤訊息說明系統 61
JavaHelp 內容表格 62
JavaHelp 索引 62
JavaHelp 搜尋 62
6. DR 內部 65
網域上的軟體元件 65
網域配置伺服器 (僅適用於高階)65
DR 驅動程式 66
重新配置座標管理員 66
系統事件架構 66
SC 上的軟體元件 (僅適用於高階)67
DR 管理模型 67
DR 程序和常駐程式 67
網域配置代理程式 (DCA) 67
平台配置常駐程式 (PCD) (僅適用於高階)68
目錄 vii
網域 X 伺服器 (DXS) 68
A. DR 指令摘要 69
B. 疑難排解 71
取消配置作業失敗 71
系統板取消配置錯誤 72
無法取消配置記憶體與其他板記憶體交錯的主機板 72
無法取消配置已出現連結程序的 CPU 72
在取消配置所有記憶體前無法取消配置 CPU (僅適用於中階)72
無法取消配置板上有永久記憶體的記憶體 73
無法取消配置 CPU 74
無法中斷板連線 74
I/O 板取消配置失敗 74
裝置忙碌 74
I/O 裝置問題 75
RPC TCP 逾時,或失去連線 76
配置作業失敗 76
記憶體配置錯誤 (僅適用於中階)76
I/O 板配置失敗 76
字彙表 77
索引 79
viii Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
表 1-1 主要 DR 作業 2 表 2-1 板與板插槽狀態 11 表 2-2 配置與取消配置板 11 表 2-3 板狀態僅在 SC 上可看見 12 表 2-4 板與板插槽情況 12 表 2-5 連線元件:配置或取消配置 12 表 2-6 CPU 或記憶體模組情況 13 表 3-1 cfgadm 選項 24 表 3-2 系統板狀況範例圖示 27 表 3-3 診斷程式等級 28 表 5-1 showdevices 輸出範例,CPU 44 表 5-2 showdevices 輸出範例,UltraSPARC IV+ (showdevices -d G)44 表 5-3 showdevices 輸出範例,過程中耗用的記憶體 45 表 5-4 showdevices 輸出範例, IO 裝置 45 表 5-5 Sun Fire 高階系統 SC 上的板狀態 48 表 5-6 addboard 指令選項 53 表 5-7 使用 addboard 指令所需要的特權 54 表 5-8 deleteboard 指令選項 55 表 5-9 使用 deleteboard 指令的特權 55 表 5-10 moveboard 指令選項 56
ix
表 5-11 使用 moveboard 指令所需的特權 57 表 5-12 rcfgadm 指令選項 58 表 5-13 使用 rcfgadm 指令所需的特權 58 表 5-14 showboards 指令選項 59 表 5-15 showdevices 指令選項 60 表 5-16 showplatform 指令選項 60 表 A-1 DR 作業和指令摘要 69
x Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
前言
本文件說明 Sun Fire™ E25K/E20K/15K/12K 系統上的動態重新配置 (DR) 軟體與 Sun Fire E6900/E4900/6800/4810/4800/3800 系統執行 Solaris™ 作業系統 (Solaris OS)
本文件置換以下使用者指南:
Sun Fire 高階系統動態重新配置使用者指南Sun Fire 中階系統動態重新配置使用者指南系統管理服務 (SMS) 動態重新配置使用者指南
在您閱讀本文件之前
本指南適用於熟悉 UNIX® 系統,尤其是熟悉基於 Solaris 作業系統之 Sun Fire 高階與 中階系統平台管理員。如果您對這方面不熟悉,請先閱讀本系統隨附的 Solaris 作業系 統使用者和系統管理員文件資料,並考慮接受 UNIX 系統管理訓練。
使用 UNIX 指令
本文件不包括有關基本 UNIX® 指令及程序的資訊,例如關閉系統、啟動系統及配置裝 置。請參閱以下來源資料以取得相關資訊:
系統隨附的軟體文件資料Solaris 作業系統文件,其位於:http://docs.sun.com
xi
Shell 提示符號
Shell
C shell
C shell 超級使用者 電腦名稱 #
Bourne shell Korn shell
Bourne shell Korn shell 超級使用者
提示
電腦名稱 %
$ #
印刷排版慣例
1
字體
AaBbCc123
AaBbCc123
術語強調變數 新的字彙或術語、要強調的詞。
意義 範例
指令、檔案及目錄的名稱;螢幕畫 面輸出。
您所鍵入的內容 (與螢幕畫面輸出 相區別)。
將用實際的名稱或數值取代的指 令行變數。
請編輯您的 .login 檔案。 請使用 ls -a 列出所有檔案。
% You have mail. %
Password:
這些被稱為類別選項。 您必須是超級使用者才能執行此操作。
要刪除檔案,請鍵入 rm 檔案名稱
su
AaBbCc123
AaBbCc123 用於書名及章節名稱。 Solaris 10 使用者指南」
1 瀏覽器中的設定可能會與這些設定不同。
xii Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
保留未譯的新的字彙或術語、要 強調的詞。
應謹慎使用 On Error 指令。
請參閱第 6 章 「資料管理」。
相關文件
檢視線上列出的文件:
http://www.sun.com/products-n-solutions/hardware/docs/
產品 書名
特定平台文件 Sun Fire 中階系統平台管理手冊」
Sun Fire 高階系統管理手冊」 「系統管理服務 (SMS) 管理指南」 「SMS Reference Manual
「特定平台版本說明」 Solaris 8 or 9 Release Notes Supplement for Sun Hardware
Solaris 10 版本說明」 「系統管理服務 (SMS) 版本說明」
Solaris 指令,包括
cfgadm(1M)
Solaris Command Reference Manual
Sun 功能
文件
支援與訓練
Sun Management
Center
Capacity on Demand
(COD)
Sun Management Center Userís Guide
「系統管理服務 (SMS) 管理指南」
文件、支援與訓練
URL
http://www.sun.com/documentation/ http://www.sun.com/supportraining/
說明
下載 PDF HTML 文件與訂購出版文件
取得技術支援、下載修補程式與得知 Sun 課程
前言 xiii
協力廠商文件
Sun 對於本文件中所提及之協力廠商網站的使用不承擔任何責任。Sun 對於此類網站或 資源中的 (或透過它們所取得的) 任何內容、廣告、產品或其他材料不做背書,也不承 擔任何責任。對於因使用或依靠此類網站或資源中的 (或透過它們所取得的) 任何內容、 產品或服務而造成的或連帶產生的實際或名義上之損壞或損失,Sun 概不負責,也不承 擔任何責任。
Sun 歡迎您提出寶貴意見
Sun 致力於提高文件品質,因此誠心歡迎您提出意見與建議。請至下列網址提出您對本
文件的意見:
http://www.sun.com/hwdocs/feedback
請隨函附上文件書名與文件號碼:
Sun Fire 高階與中階系統動態重新配置使用者指南,文件號碼 819-3190-10
xiv Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
1
DR 之簡介
Sun Fire 高階與中階系統列在前言可分為不同網域,每個功能就如個別的電腦,執行各
自的作業系統 (請參閱第 8 頁「動態系統網域」 )。動態配置 (DR) 功能讓您可在網域仍 在執行時,啟動或停用網域的系統板、I/O 板與特定元件。
部份 DR 是在網域的 Solaris 軟體上執行,且透過 cfgadm(1M) 指令來管理。另一部份 是在系統控制器 (SC) 上執行。
本章涵蓋以下主題:
1 頁「DR Sun Fire 高階與中階系統上」 2 頁「DR 的功能」 3 頁 「如何使用 DR 4 頁 「熱插式硬體」 4 頁 「自動式 DR (ADR) 4 頁 「需求容量 (COD) 5 頁「Solaris 軟體上的 DR
DR Sun Fire 高階與中階系統上
中階系統上的系統板有時稱為 CPU/記憶體板。其與高階系統上的板相同。此文件專用 規定系統板。系統板可在高階與中階平台間互換。
高階系統 I/O 板和中階系統 I/O 組件有相同處也有相異處。此文件中兩個都使用規定 I/O 板,但是在釐清時除外。
在高階系統 I/O 板上的 I/O 匯流排支援 PCI hsPCI+ 卡與 MaxCPU 板。MaxCPU 板可插入插槽 1 而且包含兩個 CPU 但沒有記憶體。
中階系統 I/O 板支援 PCI CompactPCI 卡。
此文件在說明 hsPCI+ CompactPCI 卡時使用通用規定 PCI,只有在釐清需求時不 同。
1
DR 的功能
您可以使用 DR 的作業有:
顯示系統或 I/O 板與某些元件的狀況與狀態可幫這您準備 DR 作業。測試實況板。網域仍在執行時,從網域邏輯分離 (電子絕緣) 系統或 I/O 板,以準備搬移至另一個
網域或是從系統上移除。分離作業有時稱為刪除板動作。
在網域仍在執行時,邏輯附加系統或 I/O 板至網域、增加來源或置換已移除的板。
附加作業有時稱為增加板動作。
在系統板上配置或取消配置 CPU 或記憶體模組以控制網域的電源或容量或是隔離錯
誤的元件。
啟動或停用 PCI 卡或相關之元件與插槽。
例如:您可以 DR 分離錯誤系統板,然後使用系統的熱槽式功能以將其實體移除。在插 入已修理的板或是置換的板,您可以使用 DR 配置板到網域中。如果您使用 DR 功能增 加或移除系統板或元件,DR 永遠都會將板或元件置於已知的配置狀態。請參閱第 11 頁 「狀態與情況」以取得更多關於系統板與元件的配置狀態資訊。
您也可以指定系統板或 I/O 板到不同的網域以載入平衡或提供其他功能給指定作業。
共用 DR 作業簡介
DR 軟體讓您可執行下列作業:
在網域間增加、刪除或搬移系統板或 I/O 板。
在系統板上配置或取消配置 CPU 或記憶體模組。
I/O 板上連接與配置或結束連線與取消配置 PCI 卡。
支援上述動作的 DR 作業的四個主要類型為連線、配置、取消配置與結束連線。
1-1 主要 DR 作業
作業 說明
連線 提供電源至固定板的插槽然後啟動板溫度的系統監視。
配置 使作業系統指定板的功能角色,並針對板以及板的附接裝置載入裝置的驅動
程式。配置作業包含連線作業。
取消配置 從作業系統邏輯分離板,並使相關的裝置驅動程式離線。環境監視功能會繼
續,但系統無法使用板上的裝置。
中斷連線 關閉至插槽的電源,固定板並停止監視板。中斷連線作業包含取消配置作業。
2 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
備註 – 若系統板在使用中,在您關閉電源前,請中止使用並從網域中斷連線。在插入
並開啟全新或升級的系統板之電源後,請利用作業系統連接其附接點 (請參閱第 8
「附接點」 ) 並將其配置使用。如需更多 DR 作業的相關資訊,請參閱第 19 頁 「一般
DR 板作業」。
如何使用 DR
您可以使用下列方法初使化 DR 作業:
使用 Sun™ Management Center 軟體提供的 GUI。詳情請參閱 「Sun
Management Center 使用者指南」。
與適合的選項一同使用 Solaris 指令 cfgadm(1M) 並在網域中標幟。第 31 頁「DR
程序 - 從系統網域」說明如何使用 cfgadm 與其 DR 相關選項,以作業組織。
在高階系統,請在 SC 上使用系統管理服務 (SMS) DR 指令 rcfgadm(1M)
rcfgadm(1M) 可取得相同的 DR 相關選項,如 cfgadm(1M)。主要的不同之處為 rcfgadm(1M) 常要求其他 -d domain_id 參數。詳情請參閱 rcfgadm(1M),參閱第 57 頁「rcfgadm(1M)指令」。
在高階系統,請在 SC 上使用 SMS DR 指令 (rcfgadm(1M) 除外)。SMS DR 指令包
addboard(1M)、moveboard(1M)deleteboard(1M)、) 及其他。您可以在 第 43 頁「SMS DR 程序 從系統控制器 (SC) 執行 (僅限高階)」的 「SMS Reference Manual」找到這些指令的相關指令,或是在執行 SMS 軟體的 SC 視窗執 行 man(1) 指令。
在中階系統執行 DR 時您可能需要執行一個或多個中階系統 SC 指令例如: showplatformshowboards - 在 DR 作業之前或期間。其功用是簡要說明何處適 合此文件,您可以在 「Sun Fire Midrange Systems Controller Command Reference Manual」中找到更多相關資訊。
注意 – 中階系統 SC 指令 addboarddeleteboard 不是高階系統 SMS 指令相同名
稱的 DR 指令。您只有在網域關閉電源時才可以安全使用這些中階系統 SC 指令。如需 更多這些與其他中階系統 SC 指令的相關資訊,請參閱 「Sun Fire Midrange Systems Controller Command Reference Manual」。
1 DR 之簡介 3
熱插式硬體
熱插式裝置可從執行中的系統做邏輯連線或中斷連線。(熱插式裝置可從執行中的系統 做實體連線或中斷連線。) 熱插式板與模組具有特殊的連接器,可在資料腳位建立聯繫 之前,供應電源給板或模組。系統正在運作時,具有熱插式連接器的板及裝置可以插入 或移除,也就是,其為熱交換式。
系統板與 I/O 板為熱插入式裝置。但是,有些裝置,如週邊設備的電源供應器,不是 熱插式模組而且無法在系統運作時中斷連線。
自動式 DR (ADR)
自動式 DR (ADR) 讓您的應用程式在沒有使用者互動下執行 DR 作業。ADR 使用增強 的 DR 架構,其包括重新配置座標管理員 (RCM) 及系統事件功能 (sysevent)。RCM 使應用程式指定可載入模組註冊回呼。回呼可在 DR 作業前執行準備作業、期間可執行 錯誤復原動作,而在之後可清除。系統事件架構可使應用程式為系統事件註冊並接收事 件的通知。
備有 RCM sysevent ADR 介面可使應用程式自動在取消配置前放棄來源,並且 取得配置在網域中的新來源。
應用程式可從網域執行 cfgadm(1M) 指令,其稱為本機 ADR。此外,在高階系統中, 應用程式可從 SC 執行 SMS DR 指令,其稱為全域 ADR。在高階系統您可以使用全域 ADR 從一個網域將系統板搬移至另一個、配置熱交換板至網域中,以及從網域移除系 統板。
需求容量 (COD)
需求容量 (COD) 選項提供您安裝在 Sun Fire 系統的 COD 系統板上其他 CPU 來源。 Sun Fire COD 系統可有兩種標準的組合及安裝的 COD 系統板。系統中每一個網域至 少需要一個使用中的 CPU
您可以使用 DR 搬移 COD 板到網域中或將其搬出網域,以相同方法可以搬移標準系 統板。但是只有在購買使用權利 (RTU) 授權後才能在 COD 板上使用 CPU。每個 COD RTU 授權讓您接收 COD RTU 授權金鑰以啟動單一系統之 COD 板上 CPU 的 指定數目。
4 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
在您使用 DR 配置 COD 板到網域時,請確定有足夠的 RTU 授權至目標網域,以啟動 COD 板上的每個使用中 CPU。如果在您常式增加 COD 板時,目標網域沒有足夠 RTU
授權,系統會顯示狀況訊息表示無法啟動網域中的每個 CPU
如需更多關於高階系統的 COD 選項之相關資訊,請參閱 「系統管理服務 (SMS) 管理 指南」。
Solaris 軟體上的 DR
此文件說明最新的 DR 執行版本,或是與最新的 Solaris 8Solaris 9 Solaris 10 軟體 版本。請確認檢查 http://sunsolve.sun.com 的 SunSolve 修補程式。
備註Sun Microsystems 建議您在系統上執行最新的 Sun 軟體版本,以取得最高效能
及最新強化的優點。
下節說明與指定 Solaris 版本一同使用 DR 的特定考量。
SM
資料庫以取得最新的
網域上的 DR 執行 Solaris 9 作業系統或 Solaris 10 作業系統
Solaris 10 3/05 HW1 作業系統是 Solaris 10 軟體的第一個版本,可支援 UltraSPARC® IV+ 系統板,而 Solaris 9 9/05 作業系統是 Solaris 9 軟體的第一個版本。您可以增加 UltraSPARC IV+ 板至網域與較舊的板一同配置,但是您無法使用 DR 增加所有以 UltraSPARC IV+ 板啟動之較舊的板至網域中。(如果您先關閉網域,您可以增加所有以 UltraSPARC IV+ 板啟動之較舊的板至網域中。)
如需其他關於 Sun Fire 中階系統上之 UltraSPARC IV+ 板的網域限制,請參閱韌體版 本說明 5.19 的「Sun Fire 中階系統平台管理手冊」。
網域中的 DR 執行 Solaris 8 作業系統
Solaris 8 2/02 作業系統是 Solaris 8 軟體的第一個版本可支援 I/O 板的 DR。此外,在 Sun Fire 高階系統的系統管理服務 (SMS) 1.3 SMS 的第一個版本可完全支援 DR。您
可以在網域中安裝修補程式與新的核心更新,以及在高階伺服器系統控制器 (SC) 中安 裝 SMS 軟體的最新版本,以啟動網域中的 DR 的完全功能以執行較 Solaris 8 2/02 作 業系統為早的軟體。Solaris 8 作業系統不支援 UltraSPARC IV+ 板。
1 DR 之簡介 5
6 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
2
DR 概念
本章說明在您嘗試使用 DR 前應瞭解的 DR 概念。
如果您計劃在高階伺服器的系統控制器 (SC) 上執行 DR 作業,請務必閱讀第 5 章、第 43 頁「SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階)」。本章內的某些資訊將會與 第 5 章重複,不過所採用的視角並不相同。閱讀這兩章內容可以對 DR 功能有較透徹的 瞭解。
本章節涵蓋以下主題:
8 頁 「動態系統網域」 8 頁 「附接點」 11 頁 「狀態與情況」 13 頁 「可分離性」 13 頁 「永久和非永久記憶體」 15 頁 「靜止」 16 頁 「安全暫停和非安全暫停裝置」 17 頁「I/O 板上的 DR 19 頁 「一般 DR 板作業」 20 頁「DR 概念圖示」
備註UltraSPARC IV+ 板包括兩個核心 CPU。此文件中 CPU 或處理器的參照可能是
指單一核心或雙核心類型,而且所有程序都可套用在這兩個類型上。
7
動態系統網域
Sun Fire 系統可被劃分為網域。每個網域以指定給網域的系統板插槽為基礎。此外,每 個網域在硬體分割區中有各自的電源,如此當其中一個網域發生錯誤時,才不會影響到 伺服器上的其他網域。
每個網域配置是由常駐在 SC 上的配置資料庫決定的。配置資料庫 - 在高階系統中, 平台配置資料庫 (PCD) - 控制系統板插槽要如何邏輯分割至網域中。網域配置代表預 定的網域配置。因此,網域配置包括空插槽及已插入之插槽。實體網域是由邏輯網域決 定。
提供給網域的可用的插槽數目由 ACL 控制。ACL 是高階系統網域上可用元件清單,或 是中階系統網域存取控制清單的簡稱。所有網域的 ACL SC 上進行維護。在您可以 變更其狀態前,在網域中必須指定插槽或是有可用的插槽。將插槽指定給網域後,在指 定網域上可看到該插槽,但其他網域則無法看見它。反過來說,在您指定並將插槽連線 至另一個網域前,必須先取消指定插槽,並中斷該插槽與原網域的連線。
邏輯網域由數個屬於網域的插槽組成。而實體網域則由數個實體上相互連接的板組成。 插槽即使不是實體網域的一部分,也能成為邏輯網域的成員。啟動網域後,您可以選擇 將主機板及空插槽指定給邏輯網域,或選擇取消指定;然而,直到作業系統的要求下, 才能允許成為實體網域的一部分。未指定給任何網域的系統板或插槽可供所有網域使 用。這些板可由平台管理員指定給網域,但是,ACL 可在 SC 上設定讓有適合權限的 使用者指定可用板到網域中。
附接點
附接點是板或裝置的統稱,也就是固定板或裝置的插槽,以及任何在其中的元件。插槽 有時稱為插座
Sun Fire 系統支援下列附接點:
板附接點 - 系統或 I/O 板插槽、在該插槽中的板以及任何連接到板的裝置。
PCI 附接點 PCI 卡與將其固定到 PCI 匯流排之附接。
元件附接點 CPU 或記憶體模組,以及其與系統板的連接。元件附接點有時稱為
動態附接點
備註 – 許多使用者只注意板及裝置狀況的變更。因此,為求簡要,此文件中某些程序
所指之板附接點則簡稱為板、PCI 附接點則為 PCI 卡,而元件附接點則為 CPU 或記憶 體模組。當簡稱可能引起混淆時,則使用適當的名稱。
8 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
佔取是指板與其附接裝置之組合,包括任何由介面電纜連接的外部儲存裝置。
板插槽可依照插槽編號命名或不命名 (例如在 SCSI 鏈中)
DR 可辨識附接點名稱之類型:
實體附接點 軟體驅動程式及插槽的位置。
邏輯附接點 由系統建立的簡稱,所指的是實體附接點。
要取得所有可用邏輯附接點清單,請使用以下網域中的指令:
# cfgadm -l
附接點類別
Sun Fire 系統支援下列附接點類別。兩個類別 DR 使用者需要知道的是 sbdpci
sbd - 系統板、CPU 與記憶體模組,以及 CPU 和記憶體模組至系統板之連線。另
有,I/O 板、PCI 匯流排及 PCI 匯流排至 I/O 板之連線。
pci PCI 卡,其連接至 PCI 匯流排。
要檢視附接點清單與其相關的板類型,請以超級使用者的身份執行以下指令:
# cfgadm -s -a “cols=ap_id:class”
高階系統附接點
高階系統上實體附接點名稱之範例:
/devices/pseudo/dr@0:SBx (針對插槽 0 中的系統板) /devices/pseudo/dr@0:IOx (針對插槽 1 中的 I/O 板)
0 是節點 0 (零)SB 是系統板、IO I/O 板,而 x 代表板數目或特定板之擴展器
其中 數目。系統板與 I/O 板之數目為 0 17
備註 – 系統板僅在插槽 0 安裝。I/O 板與 Max CPU 板僅安裝在插槽 1 中。
2 DR 概念 9
高階系統之邏輯附接點以下列兩種形式的其中一種呈現:
SBx (針對系統板) IOx (針對 I/O 板或 Max CPU 板)
中階系統附接點
中階系統上實體附接點名稱之範例:
/devices/ssm@0,0:N0.SBx
(針對系統板)
/devices/ssm@0,0:N0.IBx (針對 I/O )
N0 是節點 0 (零)SB 是系統板、IB I/O 板,而 x 為槽編號 (系統板是 0 到 5
其中 而 I/O 板為 6 9)
中階系統上的邏輯附接點以下列兩種形式中的一種形式呈現:
N0.SBx (針對系統板) N0.IBx (針對 I/O )
變更至附接點
您可以使用 cfgadm(1M) 指令變更附接點。您可以:
變更附接點的狀態。特定的 cfgadm(1M) 作業為:
configureunconfigureconnectdisconnect
變更附接點相關板之可用性。特定的 cfgadm(1M) 作業為:
assignunassign
變更附接點板插槽之情況。特定的 cfgadm(1M) 作業為:
poweronpowerofftest
如需更多關於狀態之資訊,請參閱以下章節。如需更多附接點之相關資訊,請參閱 cfgadm(1M) 線上手冊。
10 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
狀態與情況
此節說明板、插槽、元件與附接點之狀態和情況。
狀態可為板插槽或其佔取之作業狀況。 情況是指附接點的作業狀況。
cfgadm(1M) 指令可顯示九種狀態與情狀的類型。如需更多資訊,請參閱第 12 頁「元 件狀態」與第 13 頁 「元件情況」。
備註 – 下列關於板與板插槽之資訊也可套用在 PCI 卡和將其固定之 PCI 匯流排。
板與板插槽狀態
板插槽中沒有板時,其狀態為空缺。插槽中沒有板時,板的狀態可為中斷連線或連線。
2-1 板與板插槽狀態
狀態 說明
empty disconnected
connected
插槽中沒有板。
插槽中的板可從系統匯流排切斷連線。板可不需關閉電源即處於切斷 連線狀態。然而,在將板從插槽移除前須先關閉板電源並切斷連線。 新插入的板是中斷連線的狀態。
啟動插槽中的板電源並連線到系統匯流排。您只能在連線狀態下檢視 板的元件。
注意 – 實體移除在連線狀態,或接上電源及中斷連線狀態中的板,會使作業系統當機,
並會導致系統板永久損壞。
板在連線狀態可為配置或取消配置。板在中斷連線下永遠為取消配置。
2-2 配置與取消配置板
名稱 說明
configured unconfigured
板可以在 Solaris 軟體下使用。
板在 Solaris 軟體下不可使用。
2 DR 概念 11
下列狀態僅在 SC 上可以看見:
2-3 板狀態僅在 SC 上可看見
名稱 說明
Available Assigned
Active
插槽,其中可能有或沒有板,且沒有指定到任何特定網域。
插槽,其中可能有包含或沒有包含板,其屬於網域,但是未配置硬體 使用它。
指定給插槽中的板之網域正在使用板。您無法重新指定作用中的板。
板情況
板的情況會是以下三種狀況之一:未知、正常或錯誤。插槽可能指定為無法使用。
2-4 板與板插槽情況
名稱 說明
unknown ok failed unusable
板未受測試。
板可作業。
板未通過測試。
板插槽無法使用。
元件狀態
和板不同,CPU 或記憶體模組不可以個別連線或中斷連線。因此,所有此類元件都在 連線狀態。
連線元件可為配置或取消配置。
2-5 連線元件:配置或取消配置
名稱 說明
configured unconfigured
12 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
元件可以在 Solaris 作業系統下使用。
元件不可以在 Solaris 作業系統下使用。
元件情況
CPU 或記憶體模組為未知、正常或錯誤。
2-6 CPU 或記憶體模組情況
名稱 說明
unknown ok failed
元件未受測試。
元件可作業。
元件未通過測試。
可分離性
可分離裝置要符合下列要項:
裝置必須支援 DDI_DETACH重要資源必須具有備援,或可透過替代路徑存取。CPU 與記憶體組可以是備援的重
要資源。例如,磁碟機就是重要資源的一種,可以透過替代路徑存取。
某些板無法分離,因為無法移動這些板的資源。例如,若網域只有一個 CPU 板,則無 法分離該 CPU 板。如果 I/O 板控制啟動磁碟機,則為不可分離。
如果 I/O 板沒有替代路徑,您可以執行下列項目:
將磁碟鏈置於分離的 I/O 板上。接著即可分離第二個 I/O 板。 透過第二個 I/O 板將第二個路徑加入裝置,以使 I/O 板分離,而不會失去第二個磁
碟鏈的存取功能。
備註 – 如果您不確定裝置是否為可分離,請連絡您的 Sun 服務代表。
永久和非永久記憶體
在刪除板之前,作業系統須先空出板上的記憶體。空出板是指將其非永久記憶體的內容 刷新至交換空間,並複製其永久記憶體的內容 (也就是核心和 OpenBoot™ PROM 軟體) 到另一個記憶體板上。
欲重置永久記憶體,網域上的作業系統需暫時靜止。靜止的時間長短取決於網域 I/O 配置和執行的工作量。
2 DR 概念 13
欲使用永久記憶體來分離板只能在作業系統靜止時進行。因此,您應該清楚永久記憶 體的常駐位置,以免嚴重影響到網域的作業。若要顯示永久記憶體的大小,請使用 cfgadm(1M) 指令及其 -av 選項。若要空出具有永久記憶體的板,作業系統必須找出 相當大區塊的可用記憶體 (即目標記憶體),以複製永久記憶體的目前內容 (即來源記 憶體)。
複製重新命名
使用者程序可將其分頁至交換裝置以釋放記憶體。但是 Solaris 核心常駐在永久記憶體 中,所以無法釋放。反而,cfgadm 會使用複製重新命名技術來釋放記憶體。在作業系 統辨別適合的目標板後其有足夠記憶體可容納搬移的永久記憶體 - DR 軟體會執行 以下步驟:
1. 將記憶體分頁至交換以空出目標板上的記憶體。
2. 靜止作業系統。
3. 從來源版複製內容 (永久記憶體) 至目標板。此為分割區的複製部份。
4. 重新編排硬體程式至來源與目標板之交換記憶體位址範圍。此為分割區的重新命名
部份。
5. 從作業系統靜止的狀態中將其釋放。
記憶體交錯
如果系統記憶體與多個系統板交錯,系統板則無法動態重新配置。不論記憶體是否交 錯,PCI 卡與 I/O 板都可動態重新配置。
如需更多關於高階系統中記憶體交錯之資訊,請參閱 「Sun Fire 高階系統管理手冊」。 關於中階系統,請參閱 setupdomain 指令的 interleave-scope 參數;該指令在
Sun Fire Midrange Systems Platform Administration Manual 和「Sun Fire
Midrange System Controller Command Reference Manual」。
可修改之記憶體錯誤
可修改之記憶體錯誤是指系統板上的記憶體 - 其為一個或多個雙排記憶體模組 (DIMM),或硬體互連之分割區 - 可能有錯誤且須置換。當 SC 偵測到可修正之記憶體 錯誤時,會啟動一個記錄停止傾印作業,以儲存診斷資料,這個操作會影響 DR 作業。
在因為可修正之記憶體錯誤而發生記錄停止時,可在啟動 DR 作業前完成記錄停止傾 印。
14 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
如果錯誤元件引起可修改記憶體錯誤之重覆報告,SC 會執行多重記錄停止傾印。如果 發生此情況,您應該暫時停用 SC 上的傾印偵測機器,讓目前的傾印完成,然後初始化 DR 作業。在完成 DR 作業後,請重新啟動傾印偵測。
靜止
在取消配置有永久記憶體 (OpenBoot™ PROM 或核心記憶體) 之系統板上的作業時, 作業系統會短暫中止,這種狀況稱為作業系統靜止。在此重要的作業階段中,網域上所 有作業系統及裝置活動必須暫停幾秒鐘。
要判定板是否具有永久記憶體的快速方法可使用下列指令:
# cfgadm -av | grep permanent
系統會回應下列輸出,說明中接系統上的系統板 0 (零):
N0.SB0::memory connected configured ok base address 0x0, 4194304 KBytes total, 668072 KBytes permanent
若作業系統無法達到靜止狀態,該環境會顯示無法靜止的原因,其中可能的原因如下:
執行緒無法暫停。 作業系統無法暫停現有的裝置。
備註 – 即時程序不會防礙靜止程序的執行。
導致程序暫停失敗的情況,一般是暫時的現象。請檢查任何錯誤的起因,如果作業系統 面臨錯誤而中止程序,請再次嘗試作業。
在靜止期間,系統會停止不動並且不會回應外在事件,如網路封包。靜止的持續時間視 下列兩個因素而定:需要停止多少 I/O 裝置和執行緒;需要複製多少記憶體。通常 I/O 裝置的數量會決定所需的靜止時間,因為 I/O 裝置必須暫停和取消暫停。靜止狀 態通常會持續超過兩分鐘。
因為靜止具有顯著的影響,cfgadm 會先請求確認再實行靜止。若您輸入:
# cfgadm -c unconfigure N0.SB0
2 DR 概念 15
系統會回應下列提示以供確認:
System may be temporarily suspended, proceed (yes/no)?
如果您使用 Sun Management Center 來執行 DR 作業,快顯視窗則會顯示此提示:
輸入 「Yes」確認靜止的影響是可接受的,然後繼續進行。
安全暫停和非安全暫停裝置
DR 暫停作業系統時,附接到作業系統的裝置驅動程式也必須暫停。若驅動程式無法 暫停 (或接著恢復),DR 作業就會失敗。
當作業系統處於靜止狀態時,安全暫停裝置不會存取記憶體或中斷系統。若驅動程式支 援作業系統的靜止 (如果可以暫停然後恢復) 功能,此驅動程式即可視為具有安全暫停 的功能。此可安全暫停的驅動程式亦可保證:當暫停請求順利完成時,驅動程式所管理 的裝置不會嘗試存取記憶體;即使在做出暫停請求時,該裝置為開啟狀態,它也不會嘗 試存取記憶體。
當作業系統處於靜止狀態時,非安全暫停裝置具有記憶體存取或系統中斷的功能。 在高階系統上,DR 在 dr.conf 檔案中使用不安全的驅動程式清單以避免從記憶體存
取不安全的裝置或是在 DR 作業期間中斷作業系統。dr.conf 檔案常駐在下列目錄 中:/platform/SUNW,Sun-Fire-model_number/kernel/drv/,其中 model_number 為機器名稱,例如:15000。不安全的驅動程式清單是 dr.conf 檔案 之特性,其格式如下:
unsupported-io-drivers=”driver1”,”driver2”,”driver3”;
DR 會在準備暫停作業系統時讀取此清單,則可以取消配置記憶體元件。如果 DR 在不 安全的驅動程式清單中發現使用中的驅動程式,其會中斷 DR 作業並傳回錯誤訊息。訊 息包括使用中、不安全的驅動程式之辨識。您必須手動移除裝置之使用,請執行下列一 個或多個作業:
停止使用裝置之程序。使用 modunload(1M) 指令以卸載驅動程式。中斷電纜連線 (其依據裝置之類型)
在您停止裝置之使用後,您可以重新嘗試 DR 作業。
16 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
備註 – 如果您不確定裝置是否為可安全中止,請連絡您的 Sun 服務代表。
I/O 板上的 DR
當您新增或移除具有 I/O 裝置板時必須格外小心。在您移除具有 I/O 裝置的板時,板 上所有的裝置都必須關閉,其所有的檔案系統也都必須卸載。
如果您需要從網域暫時移除具有 I/O 裝置的板,然後在新增任何具有 I/O 裝置的板前 把它重新加入的話,就不需要執行重新配置。在此清況下,連接板裝置的裝置路徑維持 不變。但是如果您在移除第一個具有 I/O 裝置之板後要增加另一個,然後再增加第一 個板,請重新配置因為到第一個板的裝置路徑已變更。
備註嘗試在網域的 I/O 板上執行 DR 作業前,請確認到網域至少有兩個可使用的
CPU。此外,請確認其中至少一個 CPU 是位於系統板上,而且沒有連結程序。請參閱
pbind(1M) 線上手冊以了解更多有關板的程序。
高階系統 I/O 板、Golden IOSRAMMaxCPU
hsPCI+
每個高階系統網域上的 I/O 板包含 IOSRAM 裝置。但是,只有一個 IOSRAM 裝置, 是稱為 golden IOSRAM,是使用在 SC 到網域通訊。golden IOSRAM 包含 「通道」, 其使用在 SC 到網域通訊。因為 DR 可移除 I/O 板,其有時需要停止使用目前的 golden IOSRAM 讓另一個 IOSRAM 裝置成為 golden IOSRAM。此程序稱為 「通道 交換」,其發生在 DR 取消配置目前的 golden IOSRAM。啟動網域時,網域中編碼最 小的 I/O 板通常會被選取為初始 golden IOSRAM。
DR 支援在高階系統 I/O 板上的 I/O 匯流排以及 PCI MaxCPU 板。DR 也支援 hsPCI+ 卡的動態重新配置。每個 hsPCI+ 卡都包含兩個 XMITS ASIC 以及四個熱插式 hsPCI+ 插槽。
中階系統 I/O 組件、PCI CompactPCI
在 Sun Fire 中階系統上,DR 不支援 SAI/P (錯誤 ID 4466378) 或 HIPPI/P。先前的發 行版本不支援 SunHSI/P 驅動程式,但阻止支援的錯誤 4496362 已於 106922 (2.0) 和 109715 (3.0) 修補程式中修復。欲了解更多,請參閱 SunSolve 以及 devfsadm(1M) 線 上手冊。
2 DR 概念 17
備註 – 您不可以使用 DR 連接和配置作業將 I/O 板增加至配有一個或多個
UltraSPARC IV+ 系統板之單一分割區中階系統的上的網域。此限制是由於可測試的 I/O 板上其第二個網域不存在。但是,您可以在此說明系統的 I/O 板上使用 DR 取消
配置及中斷連線指令。詳情請參閱第 27 頁「測試板」和韌體版本說明 5.19.0 的「Sun Fire 中階系統平台管理手冊」。
CompactPCI 之說明
下列限制適用於包含 CompactPCI 組件的重新配置:
只有在板中的所有卡都已處於取消配置的狀態時,您才可以取消配置 CompactPCI
I/O 組件。如果有任何 CompactPCI 卡為忙碌狀態 (例如已探測/使用中的介面或已
掛載的磁碟),板取消配置作業會失敗並顯示 「busy」 (忙碌) 狀態。應先取消配置所 有的 CompactPCI 卡,再嘗試取消配置 CompactPCI I/O 組件。
當多重路徑磁碟已連接至兩個 CompactPCI 卡時,可能會在未預期情形下看見卡的
磁碟活動。基於此原因,請確定資源的本機端沒有活動。這種情形較有可能在顯示 為忙碌狀態的 CompactPCI 卡上試圖執行 DR 作業時,甚至在資源的本機端沒有活 動時發生。可能需要循序 DR 嘗試。
當使用者使用 cfgadm(1M) 指令及 -a 選項列出 CompactPCI 板的附接點時,
CompactPCI 插槽和 PCI 匯流排都會被列示為附接點。cfgadm -a 指令會將 PCI
匯流排的附接點顯示為 N0.IB8::pci0。每個 CompactPCI 卡都有四個這類的附接 點。使用者不應在這些點,或在 sghsc 附接點執行 DR 作業 (其中 cfgadm -a 指 令會顯示為 N0.IB8::sghsc4),因為 DR 實際上不會執行,而且會移除某些內部 資源。十分不鼓勵您在這些附接點 (bussghsc) 使用 DR。
為了讓 DR CompactPCI 卡運作正常,在 Solaris 作業系統啟動時間插入
CompactPCI 卡的所有導桿必須完全地被佔用。
取消配置 CompactPCI 卡也會自動將其取消連接。若已啟用自動配置,連接 CompactPCI 卡也會將其配置。若已停用自動配置,您必須手動執行配置。
18 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
一般 DR 板作業
連接作業
在板連接作業期間,如果插槽系統板可使用且不是任何邏輯網域的一部份,DR 會嘗試 指定板插槽至網域中。在指定插槽後,DR 會請求 SC 開啟電源並測試板。在測試板之 後,DR 會請求 SC 連接板的電源至系統,其使板成為實體網域的一部份。作業系統會 測試板上的元件。
備註 – 如果 cfgadm(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀態。如
果錯誤可以修復,您可以重新執行該指令。如果錯誤無法修復,您必須重新啟動網域才 能使用板。
插入板之前的附接點狀態與情況為:
插座狀態 空缺佔取狀態 取消配置情況 未知
實體插入板後,狀態與情況為:
插座狀態 中斷連線佔取狀態 取消配置情況 未知
邏輯連接附接點之後,狀態與情況為:
插座狀態 連線佔取狀態 取消配置情況 正常
配置作業
配置作業期間,如果板插槽狀態為中斷連線,DR 會嘗試連接板插槽。其會跨越在連接 作業期間建立的裝置樹狀結構。(DR 建立 Solaris 作業系統裝置樹狀節點然後附接裝置 驅動程式 (如果需要)。)
2 DR 概念 19
CPU 增加至 CPU 清單,且初始化記憶體然後增加至系統記憶體儲存池。成功完成配置 功能後,CPU 與記憶體已準備就緒可使用。
至於 I/O 裝置,請在裝置可使用前先使用 mount(1M) 與 ifconfig(1M) 指令。
當您使用 cfgadm 配置板至網域時,其板會自動連及配置。
中斷連線作業
中斷連線作業期間,DR 架構與 SC 至程式之通訊會互連,所以系統板可從實體網域移 除。其會嘗試執行與取消配置作業相關之作業。
板可在不關閉電源下呈現中斷連線狀態。然而,在將板從插槽移除前須先關閉板電源並 中斷連線。
實體插入板前,狀態與情況為:
插座狀態 連線佔取狀態 配置情況 正常
實體插入板後,狀態與情況為:
插座狀態 中斷連線佔取狀態 取消配置情況 未知
取消配置作業
依據永久記憶體之身份認證,取消配置作業可由單一作業或兩個分開的作業所構成。如 果系統板內存在永久記憶體,則在取消配置作業 DR 之前,先將記憶體內容從指定板移 動至網域中目標板上的可用記憶體。請參閱第 13 頁 「永久和非永久記憶體」以取得更 多關於板為永久記憶體的資訊。
DR 概念圖示
DR 可讓您不關閉系統電路就切斷並回復系統板連線。當系統持續作業時,您可以使用 DR 增加或移除系統資源。
下列範例是從 Sun Fire 高階系統而來,但是基本概念也可套用在中階系統中。
20 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
備註 – Sun Fire E25K Sun Fire 15K 系統可同時支援最多 18 個系統板與 18 I/O
板,其編號為 0 17
網域 A 包括系統板 0 2,以及 I/O 2。網域 B 包括系統板 1 3,以及 I/O 1、 3 4
2-1 重新配置前的網域 A B
要指定系統板 4 I/O 0 至網域 A,以及從網域 B 搬移 I/O 4 至網域 A,您可以 使用 Sun Management Center 軟體的 GUI。或是您可以在每個網域使用 cfgadm(1M)
1. 在網域 B 中使用以下指令中斷 I/O 4 之連線。
# cfgadm -c disconnect -o nopoweroff,unassign IO4
2. 在網域 A 中使用下列指令以指定、連接與配置系統板 4 和 I/O 0 4 到網域 A
# cfgadm -c configure SB4 IO0 IO4
2 DR 概念 21
下列的系統配置就是結果。系統板唯一的連線方式已經改變,並非機櫃內系統板的實體 佈局有所改變。
2-2 重新配置後的網域 A B
22 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
3
準備使用 DR
要成功執行 DR,您必須了解本章以及第一章和第二章所包含的資訊和部份程序。
注意 – 不適當的執行 DR 作業會導致 DR 錯誤,在某些情況下,會損壞系統元件。
本章涵蓋以下主題:
23 頁「cfgadm(1M) 指令」 25 頁「rcfgadm(1M) 指令 (僅適用於高階) 25 頁 「檢查裝置類型、狀態和情況」 26 頁 「準備在網域裡使用 DR 26 頁 「顯示系統板狀況」 27 頁 「測試板」
cfgadm(1M) 指令
cfgadm(1M) 指令可在網域執行 DR 作業。DR 作業會傳至 libcfgadm(3LIB) 程式庫
介面,動態載入指定硬體程式庫的外掛程式來實際執行 DR 作業。
備註 – 如果 cfgadm(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀態。如
果錯誤可以修復,您可以重新執行該指令。如果錯誤無法修復,您必須重新啟動網域才 能使用板。
sbd.so.1 指定硬體外掛程式提供以下的 DR 功能:對系統板進行連線、配置、取消配 置和中斷連線,可讓您不必重新啟動系統,而從執行中的系統連線或中斷連線系統板。
駐在 /usr/sbin 目錄的 cfgadm(1M) 指令。(請參閱 cfgadm(1M) 線上手冊以取得更 多資訊。)
23
每一個板插槽都是裝置樹上的單一附接點。您可以使用 cfgadm(1M) 指令以及其 -a 選 項,檢視每個元件的類型、狀態和情況以及每個板插槽的狀態和情況。
以下的選項和運算元可用來支援其所標明的功能其中 ap_id 是指系統板或元件的附接 點。
3-1 cfgadm 選項
選項與運算元 說明
-c connect ap_id
-c disconnect ap_id
-c configure ap_id
-c unconfigure ap_id
-x assign ap_id
-x unassign ap_id
-x poweron ap_id
-x poweroff ap_id
-l ap_id
-h [ap_id]
-v
-n
-y
-s listing_options
-o hardware_options
-t ap_id
變更插頭狀態為已連線。
變更插頭狀態為中斷連線。
變更佔取狀態為已配置。
變更佔取狀態為取消配置。
變更佔取狀態為已指定。
變更佔取狀態為未指定。
變更佔取狀態為電源啟動。
變更佔取狀態為電源關閉。
顯示系統板和元件的狀態、狀況和情況。
列印說明訊息文字。如果已指定 ap_id,引數所指明的附 接點將呼叫指定硬體程式庫中的說明常式。
以詳細模式執行。
自動以 「No」回應所有提示而且不顯示。
自動以 「Ye s」回應所有提示而且不顯示。 附接點的狀態根據 listing_options 顯示。為 -l) 旗標提
供清單選項。listing_options 引數與 getsubopt(3C) 線 上手冊的語法慣例相符,且指定:
附接點選取標準 (例如:select=select_string)相符之類型 (例如:match=match_type)排列順序 (例如:sort=field_spec)資料顯示 (例如:cols=field_spec cols2=
field_spec)
欄位分隔符 (例如:delim=string)欄位標題壓縮 (例如:noheadings)
為主要指令選項提供指定硬體的選項。hardware_options 字串的格式和內容完全以硬體指定,該字串符合 getsubopt(3C) 線上手冊之語法慣例。
執行一個或多個附接點之測試。測試功能可用在重新評 估附接點的情況。沒有 hardware_options 中之測試層級 的指定元,可使用能最快測試硬體錯誤的方式。
24 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
rcfgadm(1M) 指令 (僅適用於高階)
SMS 指令 rcfgadm(1M) SC 上執行,並且使用與 cfgadm(1M) 一樣的選項和運算
元,不過通常需要再增加一個 -d domain_id 選項。請參閱第 57 頁「rcfgadm(1M)指 令」。
檢查裝置類型、狀態和情況
在嘗試於網域的系統板或元件上執行任何 DR 作業前,您必須確認其狀態和情況。
顯示狀態、類型和情況
l 使用 cfgadm(1M) 指令,配合 -la 選項。
# cfgadm -la
顯示有關板插槽和元件的資訊
l 使用 prtdiag(1M) 指令。
# prtdiag
prtdiag(1M) 指令顯示板號碼。
3 章 準備使用 DR 25
準備在網域裡使用 DR
若這是網域啟動之後,您第一次執行 DR 作業,請在執行前確定網域的板可用。
顯示網域裡可用的板
l 使用 cfgadm(1M) 指令,配合其 -l 選項。
# cfgadm -l
高階系統的每一個網域皆維護一份可用元件清單。中階系統的網域則是維護存取控取清 單。兩種清單皆指為 ACL
在以下任何一種板上嘗試執行 DR 作業,都會出現錯誤:
未列在網域 ACL 清單上而且未指定至網域的板。已列於網域 ACL,但是被指定至另一個網域。
上述任一情形,板均不適用於網域。 如需更多關於在高階系統上如何檢視可用元件清單 的資訊,請參閱 「系統管理服務 (SMS) 使用者指南」。如需更多關於中階系統的 ACL 之資訊,請參閱 「Sun Fire 中階系統平台管理者手冊」。
顯示系統板狀況
顯示系統板狀況
l 使用cfgadm(1M) 指令。
# cfgadm -a -s “select=class(sbd)”
cfgadm(1M) 指令顯示關於已指定至網域的板,或是出現在 ACL 卻未被指定至其他網
域的板之資訊。-a 選項要求指令列出所有已知的附接點,包括板插槽、SCSI 匯流排和 PCI 插槽。
26 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
下列顯示中階系統網域的典型輸出。
3-2 系統板狀況範例圖示
Ap_Id
N0.IB6 PCI_I/O_Boa connected configured ok N0.IB7 PCI_I/O_Boa connected configured ok N0.IB8 PCI_I/O_Boa connected configured ok N0.IB9 PCI_I/O_Boa disconnected unconfigured unknown N0.SB0 CPU_Board connected configured unknown N0.SB1 CPU_Board disconnected unconfigured failed N0.SB2 CPU_Board connected configured ok N0.SB3 unknown empty configured unknown N0.SB4 unknown empty configured unknown N0.SB5 unknown empty configured unknown
類型 插座 插卡 狀況
若要顯示更多詳細的資訊,可增加 -v 選項至 cfgadm(1M)。
測試板
測試系統板
l 使用 cfgadm(1M) 指令以及其 -t 選項。
# cfgadm -t ap_id
其中 ap_id 是附接點識別碼。
l 使用 cfgadm(1M) 指令以及其 -t-o 選項來進行指定診斷等級之測試 (僅適用於中
階系統)。
# cfgadm -o platform=diag=<level> -t ap_id
其中 level 是指診斷程式等級,而 ap_id 是指附接點識別碼。
3 章 準備使用 DR 27
若您不指定中階系統之等級,setupdomain 指令將設定預設的診斷等級,如 「Sun Fire 中階系統平台管理手冊」及 「Sun Fire 中階系統控制器指令參考手冊」所述。各
個診斷程式等級如下所示:
3-3 診斷程式等級
診斷程式等級 說明
初級 執行但不測試系統板初始化代碼,以快速通過開機自我測試 (POST)
快速 測試所有系統板元件,但測試內容及測試模式較少。
預設或最大 以所有測試內容及測試模式來測試所有系統板元件,記憶體和 Ecache
組除外。
mem1
mem2
在預設的等級執行所有的測試,加上更完整的 DRAM SRAM 測試演算 法。針對記憶體與 Ecache 模組,皆會以多重測試模式測試所有的位置。 此等級不會執行更詳細的、更耗時的演算法。
執行 mem1 等級的所有測試,加上一項 DRAM 測試以進行 DRAM 資料 的精確比較。
測試 I/O (僅適用於中階系統)
備註您不可以使用 DR 連接和配置作業將 I/O 板增加至配有一個或多個
UltraSPARC IV+ 系統板之單一分割區中階系統的上的網域。此限制是由於可測試的 I/O 板上其第二個網域不存在。但是,您可以在此說明系統的 I/O 板上使用 DR 取消
配置及中斷連線指令。詳情請參閱韌體版本說明 5.19.0 的「Sun Fire 中階系統平台管 理手冊」。
在此程序中,網域 A 是目前作用中的網域,而網域 B 是備用網域。
1. 進入備用網域 (B) 的網域 shell
2. 同時按住 「CTRL」鍵與 「 ] 」鍵叫出 telnet> 提示符號。
3. telnet> 提示符號下,鍵入 send break 以顯示系統控制器的網域 shell
4. 在備用網域 (B) shell之下,新增 I/O 組件至網域。
schostname
:B> addboard IBx
其中 x 678 9
28 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
5. 請將備用網域中的虛擬主開關設定為開啟。
schostname:B> setkeyswitch on
. .
{x} ok
x 代表 CPU。當您將虛擬主開關設定為開啟時,網域上會執行開機自我測試
其中 (POST)。若您看見
ok 提示,I/O 板或 I/O 組件均已正確運作。
6. 將模式設定為待命。
schostname:B> setkeyswitch standby
7. 刪除板。
schostname:B> deleteboard ibx
8. 新增板至作用的網域 (A)
# cfgadm -c configure N0.IBx
為 DR 準備一張 I/O (僅適用於高階系統)
在您嘗試在高階系統網域的 I/O 板上執行 DR 作業以前,請確認以下條件均正確:
網域裡至少有兩個可用的 CPU兩個 CPU 至少要有一個裝在系統板上。CPU 並未負責任何必要程序。
請參閱 pbind(1M) 線上手冊以了解更多的必要程序。
當您使用 DR 將 I/O 板配置至網域 (或用 cfgadm(1M) 指令及其 -t 選項來測試 I/O 板) 的時候,被選取來測試板的 CPU 將是同網域裡的已插在系統板上之 CPU。接下 來,該 CPU 不能有必要執行的程序,至少要有一個額外 CPU 在本網域留用。若無可 用 CPU 以執行測試,將會顯示一項訊息,如下所示:
WARNING: No CPU available for I/O cage test
3 章 準備使用 DR 29
CPU 從網域取消配置,並已測試 I/O 板。完成測試之後,CPU 又會再配置至網域。 重新配置 CPU 之後,用 psrinfo(1M) 指令所顯示的時間戳記,與網域裡的其他 CPU 不相同。
30 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
4
DR 程序 - 從系統網域
本章說明在高階和中階的系統上執行 Sun Fire 系統網域 DR 功能之程序。程序若僅適 用於其中一種平台,本文將予以明顯標記。系統板I/O 兩詞同時適用於兩種平台。
注意 – 在您嘗試在板或元件上執行任何 DR 作業前,請參閱第 25 頁 「檢查裝置類型、
狀態和情況」的說明,決定其狀態及情況。
你必須先了解第 12 和第 3 章的內容以後,才能執行此節內的任何一項程序。
你必須是超級使用者才能在網域裡執行 DR
備註 – 您所看到的 SBxIOx,其 x 代表了板的 id 編號。
本章節涵蓋以下主題:
31 頁 「增加系統板」 33 頁 「刪除系統板」 35 頁 「搬移系統板」 36 頁 「新增 I/O 板」 39 頁 「新增/刪除/追蹤記憶體和 CPU 41 頁「PCI 配接卡作業」
增加系統板
要增加系統板至網域,先指定板至網域中,或者板必須在 ACL 清單上,ACL 是高階系 統網域上的可用元件清單,以及中階系統網域上的存取控制清單之簡稱。
如需關於高階系統 ACL 的相關資訊,請參閱 「系統管理服務 (SMS) 管理者指南」。如 需關於中階系統 ACL 之相關資訊,請參閱 「Sun Fire 中階系統平台管理手冊」。
31
新增系統板
1. 請驗證選取的板插槽可接受板。
# cfgadm -a -s “select=class(sbd)”
狀態和情況為:
插座狀態 空缺佔取狀態 取消配置情況 未知
插座狀態 中斷連線佔取狀態 取消配置情況 未知
2. 增加板至插槽,然後連結和配置該板。
# cfgadm -v -c configure SBx
系統測試板時,會有短暫延遲,而網域主控台記錄會顯示訊息,表示元件已配置。已連 結和配置附接點之狀態和情況應為:
插座狀態 連線佔取狀態 配置情況 正常
現在系統可以偵測板上的可用裝置以及其他可用裝置。
備註 – 如果 cfgadm(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀態。如
果錯誤可以修復,您可以重新執行該指令。如果錯誤無法修復,您必須重新啟動網域才 能使用板。
連結系統板但不進行配置
1. 請驗證選取的板插槽可接受板。
# cfgadm -a -s “select=class(sbd)”
狀態和情況為:
32 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
插座狀態 空缺佔取狀態 取消配置情況 未知
插座狀態 中斷連線佔取狀態 取消配置情況 未知
2. 連接板。
# cfgadm -v -c connect SBx
配置已連線的系統板
l 配置已連線的板。
# cfgadm -c configure SBx
上述的 x 代表板的數量。
刪除系統板
刪除系統板
l 取消配置和中斷連線板。
# cfgadm -c disconnect SBx
第 4 章 DR 程序 - 從系統網域 33
取消系統板之配置但不中斷連線
l 取消板的配置。
# cfgadm -c unconfigure SBx
刪除未配置之系統板
l 中斷板的連線。
# cfgadm -c disconnect SBx
暫時刪除系統板
例如,板錯誤且沒有可用的可置換之板或系統板填充面板,則可使用此程序關閉板的電 源,而不用移除板。
1. 為板辨別附接點 ID
# cfgadm -l -s "select=class(sbd)"
2. 拔除板並關閉其電源。
# cfgadm -c disconnect ap_id
上述的 ap_id 是步驟 1 之指令傳回的附接點 ID
尋找含有網域永久記憶體之系統板
l 辨別含有永久記憶體的板。
# cfgadm -val | grep permanent
34 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
取消配置含有永久記憶體的系統板
1. 辨別含有永久記憶體的板。
# cfgadm -val | grep permanent
2. 取消配置含有永久記憶體的板。
# cfgadm -c unconfigure -y SB0
備註在此處使用 -y 選項無法防止暫停。
搬移系統板
在網域之間搬移系統板
1. 辨識要移除的板的插槽編號。
# cfgadm -l -s "select=class(sbd)"
2. 取消配置板但是不要關閉電源以保留測試狀況:
# cfgadm -o unassign,nopoweroff -c disconnect
上述的 ap_id 是步驟 1 傳回的附接點 ID
該點的插槽並未指定給任何網域,而且所有網域都可以看見該插槽。
3. 在您要移動板的網域中,查看所見的該板狀態是否為中斷連線。
# cfgadm -al -s “select=class(sbd)”
ap_id
第 4 章 DR 程序 - 從系統網域 35
備註 – 如果在新網域中無法看見板,問題可能與 ACL 相關,因為此程序是指定作業。
如需關於高階系統網域之可用元件清單的資訊,請參閱 「系統管理服務 (SMS) 管理者 指南」。如需關於中階系統網域上的 ACL 之資訊,請參閱 「Sun Fire 中階系統平台管 理手冊」。
4. 配置新網域的板。
# cfgadm -c configure ap_id
新增 I/O
新增 I/O
1. 請驗證選取的板插槽可接受板。
# cfgadm -a -s “select=class(sbd)”
狀態和情況為:
插座狀態 空缺佔取狀態 取消配置情況 未知
插座狀態 中斷連線佔取狀態 取消配置情況 未知
2. 新增板至插槽。
3. 若是中階系統,請測試 I/O 板;若是高階系統,請直接前進至下一步驟。
如果您是在中階系統新增板,請參閱第 28 頁 「測試 I/O 板 (僅適用於中階系統)」。
36 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
4. 連結並配置板。
# cfgadm -v -c configure IOx
系統測試板時,會有短暫延遲,而網域主控台記錄會顯示訊息,表示元件已配置。已連 結和配置附接點之狀態和情況應為:
插座狀態 連線佔取狀態 配置情況 正常
現在系統可以偵測板上的可用裝置以及其他可用裝置。
備註 – 如果 cfgadm(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀態。如
果錯誤可以修復,您可以重新執行該指令。如果錯誤無法修復,您必須重新啟動網域才 能使用板。
新增和連結 I/O 板但是不進行配置
1. 請驗證選取的板插槽可接受板。
# cfgadm -a -s “select=class(sbd)”
狀態和情況為:
插座狀態 空缺佔取狀態 取消配置情況 未知
插座狀態 中斷連線佔取狀態 取消配置情況 未知
2. 新增板至插槽。
3. 若是中階系統,請測試 I/O 板;若是高階系統,請直接前進至下一步驟。
如果您新增板至中階系統,請參閱第 28 頁 「測試 I/O 板 (僅適用於中階系統)」。
4. 連結板。
# cfgadm -v -c connect IOx
第 4 章 DR 程序 - 從系統網域 37
配置已連結的 I/O
l 配置已連結的 I/O 板。
# cfgadm -c configure IOx
刪除 I/O
l 取消配置和中斷連線 I/O 板。
# cfgadm -c disconnect IOx
取消配置 I/O 板但不中斷連線
l 不中斷連線但取消配置 I/O 板。
# cfgadm -c unconfigure IOx
中斷取消配置的 I/O 板之連線
l 中斷取消配置 I/O 板之連線。
# cfgadm -c disconnect IOx
38 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
新增/刪除/追蹤記憶體和 CPU
備註 – 以下程序可套用於單核心和雙核心的 CPU
配置系統板上的 CPU
l 配置 CPU
# cfgadm -c configure SBx::cpuy
上述的 x 代表板的號碼,而 y 代表 CPU 之編號,Sun Fire 高階和中階系統的 CPU 編 號為 1 至 3。
配置系統板上的記憶體
l 配置記憶體。
# cfgadm -c configure SBx::memory
上述的 x 代表板之編號。對於記憶體,指令可套用於系統板上的所有記憶體
配置系統板上所有的 CPU 和記憶體
l 配置板上所有的 CPU 和記憶體。
# cfgadm -c configure SBx
第 4 章 DR 程序 - 從系統網域 39
取消配置系統板上的 CPU
l 取消配置 CPU
# cfgadm -c unconfigure SBx::cpuy
上述的 x 代表板之編號,而 y 代表 CPU 號碼,Sun Fire 高階和低階系統的 CPU 編號 為 1 至 3。
取消配置系統板上的記憶體
l 配置記憶體。
# cfgadm -c unconfigure SBx::memory
上述的 x 代表板之編號。對於記憶體,指令可套用於系統板上的所有記憶體
取消配置系統板上所有的 CPU 和記憶體
l 取消配置 板上所有的 CPU 和記憶體。
# cfgadm -c unconfigure SBx
追蹤取消配置記憶體的作業
你可以使用 cfgadm(1M) 指令追蹤取消配置記憶體作業之進度。下列指令顯示已刪除 之記憶體數量的快照,以及要刪除的記憶體數量。
l 追蹤記憶體刪除之程序。
# cfgadm -a -s “select=type(memory),cols=ap_id:o_state:info”
40 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
PCI 配接卡作業
每一個 I/O 板上的熱插式插槽可個別連線、配置、取消配置和中斷連結。在配置配置 I/O 板到網域時,會在每一個熱插式插槽上建立附接點,這些附接點可用來辨別插槽及 槽上的配接卡。
Sun Fire 高階系統支援 PCI hsPCI 卡。Sun Fire 中階系統支援 PCI CompactPCI 卡。在下列程序中,PCI 是指這些卡類型的任何一種。
I/O 板上連結 PCI 插槽
l 連接 PCI 插槽。
# cfgadm -c connect pci_ap_id
上述的
例如,要連結但不配置 I/O 1 的插槽 1 之配接卡到網域,可使用下列指令:
pci_ap_id 代表 PCI 插槽的 ID
# cfgadm -c connect pcisch0:e01b1slot1
配置 I/O 板上的 PCI 插槽
l 配置 PCI 插槽。
# cfgadm -c configure pci_ap_id
上述的
例如,要配置 I/O 1 的插槽 1 上的配接卡至網域,可以使用下列指令:
pci_ap_id 代表 PCI 插槽的 ID
# cfgadm -c configure pcisch0:e01b1slot1
第 4 章 DR 程序 - 從系統網域 41
中斷 I/O 板的 PCI 插槽連線
l 中斷 PCI 插槽的連線.
# cfgadm -c disconnect pci_ap_id
上述的
pci_ap_id 代表 PCI 插槽的 ID
例如,在拔除配接卡之前,要中斷 I/O 1 的插槽 1 上的配接卡之連線,可使用以下 指令:
# cfgadm -c disconnect pcisch13:eo1b1slot1
取消配置 I/O 板上的 PCI 插槽
l 取消配置 PCI 插槽。
# cfgadm -c unconfigure pci_ap_id
上述的
例如,要取消配置網域 I/O 1 的插槽 1 上的配接卡,可使用以下指令:
如需更多資訊,請參閱 cfgadm_pci(1M)。
pci_ap_id 代表 CPI 插槽的 ID
# cfgadm -c unconfigure pcisch0:e01b1slot1
42 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
5
SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階)
本章節敘述如何在 Sun Fire 高階伺服器負責執行系統管理服務 (SMS) 軟體的系統控制 器 (SC) 上面使用 DR
注意在您嘗試在板上或元件上執行任何 DR 作業之前,請根據第 23 頁 「準備使用
DR」的說明,判定其狀態及狀況。
本章節涵蓋以下主題:
44 頁 「顯示裝置資訊」 46 頁 「顯示平台資訊」 47 頁 「顯示板資訊」 49 頁 「新增板」 50 頁 「刪除板」 51 頁 「移動板」 52 頁 「更換作用中的系統板」 53 頁「SMS DR 指令和選項」 61 頁 「錯誤訊息說明系統」
備註 – 在一項 DR 作業中,若是其一 SMS DR 指令執行失敗,板不會回復至其原來的
狀態。如果錯誤可以修復,您可以重新執行指令。如果無法修復錯誤,您必須重新啟動 網域方能使用板。
SMS DR 的指令 rcfgadm(1M) 與網域中的指令 cfgadm(1M) 用法相似,兩項指令接受 同樣的選項。較明顯的差別是: rcfgadm(1M) 經常需要附加 -d domain_id 的參數。本 章節集中討論其他的 SMS 指令。有關 rcfgadm(1M) 的資訊,請參閱第 57 頁
rcfgadm(1M)指令」。
43
顯示裝置資訊
在您嘗試執行任何 DR 作業之前,尤其在移除裝置之前,請使用 SMS 指令
showdevices(1M) 來顯示裝置資訊。
顯示裝置資訊
l 顯示網域的裝置資訊
# showdevices -v -d domain_id
showdevices(1M) 將顯示網域裡所有裝置的資訊,並產生與下列表單相同的輸出結
果。
5-1 showdevices 輸出範例,CPU
domain board id state speed ecache usage A SB1 40 online 400 4 A SB1 41 online 400 4 A SB1 42 online 400 4 A SB1 43 online 400 4 A SB2 55 online 400 4 A SB2 56 online 400 4 A SB2 57 online 400 4 A SB2 58 online 400 4
5-2 showdevices 輸出範例,UltraSPARC IV+ (showdevices -d G)
domain board id state speed ecache usage G SB0 0 on-line 1050 8 G SB0 1 on-line 1050 8 G SB0 2 on-line 1050 8 G SB0 3 on-line 1050 8 G SB0 4 on-line 1050 8
44 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
5-2 showdevices 輸出範例,UltraSPARC IV+ (showdevices -d G) (續)
domain board id state speed ecache usage G SB0 5 on-line 1050 8 G SB0 6 on-line 1050 8 G SB0 7 on-line 1050 8 G SB9 288 on-line 900 8 G SB9 289 on-line 900 8 G SB9 290 on-line 900 8 G SB9 291 on-line 900 8 G SB12 384 on-line 900 8 G SB12 385 on-line 900 8 G SB12 386 on-line 900 8 G SB12 387 on-line 900 8
5-3 showdevices 輸出範例,過程中耗用的記憶體
domain board board
mem MB
A SB1 2048 933 0x600000 4096
perm mem MB
base addr domain
mem MB
target
deleted MBremaining
board
C2 250 1500
A SB2 2048 0 0x200000 4096
5-4 showdevices 輸出範例, IO 裝置
domain board device resource usage A 101 sd0 A 101 sd1 A 101 sd2 A 101 sd3 /dev/dsk/c0t3d0s0 mounted from
filesystem “/” A 101 sd3 /dev/dsk/c0t3d0s1 dump device (swap) A 101 sd3 /dev/dsk/c0t3d0s1 swap area A 101 sd3 /dev/dsk/c0t3d0s3 mounted filesystem
“/var”
MB
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 45
5-4 showdevices 輸出範例, IO 裝置 (續)
A 101 sd3 /var/run mounted filesystem
“/var/run” A 101 sd4 A 101 sd5
欲了解更多資訊,參閱第 60 頁「showdevices(1M)」,或是參閱 showdevices(1M) 線上手冊,以取得一系列完整的選項和引數,以及有關顯示裝置的特定資訊。
顯示平台資訊
在您於特定網域裡嘗試新增、移動或刪除板之前,請使用 showboards(1M) 的指令來 判定網域 ID、網域裡可用的板,以及網域的狀態。
所有 DR 指令都可以使用網域 ID 來執行。您可以使用板清單來判定被指定的特定板屬 於哪一個網域,也可以使用網域狀態來判定是否可以在網域裡新增、刪除或移動板。請 使用 showplatform(1M) 的指令來判定該元件是否存在於可用元件清單 (ACL) 上。
要使用 showplatform(1M) 指令,必須擁有適當的特殊權限。欲了解更多,包括擁有 使用權的使用者群組表格,請參閱第 60 頁「showplatform(1M)」。
46 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
顯示平台資訊的方法
l 列出網域及 ACL 資訊
# showplatform
showplatform(1M) 指令將顯示網域 IDACL 以及網域狀態,如下列範例所示:
ACLs for domain domainA:
slot0: SB0, SB1, SB2, SB3 slot1: IO0, IO1, IO2, IO3
ACLs for domain domainB:
slot0: None slot1: None
Domain Solaris Nodename Domain Status
domainA sms3-b0 Powered Off domainB sms3-b1 Running Solaris
顯示板資訊
在您嘗試刪除或移動系統板之前,必須先查詢以判定板的狀態以及它被指定的網域之 狀態。欲了解更多,包括擁有使用權的使用者群組表格以及 showboards(1M) 線上手 冊,請參閱第 59 頁「showboards(1M)」
SC 狀態模型
在 Sun Fire 的高階伺服器 SC上,板有四種狀態:不可用 (unavailable),可用的 (available),指定的 (assigned),或使用中 (active)。
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 47
備註 – SC 的板狀態不同於網域的板狀態。欲進一步了解網域的板狀態,請參閱第 7
DR 概念」。
5-5 Sun Fire 高階系統 SC 上的板狀態
名稱 說明
unavailable
available
assigned
active
板不可用 ,無法新增至網域。板仍未新增至特定網域之 ACL,或該板 目前已被指定到另一網域。請注意:網域無法找到不在 ACL 清單上的 板。在 unavailable 的狀態下,板不屬於特定網域。
板可用,可以新增至網域。板存在於該網域的 ACL。請注意:板的可 用性不受限於網域之數量。在 avaiblable 狀態下,板不屬於邏輯網 域。
板已被指定至網域, 可能已存在於網域的 ACL。板對其他網域不可 用。在 assigned 狀態下,板被視為邏輯網域的一部份。
板已連結。或是,板已連結,且配置至 Solaris OS,可供作業系統使 用。在 active 的狀態下,板被視為實體網域的一部份。
showboards(1M) 指令
在您判定您要刪除或移動板的網域 ID 之後,或是在您判定某一特定板已被指定至特定 網域之後,請使用 showboards(1M) 指令來判定板狀態。板的狀態可能讓您無法刪除 或移動之。
備註showboards(1M) 指令的輸出,以使用者的特權為依據。例如,平台管理者可
以取得伺服器上所有板子的資訊。至於網域管理者和網域配置者則只能在他們擁有存取 權限的網域中,取得那些被指定的和可用的板子資訊。欲了解更多,請參閱第 59
showboards(1M)」以及 showboards(1M) 線上手冊。
48 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
顯示板資訊的方法
l 顯示網域的板資訊
# showboards -d domain_id
上述指令顯示的裝置資訊如下:
插槽 電源 板的類型 板的狀況 測試狀況 領域
SB0
SB1 -
您可以使用 showboards(1M) 的指令來顯示網域裡所有指定的及可用的系統板和所有 I/O 板。請參閱 showboards(1M) 線上手冊以了解更多有關顯示板的資訊。
啟動 CPU 作用中 略過
空插槽 指定的
- A
A
新增板
新增板至網域的時候,板會經歷幾種狀態變化。若是該板尚未被指定,將先指定至網 域。接著,它連結至網域,然後配置到 Solaris OS。連結之後,它被視為實體網域的一 部份,可供作業系統使用。
您必須擁有適當的特權才能新增板至網域。欲了解更多,包括使用此指令所需特權的說 明,請參閱第 53 頁「addboard(1M)」以及 addboard(1M) 線上手冊。
備註在您使用 DR 新增一個 COD 板到網域以前,請確定系統對目標網域擁有足夠的
RTU 授權,以啟動 COD 板上的每個使用中 CPU。否則,DR 將為每一個無法在網域
裡啟動的 CPU 顯示一項訊息。欲了解更多有關 COD 選項的資訊,請參閱 服務 (SMS) 管理者指南
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 49
系統管理
新增一個板至一個網域
l 新增板至網域
# addboard -d domain_id board_id
以下是新增系統板 2 (SB2) 至網域 A 的範例。示範了兩次重試,若屬必要,兩次重 試作業之間相隔了 10 分鐘 (600 秒鐘) 的等待時間。
# addboard -d A -r 2 -t 600 SB2
備註如果 addboard(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀態。
網域會記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該指 令。如果錯誤無法修復,您必須重新啟動網域才能使用板。
刪除板
從一個網域刪除一個板,該板將從其目前被指定的、可能使用中的網域被移除。欲刪除 板,板必須在被指定的或使用中的狀態。
在您刪除網域的板之前,記得檢查板上元件的使用狀況。如果板擁有永久記憶體,記得 在刪除板之前,將其記憶體移到同網域的其他板上。同樣地,在您嘗試移除板之前,如 果有些裝置正在忙碌,您必須等待或確認系統已不再使用該裝置再進行刪除。
一個網域管理者可以取消板的配置和連結,但是不可以在網域裡取消指定一個板,除非 該板在 ACL 上。欲了解更多,包括使用此指令所需特權的說明,請參閱第 55
deleteboard(1M)」以及 deleteboard(1M) 線上手冊。
50 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
從網域刪除一個板
l 從網域刪除板
# deleteboard board_id
以下是 deleteboard(1M) 指令在其目前網域將系統板 2 號刪除的範例。示範了兩次 重試,若屬必要。兩次重試之間相隔了 15 分鐘 (900 秒鐘) 的等待時間。
# deleteboard -r 2 -t 900 SB2
備註如果 deleteboard(1M) 指令在 DR 作業時執行失敗,板不會回復其原來的狀
態。網域會記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該 指令。如果錯誤無法修復,您必須重新啟動網域才能使用板。
移動板
將板從一個網域移到另一個網域需要若干步驟。首先,將板從其目前指定的且可能使用 中的網域移除,板必須處在指定的或使用中的狀態。然後,將它指定至目標網域。接 著,它連結至目標網域,配置到 Solaris OS,便能供系統使用。
每一次您要將板從網域移除的時候,都要檢查板上記憶體和裝置的使用狀況。如果板擁 有永久記憶體,在板被移至另一網域以前,必須先將記憶體移至同網域的另一個板上。 同樣地,在您嘗試移動板之前,若有些裝置正在忙碌,您必須等待或確認系統已不再使 用該裝置再進行刪除。
欲了解更多,包括使用此指令所需特權的說明,請參閱第 56 頁「moveboard(1M)」 以及 moveboard(1M) 線上手冊。
備註在您使用 DR 移動一個 COD 板到網域以前,請確定系統對目標網域擁有足夠的
RTU 授權,以啟動 COD 板上的每個使用中 CPU。否則,DR 將為每一個無法在網域
裡啟動的CPU 顯示一項訊息。欲了解更多有關 COD 選項的資訊,請參閱 服務 (SMS) 管理者指南
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 51
系統管理
移動板的方法
l 將板從一個網域移動到另一個網域。
# moveboard -d domain_id board_id
以下是 moveboard(1M) 指令將系統板 2 號 (SB2) 從其目前網域移至網域 A 的範例。 示範了兩次重試,若屬必要。兩次重試之間相隔 15 分鐘 (900 秒鐘) 的等待時間。
# moveboard -d A -r 2 -t 900 SB2
備註 – 如果 moveboard(1M) DR作業時執行失敗,板不會回復其原來的狀態。網域
會記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該指令。如 果錯誤無法修復,您必須重新啟動網域才能使用板。
更換作用中的系統板
本節說明如何更換在網域裡作用中的系統板。
更換作用中系統板的方法
1. 將系統板從其目前網域刪除
# deleteboard board_id
以下是將系統板 2 (SB2) 從其目前網域刪除的範例。
# deleteboard -r 2 -t 900 SB2
52 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
2. 將替代板新增至特定網域。
# addboard -d domain_id board_id
以下是新增系統板 3 (SB3) 至網域 A 的範例。示範了兩次重試,若屬必要,兩次重 試作業之間相隔了 15 分鐘 (900 秒鐘) 的等待時間。
# addboard -d A -r 2 -t 900 SB3
SMS DR 指令和選項
本節將說明 SMS DR 指令及相關的選項。欲進一步了解每一個 SMS DR 指令,請參閱
系統管理服務 (SMS) 參考手冊
addboard(1M)
addboard(1M) 指令將板與網域相關連。請參閱第 49 頁 「新增板」以及 addboard(1M)
上手冊以獲得更多資訊。
5-6 addboard 指令選項
選項與運算元 說明
board_id
-c function
-d domain_id
-f
-h
-n
-q
將新增板 ID。板 ID 與板位置相符。例如, SB2 乃是在 2 號插槽的板。允許多個板識別碼。
將板配置為特定的配置狀態 。你可以按照步驟新增板。例 如,你可以指定一個板,連結之,然後配置之。
在指定的網域執行 DR 作業。
強制發生特定動作。這是安全功能中一項獨特的特定硬體覆 寫動作。強制變更狀態的作業,可以允許使用處於 ok 或 unknown 狀況的硬體資源,以從屬硬體之安全檢查為依據。
顯示說明 (用法) 資訊。
對所有提示均以 No 回應。
以無訊息模式執行。訊息及提示非以標準輸出之方式撰寫。 獨自使用時,-q 對於所有提示的回應與 -n 選項相同。
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 53
5-6 addboard 指令選項 (續)
選項與運算元 說明
-r retry_count
-t timeout
-y
若作業執行失敗,請根據指定的次數重新執行。
重試作業之間,請在指定的時間 (以秒計算) 內等待。
對所有提示均以 Ye s 回應。
5-7 說明使用 addboard(1M) 指令所需之特權。平台作業員、平台服務以及超級使 用者群組無法對此指令初始化。
5-7 使用 addboard 指令所需要的特權
平台管理者 網域管理者 網域配置者
可對網域指定一板,使用
-c 選項,配合 assign 功能。
若是板已被指定至某網域,或它 出現在該網域的 ACL 上而且未 被指定至其他網域,便可以將該 板連結或配置給網域。
若是板已被指定至某網域,或 它出現在該網域的 ACL 上而 且未被指定至其他網域,便可 以將該板連結或配置給網域。
以下範例示範系統板 2 (SB2) 如何與網域 A 相關連。示範了兩次重試,若屬必要。 兩次重試之間相隔 10 分鐘 (600 秒鐘) 的等待時間。
# addboard -d domainA -r 2 -t 600 SB2
備註 – 如果 addboard(1M) DR 作業時執行失敗,板不會回復其原來的狀態。網域
會記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該指令。如 果錯誤無法修復,您必須重新啟動網域才能使用板。
54 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
deleteboard(1M)
deleteboard(1M) 指令將板和網域分開。參閱第 50 頁 「刪除板」以及 deleteboard(1M) 線上手冊以獲取更多資訊。
5-8 deleteboard 指令選項
選項與運算元 說明
board_id
-c function
-f
-h
-n
-q
-r retry_count
-t timeout
-y
將刪除板 ID。板 ID 與板位置相符。例如,SB2 乃是 2 號 插槽上的系統板。允許多個板識別碼。
將板配置為特定的配置狀態。你可以按照步驟刪除板。例 如,你可以取消該板的配置,中斷其連結,再取消其指定。
強制發生特定動作。這是安全功能中一項獨特的特定硬體 覆寫動作。強制變更狀態的作業,可以允許使用處於 ok 或 unknown 狀況的硬體資源,以任何硬體從屬之安全檢查為 依據。
顯示說明 (用法) 資訊。
對所有提示均以 No 回應。
以無訊息模式執行。訊息及提示非以標準輸出之方式撰寫。 獨自使用時,-q 對示所有提示的回應與 -n 選項相同。
若作業執行失敗,請根據指定的次數重新執行。
重試作業之間,請在指定的時間 (以秒計算) 內等待。
對所有提示均以 Ye s 回應。
5-9 說明使用 deleteboard(1M) 指令所需要特權。平台作業員、平台服務和超級使 用者群組無法對此指令初始化。
5-9 使deleteboard 指令的特權
平台管理者 網域管理者 網域配置者
使用 -c 選項和 unassign 功能來取消指
定網域中未被使用的板。 如果使用者擁有網域特 權,deleteboard 也可 以在取消板的指定之前, 先取消該板的配置並中斷 其連結。
可以將板從網域中取消配置、中 斷連結或是取消指定。只有出現 在 ACL 裡的板才可以從網域中 取消指定。
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 55
可以將板從網域中取消配置、 中斷連結或是取消指定。只有 出現在 ACL 裡的板才可以從 網域中取消指定。
下列範例呈現 deleteboard(1M) 指令如何將系統板 2 號從其目前網域中取消關連。 此指令指定兩次重試,其間相隔 15 分鐘 (900 秒鐘)。
# deleteboard -r 2 -t 900 SB2
備註 – 如果 deleteboard(1M) DR 作業時執行失敗,板不會回復其原來的狀態。
一項 dxsdca 的錯誤訊息已記錄到網域。如果錯誤可以修復,您可以重新執行該指 令。如果錯誤無法修復,您必須重新啟動網域才能使用板。
moveboard(1M)
moveboard(1M) 指令先將板從一網域中取消關連,再將之與另一網域關連。請參閱 第 51 頁 「移動板」以及 moveboard(1M) 線上手冊以獲得更多資訊。
5-10 moveboard 指令選項
選項與運算元 說明
board_id
-c function
-d domain_id
-f
-h
-n
-q
-r retry_count
-t timeout
-y
將移動板 ID。板 ID 與板位置相符。例如,SB2 乃是在 2 號 插槽的板。允許多個板識別碼。
將板配置為特定的配置狀態。你可以按照步驟移動板。例 如,你可以指定一個板,連結之,然後配置之。
在指定的網域執行 DR 作業。
強制發生特定動作。這是安全功能中一項獨特的特定硬體覆 寫動作。強制變更狀態的作業,可以允許使用處於 ok 或 unknown 狀況的硬體資源,以任何硬體從屬之安全檢查為 依據。
顯示說明 (用法) 資訊。
對所有提示均以 No 回應。
以無訊息模式執行。訊息及提示非以標準輸出之方式撰寫。 獨自使用時,-q 對於所有提示的回應與 -n 選項相同。
若作業執行失敗,請根據指定的次數重新執行。
重試作業之間,請在指定的時間 (以秒計算) 內等待。
對所有提示均以 Ye s 回應。
56 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
5-11 說明使用 deleteboard(1M) 指令所需要特權。平台作業員、平台服務和超級 使用者群組無法對此指令初始化。
5-11 使用 moveboard 指令所需的特權
平台管理者 網域管理者 網域配置者
可以重新將板從一網域重 新指定至另一網域,使用
-c 選項,配合 assign 功能。重新指定的板,不 可以是指定網域裡使用中 的板。
可以指定、連結或配置位於另一 網域的板。如果該板在另一網域 使用中,moveboard 指令將從 該網域中取消板的配置並中斷其 連結。只有在 ACL 裡的板,才 可以用 moveboard 取消指定和 重新指定。該 moveboard 指令 可以連結及配置板。
網域管理者必須擁有雙方網域 的特權,才能 moveboard(1M) 指令。
可以指定、連結或配置位於另 一網域的板。如果該板在另一 網域使用中,moveboard 指 令將從該網域中取消板的配置 並中斷其連結。只有在 ACL 裡的板,才可以用 moveboard 取消指定和重新 指定。該 moveboard 指令可 以連結及配置板。
網域管理者必須擁有雙方網域 的特權,才能 moveboard(1M) 指令。
下列是 moveboard(1M) 指令將系統板 5 號 (SB5) 從其目前網域移至網域 B 的範例。此 指令指定兩次間隔 15 分鐘 (900 秒鐘) 的重試。
# moveboard -d domainB -r 2 -t 900 SB5
備註 – 如果 moveboard(1M) DR 作業時執行失敗,板不會回復其原來的狀態。網
域會記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該指令。 如果錯誤無法修復,您必須重新啟動網域才能使用板。
rcfgadm(1M)指令
rcfgadm(1M) 指令在 SC 上執行 DR 作業,在裝置樹上的裝置節點,即附接點上提 供遠端配置管理作業。參閱 rcfgadm(1M) 線上手冊以獲得更多資訊和如何使用此指令 的範例。
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 57
5-12 說明該 rcfgadm(1M) 指令的選項和運算元。
5-12 rcfgadm 指令選項
選項與運算元 說明
-a
-c function
-d domain_id
-f
-h
-h ap_id
-h ap_type
-l ap_id | ap_type
-n
-o hardware_options
-r retry_count
-s listing_options
-T timeout
-t
-v
-x hardware_function
-y
列出動態附接點。 將板配置為特定的配置狀態。連結,中斷連結,
配置,or 取消配置。
在指定的網域執行 DR 作業。
強制特定動作。
列印特定的 help 訊息。如果加入 ap_id or ap_type 變數, 為附接點顯示特定硬體的 help
列出特定附接點的狀態和狀況。
對所有提示均以 No 回應。
使用特定的特定硬體選項。
若作業執行失敗,請根據指定的次數重新執行。
列出特定的排列選項。
重試作業之間,請在指定的時間 (以秒計算) 內等待。
測試一個或多個附接點。
以詳細模式執行。
使用特定硬體功能。
對所有提示均以 Ye s 回應。
表 5-13 說明使用 addboard(1M) 指令所需之特權。平台作業員、平台服務和 superuser 群組無法對此指令初始化。
5-13 使用 rcfgadm 指令所需的特權
平台管理者 網域管理者 網域配置者
可以指定板至網域也可以從網 域取消指定板,只要先後使用
-x 選項,配合 assign unassign 功能。要使用 unassign 功能,板必須已被
指定,而且在作業網域裡非使 用中。
58 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
可以在網域裡對板進行中斷連 結、連結、配置或取消配置的 動作。若板在網域的 ACL 裡,可以指定或取消指定之。
可以在網域裡對板進行中斷連 結、連結、配置或取消配置的 動作。若板在網域的 ACL 裡,可以指定或取消指定之。
備註 – 如果 rcfgadm(1M) DR 作業時執行失敗,板不會回復其原來的狀態。網域會
記錄一項 dxsdca 的錯誤訊息。如果錯誤可以修復,您可以重新執行該指令。如果 錯誤無法修復,您必須重新啟動網域才能使用板。
scdrhelp(1M)
scdrhelp(1M) shell 程序檔啟動 Sun Fire 高階伺服器動態再配置錯誤輔助系統。該 補助系統使用 JavaHelp™ hsviewer 程序檔。
所有使用者 特權群組可以使用此指令,除了網域管理者和網域配置者。
參閱第 61 頁 「錯誤訊息說明系統」以及 scdrhelp(1M) 線上手冊以獲取更多有關此 程序檔的資訊。
showboards(1M)
showboards(1M) 指令顯示網域裡系統板的指定資訊和狀態,且指出該板是不是 COD
(Capacity On Demand) 板。參閱第 47 頁「顯示板資訊」以及 showboards(1M) 線上 手冊以獲取更多資訊。
雖然 showboards(1M) 不是特定 DR 指令,Sun 建議您執行此指令時與 DR 指令一起 使用。 表 5-14 說明 showboards(1M) 的指令選項。
5-14 showboards 指令選項
選項 說明
-d domain_id
-h
-v
在指定網域執行 DR 作業。
顯示 Help (用法) 資訊。
以詳細模式執行。在此模式中,此指令顯示所有元件,包 括網域可配置單元 (DCUs),包含 CPUPCI SC
所有使用者特權群組可以使用此指令,但是網域管理者和網域配置者只能在他們擁有特 權的網域裡顯示板資訊。
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 59
showdevices(1M)
showdevices(1M) 指令顯示系統板上已配置的實體裝置以及這些裝置提供的可用資
源。雖然 showdevices(1M) 指令不是特定 DR 指令, Sun 建議您執行此指令時與 DR 指令一同使用。參閱第 44 頁 「顯示裝置資訊」以及 showdevices(1M) 線上手冊以獲 得更多資訊。
正在管理系統資源的應用程式及子系統將提供使用資訊。欲了解在系統板上執行 DR 作 業的預期結果,可對所管理的資源作離線查詢。
5-15 showdevices 指令選項
選項與運算元 說明
board_id
-d domain_id
-h
-p reports
-v
只有網域管理者和網域配置者可以顯示有關一個網域的裝置資訊。而且他們惟有在其擁 有特權的網域才能如此做。
將新增板 ID。板 ID 與板位置相符。例如,SB2 乃是在 2 號插槽的系統板。允許多個板識別碼。
在指定的網域執行 DR 作業。
顯示 Help (用法) 資訊。
顯示離線查詢的資訊。
顯示所有 I/O 裝置的資訊。
showplatform(1M)
showplatform(1M) 的指令顯示 ACL,每個網域的狀態,以及 COD (Capacity on
Demand) 資訊。雖然 showplatform(1M) 不是特定 DR 指令,Sun 建議您執行此指 令時與 DR 指令一同使用。參閱第 46 頁 「顯示平台資訊」以及 showplatform(1M) 線上手冊以獲取更多資訊。
5-16 showplatform 指令選項
選項與運算元 說明
-d domain_id
-h
-p domains | available ethernet | cod
-v
60 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
在指定的網域執行 DR 作業。
顯示 Help (用法) 資訊。
顯示包含 COD 資訊的報告,根據以下特定方式組合:
網域狀態 (domains)網域 ACL (available)網域乙太網路卡位址 (ethernet)
顯示所有可用指令的資訊。
所有使用者特權群組,除了平台服務和 superuser 群組以外,均可使用此指令。但是網 域管理者和網域配置者只能在其擁有特權的網域顯示平台資訊。
錯誤訊息說明系統
SMS 軟體含有一個錯誤訊息說明系統,可以幫助您找到特定錯誤訊息之說明和修復程 序。
要啟動 DR 錯誤訊息說明系統,請使用下列指令:
# /opt/SUNWSMS/jh/scdrhelp/scdrhelp &
標準的 JavaHelp 系統檢視器,hsviewer,顯示 DR 錯誤訊息說明系統。此檢視器含 有一行工具列和兩個窗格:內容窗格和瀏覽窗格,如圖 5-1 所示:
內容按鈕
瀏覽窗格
5-1 hsviewer GUI 元件
索引按鈕
搜尋按鈕
內容窗格
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 61
JavaHelp 內容表格
DR 錯誤訊息根據其錯誤類型而分類到不同的邏輯組,如圖 5-1 所示。這些群組代表了
在內容表格的最上層標題所呈現的重要主題。錯誤訊息的數量及 (或) 縮寫文字將出現 在其所屬的群組名稱之下。
JavaHelp 索引
DR 錯誤訊息已做成索引,其關鍵主題將如同下列索引圖 ( 5-2)。我們將在適當的地
方內嵌索引主題。以這些主題而言,只有內嵌式主題才會與錯誤訊息相連結。
索引按鈕
內嵌式主題
5-2 JavaHelp 索引圖
JavaHelp 搜尋
DR 錯誤訊息說明系統提供全文搜尋的功能。搜尋資料庫的資料乃建立自錯誤訊息說明
檔案的索引。
在搜尋特定的錯誤訊息以前,先在錯誤訊息裡搜與特定的字串。而且,避免使用數字, 因為它們被視為可替代的文字。JavaHelp 發生錯誤後的系統視窗如下圖所示:
62 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
搜尋按鈕
5-3 JavaHelp 搜尋圖
可替代文字
第 5 章 SMS DR 程序 - 從系統控制器 (SC) 執行 (僅限高階) 63
64 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
6
DR 內部
本章包含 DR 如何運作之資訊,對於簡便使用 DR 的使用者並非必要。其包含的資訊對 於技術使用者或許有其價值。
本章涵蓋以下主題:
65 頁 「網域上的軟體元件」 67 頁「SC 上的軟體元件 (僅適用於高階)
網域上的軟體元件
本節說明 DR 的相關軟體元件,其常駐在網域上且使 DR 作業有其可行性。
網域配置伺服器 (僅適用於高階)
網域配置伺服器 (DCS) 是在高階系統網域執行的常駐程式程序,而且在接收到第一個 遠端 DR 請求時,由 inetd(1M) 啟動。在每一個網域上執行的 DCS 單一實例。DCS 接受從 SC 上執行的網域配置代理程式 (DCA) DR 請求。在 DCS 接受 DR 作業後, 其會執行請求並傳回結果至 DCA。請參閱第 67 頁 「網域配置代理程式 (DCA)」。
備註 – 在執行 Solaris 10 作業系統的網域中,DCS inetd.conf 檔案中沒有項目。
在執行 Solaris 軟體較早版本的網域中,DCS 在 inetd.conf 中沒有項目。在稍後的 案例中,如果您替代或移除在 inetd.conf 之中的 sun-dr 項目,請在 ipsecinit.conf 檔案中的 sun-dr 項目做相同變更。
65
DR 驅動程式
在高階系統的 DR 驅動程式包含名稱為 dr 的不受限於平台的驅動程式,以及名稱為 drmach 的指定平台模組。在中階系統,驅動程式為 sbd 而指定平台模組為 sbdp。不 論是否可控制 DR 作業,DR 驅動程式都會使用 Solaris 軟體的標準功能,而且會呼叫 指定平台模組 (如果需要)。DR 驅動程式要負責在 DR 作業做為附接點的檔案系統中建 立次要節點。
重新配置座標管理員
重新配置座標管理員 (RCM) 為常駐程式程序可決定 DR 作業出現在網域的來源座標。 RCM 網域使用者產生應用程式介面 (API) 以決定 DR 作業在 DR 初始器與 RCM 用戶 端之間的座標。
RCM 用戶包含 DR 初始器,也就是請求 DR 作業,以及 DR 用戶端,可回應 DR 請 求。一般而言,DR 初始器是要配置管理指令,cfgadm(1M)。但是,也可以做為
GUI,例如:Sun Management Center
DR 用戶端可為:
輸出一個或多個硬體裝置之高階資源的軟體層 (例如:多重路徑應用程式)監視 DR 作業的應用程式 (如:Sun Management Center)遠端系統的實體,例如:伺服器上的系統控制器
系統事件架構
DR 作業之後所發生的變更,將由 DR 使用 Solaris 系統事件架構來通知其他的軟體。 DR DR 事件傳送至系統事件常駐程式,syseventd,傳回後,將事件傳送給 DR
事件的訂閱者。如需更多有關系統事件常駐程式的資訊,請參閱 syseventd(1M) 線 上手冊。
66 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
SC 上的軟體元件 (僅適用於高階)
本節說明 DR 的相關軟體元件,其常駐在網域上,是 DR 作業不可缺少的元素。
DR 管理模型
可用元件清單根據使用者的名稱及群組身份來控管可被執行的管理任務。 每項 DR 作業 都有特權模型,其簡要說明可參閱第 43 頁「SMS DR 程序 從系統控制器 (SC) 執行 ( 僅限高階)」。如需每項 SMS 指令所需的特權之詳細說明,請參閱 「系統管理服務
(SMS) 管理者指南」。
DR 程序和常駐程式
Sun Fire 高階系統控制器 (SC) 上的若干程序和常駐程式,一同完成 DR 作業。所使用
的處理器和 (或) 常駐程式,完全根據 DR 作業的執行階段來決定。舉例而言,若在 SC 上執行 DR 作業,比起在網域執行 DR 作業,前者會讓系統使用更多的處理器和 (和) 常駐程式來完成 DR 作業,
如需更多有關常駐在網域的程序和常駐程式的資訊,請參閱本文件的其他章節。如需更 多有關常駐在 SC 上的 SMS 軟體之程序和常駐程式,請參閱 「系統管理服務 (SMS) 管 理者指南」。
網域配置代理程式 (DCA)
網域配置代理程式 (DCA) Sun Management Center SMS 等應用程式可以在 Sun Fire 高階系統的網域初始化 DR 作業。DCA 在 SC 上執行,並管理 SC 上執行的軟體應 用程序和網域上的網域配置伺服器之間的 DR 通訊。在 Sun Fire 高階系統的每個網域 上,都有 DCA 的個別實例在 SC 上執行。如需更多 DCA 的相關資訊,請參閱 「系統 管理服務 (SMS) 管理者指南」。
備註 – 若您更動或移除 inetd.conf 檔案裡的 sun-dr 項目,請在 ipsecinit.conf
檔案裡的 sun-dr 項目做同樣的變更。
6 DR 內部 67
平台配置常駐程式 (PCD) (僅適用於高階)
平台配置常駐程式 (PCD) 利用其資料庫一系列的平面檔案來管理每一台 Sun Fire 高階 系統的配置。Sun Fire 高階系統配置的所有更動,都必須經過 PCD。如需更多有關 PCD 的資訊,請參閱 「系統管理服務 (SMS) 管理者指南」。
網域 X 伺服器 (DXS)
網域 x 伺服器 (DXS) 管理網域上 SC DR 模組 (drmach) 之間的通訊。在 Sun Fire 高 階系統的每個網域上,都有個別的 DXS 實例在 SC 上執行。如需更多有關 DXS 的資 訊,請參閱 「系統管理服務 (SMS) 管理者指南」。
68 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
附錄 A
DR 指令摘要
本章節包含了主要 DR 作業與指令的摘要。大部份在高階系統上普遍使用的 DR 作業,均 可用下面列舉或提及的若干 SMS 指令來執行。許多高階系統使用者偏好使用這些指令。
注意 – 錯誤地執行一項 DR 指令可能會停用您的系統。本文的其他部份將說明一些步
驟,在您執行過那些步驟之前,請勿執行下列圖表中的指令:這裡的資訊,只提供給有 經驗的 DR 使用者使用。
A-1 DR 作業和指令摘要
DR 作業 高階系統 SMS 指令 cfgadm 指令
顯示板狀態、類型和狀況
顯示有關板插槽和元件的資訊
顯示高階系統板的狀況 請參閱第 5
顯示中階系統板的狀況
顯示網域裡可用的板 請參閱第 5
rcfgadm -la
-d domain_id
n/a cfgadm -a -v
cfgadm -la
prtdiag cfgadm -a -v -s “select=
class(sbd)”
cfgadm -l
顯示特定網域的系統板狀況 請參閱第 5
顯示系統或是 I/O 板的類別
顯示與附接點相關類別的方法
rcfgadm -d domain_id
-s ìcols=ap_id:classî
rcfgadm -a -d domain_id
-s ìcols=ap_id:classî
cfgadm -a -v -s “select= class(sbd)”
cfgadm -s “cols=ap_id:class”
cfgadm -a -s “cols=ap_id:class”
69
表 A-1 DR 作業和指令摘要 (續)
DR 作業 高階系統 SMS 指令 cfgadm 指令
測試系統板
rcfgadm -d domain_id
cfgadm -t ap_id
-t ap_id
測試 I/O
n/a
請參閱第 28 頁 「測試 I/O 板 (僅適用於中 階系統)」
新增板至網域
addboard -d domain_id board_id
cfgadm -v -c configure board_id
- 或 -
cfgadm -v -c configure ap_id
刪除網域的板
deleteboard board_id cfgadm -v -c disconnect board_id
- 或 -
cfgadm -v -c disconnect ap_id
從一網域移動板至另一網域 請參閱第 52 頁 「移動板的方法」請參閱第 35 頁 「在網域之間搬移系統板」
配置系統板上的 CPU
配置系統板上的記憶體
取消配置系統板上所有的 CPU 和 記憶體
偵測記憶體的取消配置
取消配置擁有永久記憶體的系統板
中斷系統板或 I/O 板的連線
連結 I/O 板上的 PCI 插槽
配置 I/O 板上的 PCI 插槽
中斷 I/O 板上 PCI 插槽的連結
取消配置 I/O 板上的 PCI 插槽
rcfgadm -c configure
-d domain_id SBx::cpuy rcfgadm -c configure
-d domain_id SBx::memory rcfgadm -c unconfigure
-d domain_id SBx rcfgadm -a -d domain_id
-s “select=type (memory),
cols=ap_id:o_state:info” rcfgadm -c unconfigure
-d domain_id -y SBO rcfgadm -c disconnect
-d domain_id board_id rcfgadm -c connect
-d domain_id pci_ap_id rcfgadm -c configure
-d domain_id pci_ap_id rcfgadm -c disconnect
-d domain_id pci_ap_id rcfgadm -c unconfigure
-d domain_id pci_ap_id
cfgadm -c configure SBx::cpuy
cfgadm -c configure SBx::memory
cfgadm -c unconfigure SBx
cfgadm -a -s “select=type (memory),
cols=ap_id:o_state:info”
cfgadm -c unconfigure -y SBO
cfgadm -c disconnect board_id
cfgadm -c connect pci_ap_id
cfgadm -c configure pci_ap_id
cfgadm -c disconnect pci_ap_id
cfgadm -c unconfigure pci_ap_id
70 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
附錄 B
疑難排解
本章旨在說明一般錯誤類型:
71 頁 「取消配置作業失敗」 76 頁 「配置作業失敗」
下列為 cfgadm 診斷訊息的範例。(本章不包含語法錯誤訊息。)
cfgadm: Configuration administration not supported on this machine cfgadm: hardware component is busy, try again cfgadm: operation: configuration operation not supported on this machine cfgadm: operation: Data error: error_text cfgadm: operation: Hardware specific failure: error_text cfgadm: operation: Insufficient privileges cfgadm: operation: Operation requires a service interruption cfgadm: System is busy, try again WARNING: Processor number failed to offline.
請參閱下列的線上說明手冊,以取得其他錯誤訊息的詳細資訊:cfgadm(1M) cfgadm_sbd(1M)cfgadm_pci(1M) config_admin(3CFGADM)
取消配置作業失敗
在您開始作業時,若系統並非處於正確狀態,針對系統板或 I/O 板進行的取消配置作 業可能會失敗。
71
系統板取消配置錯誤
在嘗試取消配置板前,板上的記憶體會與其它板的記憶體交錯。在嘗試取消配置 CPU 前,會出現連結至 CPU 的程序。嘗試在主機板上進行 CPU 取消配置作業前,主機板上的記憶體仍維持配置狀態 (僅
適用於中階系統)。
板上的記憶體已配置 (使用中)。請參閱第 73 頁 「無法取消配置板上有永久記憶體的
記憶體」。
板上的 CPU 無法離線。請參閱第 74 頁 「無法取消配置 CPU」。
無法取消配置記憶體與其他板記憶體交錯的主機板
若您嘗試取消配置主機板,而該板的記憶體與其他主機板的記憶體交錯的話,系統就會 出現下列的錯誤訊息:
cfgadm: Hardware specific failure: unconfigure N0.SB2::memory: Memory is interleaved across boards: /ssm@0,0/memory-controller@b,400000
無法取消配置已出現連結程序的 CPU
若您嘗試取消配置已出現連結程序的 CPU,系統就會出現下列的錯誤訊息:
cfgadm: Hardware specific failure: unconfigure N0.SB2::cpu3: Failed to off-line: /ssm@0,0/SUNW,UltraSPARC-III
取消 CPU 連結程序並重試取消配置作業。
在取消配置所有記憶體前無法取消配置 CPU (僅適用於中階)
嘗試取消配置 CPU 前,主機板上的所以有記憶體須先取消配置。若您在取消配置板上 所有的記憶體前就嘗試取消配置 CPU,系統就會出現下列的錯誤訊息:
cfgadm: Hardware specific failure: unconfigure N0.SB2::cpu0: Can’t unconfig cpu if mem online: /ssm@0,0/memory-controller
取消配置板上所有記憶體然後取消配置 CPU
72 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
無法取消配置板上有永久記憶體的記憶體
欲取消配置板上有永久記憶體的記憶體,請將永久記憶體頁移到其它有足夠的可用記憶 體的板上。在取消配置作業進行前,須先準備好另外的板以便使用。
記憶體無法重新配置
如果取消配置作業失敗,並出現下列的訊息,板上的記憶體便無法取消配置:
cfgadm: Hardware specific failure: unconfigure N0.SB0: No available memory target: /ssm@0,0/memory-controller@3,400000
在其它板上加上足夠的記憶體以便儲存永久記憶體頁,然後重新嘗試取消配置作業。
請確認無法移除記憶體頁面。
請注意清單中的 「permanent」一詞。
# cfgadm -av -s “select=type(memory)”
可用記憶體不足
如果取消配置作業失敗並出現以下任一訊息的話,在移除板時,系統會出現可用記憶體 不足的情況。
cfgadm: Hardware specific failure: unconfigure N0.SB0: Insufficient memory
cfgadm: Hardware specific failure: unconfigure N0.SB0: Memory operation failed
請刪減系統上的記憶體載入並再試一次,如果可行,可在另一個板插槽安裝更多記憶
體。
記憶體需求增加
如果取消配置作業失敗,並出現下列的訊息,在進行取消配置作業的同時,記憶體需求 會增加:
cfgadm: Hardware specific failure: unconfigure N0.SB0: Memory operation refused
附錄 B 疑難排解 73
降低系統記憶體承載並再試一次。
無法取消配置 CPU
CPU 取消配置是 CPU/記憶體板取消配置作業中的一部分系統板。如果作業無法讓 CPU 離線,下列訊息會記錄在主控台上:
WARNING: Processor 編號 failed to offline.
如有下列狀況,會產生錯誤:
該 CPU 程序已連結。 該 CPU 是 CPU 集裡的最後一個。 該 CPU 是系統裡最後一個線上 CPU。
無法中斷板連線
即使在取消配置板後,還是可能出現無法中斷連線的情況。cfgadm 狀態會顯示把板列 為不可分離裝置的清單。當板所提供的必要硬體服務不能重置到替代的板上時,就會發 生這個問題。
I/O 板取消配置失敗
裝置在使用時無法取消配置或中斷連線。取消配置 I/O 板的失敗原因是因為板上活動 並沒有停止,或因為在活動停止後 I/O 裝置又重新活動。
裝置忙碌
在嘗試取消配置或中斷板的連線前,須先將連接 I/O 板的磁碟置於閒置的狀態下。對 使用中的裝置採取取消配置或中斷連線的動作都會失敗。
如果取消配置作業是因 I/O 板有忙碌或開放的裝置而導致失敗,該板就會只有部分取 消配置。作業序列會因裝置忙碌而停止。
要重新存取未取消配置的裝置,該板須先完全取消配置然後重新配置。
如果板上的裝置忙碌,在嘗試取消配置的動作後,系統會記錄下列的訊息:
cfgadm: Hardware specific failure: unconfigure N0.IB6: Device busy: /ssm@0,0/pci@18,700000/pci@1/SUNW,isptwo@4/sd@6,0
74 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
要繼續取消配置作業,請先卸下裝置並重試取消配置作業。在您重新配置板前,該板須 在取消配置的狀態。
I/O 裝置問題
1. 使用 fuser(1M) 指令辨識哪些程序已讓裝置開啟。
2. 請刪除 vold 常駐程式。
# /etc/init.d/volmgt stop
3. 中斷所有與欲取消配置的卡有關的 SCSI 控制器之連線。
欲獲得所有連線的 SCSI 控制器之清單,請使用以下指令。
# cfgadm -l -s "select=class(scsi)"
4. 若使用 Solaris Volume Manager 鏡射的備用功能來存取連線至板上的裝置,請重新配 置子系統以方便其他主機板上的控制器存取該裝置或網路。
5. 請卸載檔案系統,包括含有主機板常駐分割區的磁碟區管理員中介裝置。
umount/partition
#
6. 從板常駐分割區中,移除磁碟區管理員資料庫。
磁碟區管理員資料庫的位置,分別由使用者明確選擇,並且可以變更。
7. 移除任何 Solaris Volume Manager Veritas Volume Manager 所使用的個人區域。
依照預設,Solaris Volume Manager 會在其所控制的每個裝置上使用個人區域,因此 在分離這些裝置前,必須先從 Solaris Volume Manager 控制中移除這類裝置。
8. 移除交換配置中的磁碟分割區。
9. 刪除任何直接開啟裝置或原始分割區的程序,或引導程序去關閉板上已開啟的裝置。
備註 – 卸載檔案系統可能會影響 NFS 用戶端系統。
附錄 B 疑難排解 75
RPCTCP 逾時,或失去連線
預設逾時為兩分鐘後。管理員可能需要增加逾時值以防止在 DR 引起的作業系統靜止期 間 (通常會超過兩分鐘) 出現逾時現象。系統靜止會讓系統和相關網路服務超過兩分鐘 無法作業。這些變化會影響用戶端與伺服器機器。
配置作業失敗
記憶體配置錯誤 (僅適用於中階)
配置記憶體前,主機板上的所有 CPU 都須先配置。若您在一或數個 CPU 取消配置的 情形下,嘗試配置記憶體,系統就會出現下列的錯誤訊息:
cfgadm: Hardware specific failure: configure N0.SB2::memory: Can’t config memory if not all cpus are online: /ssm@0,0/memory-
controller
I/O 板配置失敗
配置作業可能因附有裝置的 I/O 板目前並不支援熱插式而失敗。在此情況下,該板只 有部分配置。作業會因裝置不支援而停止。在此情況下,在配置之前,須讓該板回到取 消配置狀態。系統會記錄訊息,例如:
cfgadm: Hardware specific failure: configure N0.IB6: Unsafe dr iver present: <device path>
欲繼續配置作業,請將不支援裝置的驅動程式移除或使用支援熱插式的新版驅動程式代
替。
76 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 年 8
字彙表
ACL 高階系統中可用的元件清單,中階系統中存取控制清單。
ap_id 附接點識別碼;ap_id 指的是系統中附接點的類型和位置,而且是明確清楚的。識
別碼的類型有兩種:實體型與邏輯型。實體型識別碼包含完整指定的路徑名稱, 而邏輯型識別碼則含有速記格式。
cfgadm 指令 cfgadm Sun Fire 中階系統上動態重新配置的主要指令。欲取得該指令及其選
項的相關資訊,請參閱 cfgadm(1M)、cfgadm_sbd(1M) 及 cfgadm_pci(1M) 線上說明手冊。
DR 動態重新配置。
IP 多重路徑 (IPMP) 網際網路通訊協定 (Internet Protocol) 多重路徑。多重網路介面卡附接於系統時,
可藉由載入平衡錯誤修復的功能,維持應用程式的持續可用性。若網路配接卡發 生錯誤,而且若替代的配接卡連接到相同的 IP 連結,系統會將所有的網路存取從 故障的配接卡切換到替代的配接卡。當多重網路配接卡連接到相同的 IP 連結,任 何網路傳輸的增加會擴散到多重網路配接卡,如此可以改善網路傳輸效能。
中斷連線 系統停止監視板,而且插槽的電源關閉。此狀況中的板可拔除電源。
可分離性 裝置驅動程式支援 DDI_DETACH,而且裝置 (例如 I/O 板或 SCSI 鏈) 是以實體方
式安排,因此可以分離。
可安全暫停 當作業系統處於靜止狀態時,可安全暫停的裝置不可存取或中斷系統。若驅動程
式支援作業系統的靜止 (暫停/恢復) 功能,此驅動程式即可視為具有安全暫停的 功能。此驅動程式亦可保證:當暫停請求順利完成時,驅動程式所管理的裝置不 會嘗試存取記憶體;即使在做出暫停請求時,該裝置為開啟狀態,它也不會嘗試 存取記憶體。
可暫停 為適用於 DR,裝置驅動程式必須能夠停止使用者執行緒 (user thread)、執行
DDI_SUSPEND 呼叫、停止時鐘並停止 CPU
平台 特定的 Sun Fire 系統型號,例如 Sun Fire E6900 系統、
平台管理 Sun Fire 系統上設定網域的程序,重新配置網域間的資源,並監視每一網域的
效能。
取消配置 系統以邏輯的方式將板由作業系統中分離,並使相關的裝置驅動程式離線。環境
監視功能會繼續,但系統無法使用板上的裝置。
77
狀態 插座 (插槽) 或插卡 (板) 的作業狀態。
附接點 板及其卡片機架插槽的統稱。實體附接點說明軟體驅動程式和卡片機架插槽的位
置。邏輯附接點是由系統建立的簡稱,所指的是實體附接點。
非安全暫停 當作業系統處於靜止狀態時,非安全暫停的裝置具有記憶體存取或系統中斷的功
能。
配置 (系統) 系統已知的附接裝置集。配置更新後,系統才可使用實體裝置。作業系統指定板
的功能角色,並針對板以及板的附接裝置載入裝置的驅動程式。
配置 (板) 作業系統指定板的功能角色,並針對板以及板的附接裝置載入裝置的驅動程式。
動態重新配置 動態重新配置 (DR)
情況 附接點的作業狀況。
連接 板存在於插槽中,並透過電源相連。插槽的溫度由系統監視。
插卡 硬體資源,例如主機板或佔據 DR 插座或插槽的磁碟。
插座 此為接收器,例如板插槽或 SCSI 鏈。
實體 DR DR 作業包含實體增加或移除板。請參考 「邏輯 DR」。
網域 透過電源相連的主機板邏輯群組。網域彼此分隔且不會互動。每一網域執行各自
的作業系統版本,且各自擁有主機識別碼。
網域管理 負責連接與配置主機板以建立網域;並負責取消配置或中斷連接主機板,以便將
主機板移至不同網域,或取代故障的主機板。
熱交換 熱交換具有特殊的 DC 電源連接器與邏輯線路,可允許裝置插入,而不必關閉系
統電源。
熱插式 熱插式板與模組具有特殊的連接器,可在資料針腳建立聯繫之前,供應電源給板
或模組。系統正在運作時,沒有熱插式連接器的板和裝置將無法插入或移除。
靜止 作業系統的短暫中止,可取消配置並中斷有不可分頁記憶體 (OpenBoot
PROM/OBP) 或核心記憶體之主機板上的作業。在重要的作業階段中,背面機板
上所有的作業系統及裝置的活動必須暫停幾秒鐘。
邏輯 DR DR 作業中的硬體無法以實體的方式增加或移除。例如:錯誤的板中止後會留在
插槽中 (以避免更改冷氣流),直到有可用來置換的板為止。
78 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
索引
A
ACL, 26 ACL, 存取控制清單, 可用元件清單, 8
addboard(1M)
例子, 54 特權, 54 程序, 49 選項與運算元, 53
ADR, 4
C
cfgadm(1M)
顯示永久記憶體大小, 14
CPU
可分離性, 13
D
DCA, 65, 67 DCS, 65
DCU (網域可配置單元), 59 DDI_DETACH, 13 deleteboard(1M)
程序, 50 選項與運算元, 55
DR
I/O 板上
準備, 29
用戶端, 66 指定硬體外掛程式以及, 23 概念, 7 驅動程式, 66
DR - 非安全裝置, 16 dr.conf 檔案, 16
drmach, 66 DXS, 68
I
I/O 裝置
可分離性, 13 可安全暫停, 16 在執行 DR 作業之前, 29 重新配置, 17
ifconfig(1M), 20 IOSRAM
golden, 17
M
mount(1M), 20 moveboard(1M)
程序, 51 範例, 57 選項與運算元, 56
79
P
PCD, 68 prtdiag 指令, 25
psrinfo(1M), 29
R
rcfgadm(1M)
附接點, 57
RCM 用戶, 66
可安全暫停裝置, 16 平台配置常駐程式 (PCD), 68 未知狀況, 12, 13 正常狀況, 12, 13 永久記憶體, 13
六畫
自動式 DR, 4 自動式 DR (ADR), 4
S
showboards(1M)
系統資源, 60 程序, 47 說明, 59
showdevices(1M)
程序, 44 說明, 60
showplatform(1M)
說明, 59, 60
syseventd, 66
四畫
不可用的板狀態, 48 中斷連線作業, 20 中斷連線狀態, 11 元件
可用元件清單, 8 情況, 13
五畫
可分離性
裝置, 13
可用元件清單, 8, 26
showplatform(1M) 輸出, 47 管理模型, 67
可用的板狀態, 12
七畫
作用中的板狀態, 12 刪除板, 50 即時程序, 15 更換系統板, 52 系統事件架構, 66 系統板
更換中, 52
系統資源, 60
八畫
取消配置作業, 20 取消配置狀態, 11, 12 命令
addboard(1M), 53 deleteboard(1M), 55 moveboard(1M), 56 showboards(1M), 59 showdevices(1M), 60 showplatform(1M), 59, 60
在網域間搬移, 35 暫時取消配置, 34 熱插入, 4
板狀態
可用的, 12 作用中, 12 指定的, 12
80 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
板的狀態, 47
showboards(1M), 59
狀態
不可用, 47 可用的, 47 使用中, 47
指定的, 47 狀態模型, 47 金色 IOSRAM, 17 附接點, 57
作為運算元, 24
定義, 8 非永久記憶體, 13 非安全裝置, 16
九畫
指定的板狀態, 12 重新配置座標管理員, 4, 66
十畫
格外, 17 特權
showdevices(1M), 60
showplatform(1M), 59, 61, 62
模型, 67 記憶體
可修改之錯誤, 14
永久, 13
目標, 14
來源, 14
非永久, 13 記錄停止傾印, 15 配置, 58
狀態, 53 配置作業, 19 配置狀態, 11, 12
addboard(1M), 53
rcfgadm(1M), 58
十一畫
動態系統網域, 8 動態重新配置 (DR)
限制, 14 移動板, 51 連接作業, 19
十二畫
插槽, 8 插槽編號, 10 無法使用狀況, 12 硬體分割區, 8 程序
即時, 15
十三畫
新增板, 49 資源, 60 運算元
deleteboard(1M), 55
十四畫
實體附接點, 9 實體網域
說明, 8 疑難排解
取消配置作業, 71
配置作業失敗, 76 管理模型, 67 網域
PCD, 8
板的狀態, 48
指定插槽, 8
插槽, 8
實體, 8
說明, 8
邏輯, 8 網域 X 伺服器 (DXS), 68
索引 81
網域可配置單元 (DCU), 59 網域配置代理程式, 65 網域配置代理程式 (DCA), 67 網域配置伺服器, 65
十五畫
熱插入板, 4 複製重新命名, 14
十六畫
選項
deleteboard(1M), 55 showboards(1M), 59
錯誤狀況, 12, 13 靜止, 13, 15
十八畫
雙排記憶體模組, 14
二十一畫
驅動程式
不安全, 16
二十三畫
邏輯附接點, 10 邏輯網域, 8
82 Sun Fire 高階與中階系統動態重新配置使用者指南 • 2005 8
Loading...