Sun™ Enterprise 10000
DR 配置指南
Sun Microsystems, Inc.
4150 Network Circle
Santa Clara, CA 95054 U.S.A.
650-960-1300
文件編號﹔ 816-4659-10
2002 年 5 月,修訂版 A
請將您對本文件的意見寄至:docfeedback@sun.com
Copyright 2002 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, CA 95054 U.S.A. 版權所有。
本產品或文件按照限制其使用、複製、分發和反編譯的授權可進行分發。未經 Sun 及其授權許可頒發機構的書面授
權,不得以任何方式、任何形式複製本產品或本文件的任何部分。協力廠商軟體,包括字型技術,由Sun 供應商提供
許可和版權。
本產品的某些部分從 Berkeley BSD 系統衍生而來,經 University of California 許可授權。UNIX 是在美國和其他國家的
註冊商標,經 X/Open Company, Ltd. 獨家許可授權。
Sun、 Sun Microsystems、 Sun 標誌、 AnswerBook2、 docs.sun.com、 Solstice DiskSuite、 Sun FastEthernet、 Sun Netra、
Sun Enterprise、 Sun Enterprise Volume Manager、 Sun StorEdge、 Sun Ultra、OpenBoot、Solaris 和 UltraSparc 是 Sun
Microsystems, Inc. 在美國及其它國家的商標、註冊商標或服務標記。所有的 SPARC 商標都按授權許可使用,是
SPARC International, Inc. 在美國和其他國家的商標或註冊商標。具有 SPARC 商標的產品都基於 Sun Microsystems, Inc.
開發的架構。
OPEN LOOK 和 Sun
為電腦行業研究和開發可視或圖形使用者介面方面所作出的先行努力。Sun 以非獨佔方式從 Xerox 獲得 Xerox 圖形使
用者介面的授權許可,該授權許可涵蓋實施 OPEN LOOK GUI 且遵守 Sun 的書面許可協議的授權許可持有人。
本資料按 「現有形式」提供,不承擔明確或隱含的條件、陳述和保證,包括對特定目的或非侵害性的商業活動和適用
性的任何隱含保證,除非這種不承擔責任的聲明是不合法的。
Sun Enterprise 10000 SSP 所有權:
本軟體由 University of California 董事會、Sun Microsystems, Inc. 及其它廠商授權。除非個別檔案中已具明確之不適用
聲明,否則下列條款適用於與本軟體相關之所有檔案。
著作人謹此授權:得出於任何目的使用、重製、修改、分發本軟體與其文件資料,及為其提供授權,惟須將現有版權
聲明包含於所有複本中,且所有分發品均需逐字引述本聲明。任何業經授權之使用,均毋需提供書面同意、授權或支
付權利金。對於本軟體所進行之修改,得由著作人授權,且毋需遵照本聲明所述之許可條款,惟新條款須清楚標示於
其所適用各檔案之頁首。
任何情況下,著作人或發行商對因本軟體、其文件或任何衍生品之使用而造成的任何直接、間接、特殊、偶然或必然
之損害不承擔任何責任,即使著作人已得知此種損害的可能性。
scotty 是一種簡易的 tcl 解譯器,其中包含部分用於取得 TCP/IP 網路相關資訊的特殊指令。Copyright (c) 1993, 1994,
1995, J. Schoenwaelder, TU Braunschweig, Germany, Institute for Operating Systems and Computer Networks. 謹此許可
所有出於任何目的之免費使用、重製、修改和分發此軟體及其文件,惟所有複本中均須包含本版權聲明。 University
of Braunschweig 不對本軟體用於任何目的之適用性做任何陳述。本軟體按 「現有形式」提供,不承擔明確或隱含之
保證。
™ 圖形使用者介面是 Sun Microsystems, Inc. 為其用戶和授權許可持有人開發的。Sun 承認 Xerox 在
請回收
目錄
前言 v
在您閱讀本書之前 v
本書編排架構 v
使用 UNIX 指令 v
排印慣例 vi
Shell 提示符號 vi
相關說明文件 vii
線上存取 Sun 的文件資料 vii
Sun 歡迎您的指教 viii
1. 配置 DR 1
DR 模式 1
DR 模式 3.0 的增強功能 2
執行 DR 指令的位置 2
DR 3.0 多重路徑的需求 3
開始使用 3
裝置先決條件 3
配置足夠的領域交換空間 4
合格的協力廠商裝置驅動程式 4
iii
DR 配置作業概觀 4
▼ 若要啟動核心約束 (Kernel Cage) 5
▼ 設定網路驅動程式的永久驅動程式參數 6
▼ 啟動 soc 與 pln 驅動程式的裝置暫停作業 6
▼ 指定非安全驅動程式清單 7
▼ 將不受支援的磁帶裝置設為可安全分離 7
準備 DR 分離作業 7
於 DR 作業期間變更配置 8
控制影響系統靜止的強制條件 8
▼ 手動暫停非安全暫停裝置 9
▼ 強制系統靜止 10
目標記憶體限制 10
處理器 10
網路裝置 11
遠端 DR 通訊 11
▼ 在 Solaris 9 (DR 模式 3.0 )作業期間連接錯誤的疑難排解 11
索引 13
iv Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
前言
本指南將為您說明 Sun Enterprise 10000 伺服器「動態重新配置」(簡稱 DR )功能中的
領域端配置部分。如需有關如何使用這些功能的更多資訊,請參考列在第 vii 頁的 「相
關說明文件」中的適當文件。
在您閱讀本書之前
本指南適用於熟悉 UNIX® 系統,尤其是以 Solaris™ 作業環境為基礎的系統之 Sun
Enterprise 10000 系統管理員。 若不具備這樣的知識,您必須先閱讀本系統隨附之
Solaris 使用者文件,並考慮接受 UNIX 系統管理訓練。
《
同時請您熟閱隨附於伺服器的
》
Guide
。
TCP/IP and Data Communications Administration
本書編排架構
本指南將對於 DR 操作前後的 Sun Enterprise 10000 領域的操作方式以一章做詳細說明。
使用 UNIX 指令
本文件不包含完整的基本 UNIX 指令及程序的相關資訊,如關閉系統、啟動系統及配置
裝置等。 該項資訊請參閱隨附於系統的 Solaris 軟體文件。
v
排印慣例
字型或符號 意義 範例
AaBbCc123
AaBbCc123
AaBbCc123
指令、檔案和目錄的名稱;電
腦螢幕的輸出
輸入的內容,與電腦螢幕輸出
不同
書名、新字或專有名詞、或要
強調的文字。
使用實際名稱或值取代指令行
變數。
編輯您的 .login 檔案。
使用 ls -a 以列出所有檔案。
% You have mail.
% su
Password:
請參考
這些是類別 選項。
若要刪除某個檔案,請鍵入 rm
稱
。
Shell 提示符號
《使用者指南》
中的第六章。
檔案名
Shell
C shell
C shell 超級使用者
Bourne shell 與 Korn shell
Bourne shell 與 Korn shell 超級使用者
vi Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
提示符號
機器名稱
機器名稱
$
#
%
#
相關說明文件
適用 書名 文件號碼
》
》
》
816-3627
806-7613
806-4075
816-1420
806-4131
806-7617
806-7614
806-5230
806-5231
806-4003
806-7615
使用者
參考資訊
安裝及發行說明
《
Sun Enterprise 10000 Dynamic
Reconfiguration User Guide
《
Sun Enterprise 10000 SSP 3.5 User Guide
《
System Administration Guide: IP Services
《
Sun StorEdge Traffic Manager Software
Installation and Configuration Guide
《
Sun Enterprise 10000 InterDomain Networks
User Guide
《
Sun Enterprise 10000 Dynamic
Reconfiguration Reference Manual
《
Sun Enterprise 10000 SSP 3.5 Reference
Manual
《
Sun Enterprise 10000 IDN Configuration
Guide
《
Sun Enterprise 10000 IDN Error Messages
《
TCP/IP and Data Communications
Administration Guide
《
Sun Enterprise 10000 SSP 3.5 Installation
Guide and Release Notes
》
》
》
》
》
》
》
》
線上存取 Sun 的文件資料
部分精選之 Sun 系統說明文件位於:
http://www.sun.com/products-n-solutions/hardware/docs
完整的 Solaris 說明文件及其他主題的說明文件則位於:
http://docs.sun.com
前言 vii
Sun 歡迎您的指教
Sun 一直致力於改善相關的說明文件,因此歡迎您提出批評和建議。您可以透過電子郵
件將意見寄至 Sun :
docfeedback@sun.com
請在您電子郵件的主旨行中加入文件的編號 (816-4659-10) 。
viii Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
第一章
配置 DR
本章說明關鍵 DR 功能並指導您完成配置 DR 的作業。其中包括
■ DR 模式的資訊
■ 開始配置 DR 的詳細資訊
■ DR 配置作業概觀
■ 進行 DR 分離作業前需先完成的先決條件作業
■ 在 DR 分離作業期間發生的配置變動及如何在進行分離作業時控制某些條件之詳細
資訊
注意 – 在本文中,「DR 分離作業」指的是完整分離或移除主機板。 該分離作業可使用
ADR 指令 deleteboard (1M) 完成。 欲取得從 Solaris 9 領域 (僅支援 DR 模式 3.0 )
《
分離板的資訊,請參考
(產品編號 816-3627-10 )。
Sun Enterprise 10000 Dynamic Reconfiguration User Guide
》
DR 模式
有兩種 DR 模式可用於 Sun Enterprise 10000 系統。 DR 模式 2.0 有時被稱做 「遺留
DR」 (legacy DR),而 DR 模式 3.0 則被稱為 「次世代 DR」。下表顯示使用 DR 模式 2.0
及 3.0 的 Solaris 作業環境和 SSP 軟體版本:
DR 模式 Solaris 軟體版本 SSP 軟體版本
2.0
3.0
執行 Solaris 軟體第 9 版的領域
Solaris 5.1、6、7 和 83 . 3、3.4 或 3.5
Solaris 8 10/01 和 02/02、
Solaris 9
僅
支援 DR 模式 3.0 ,並且需要 SSP 軟體 3.5 版。
僅 3.5
1
一個領域內一次只能執行一個 DR 模式。 若要檢查執行的 DR 版本,請使用 -m 選項執
行 domain_status 指令 (僅在執行 SSP 軟體 3.5 版的領域才有該選項)。 在執行任
何 DR 指令前,請確定驗證 DR 模式。 以下為一領域狀態 (1M) 輸出的範例。 DR 模式一
欄顯示已啟動的模式。
# domain_status -m
DOMAIN TYPE PLATFORM DR-MODEL OS SYSBDS
A Ultra-Enterprise-10000 all-A 2.0 5.8 2
B Ultra-Enterprise-10000 all-A 3.0 5.8 3 4
C Ultra-Enterprise-10000 all-A 2.0 5.7 5 6
D Ultra-Enterprise-10000 all-A 3.0 5.9 7
根據該輸出,領域 A 執行的是 Solaris 第 8 版軟體 (OS 5.8) ,而啟動的是 DR 模式 2.0 ;
領域 B 執行的是 Solaris 第 8 版軟體,而啟動的是 DR 模式 3.0 ;領域 C 執行的是 Solaris
第 7 版軟體 (OS 5.7) ,而啟動的是 DR 模式 2.0 ,而領域 D 執行的是 Solaris 第 9 版軟體
(OS 5.9) ,而啟動的是 DR 模式 3.0 。
每個模式中僅有某些指令可供使用。如果您要執行不受支援的指令,主控台就會出現錯
誤訊息。
警告 – 在執行 Solaris 8 10/01 作業環境的領域裡切換至 DR 3.0 前,您必須先將 SSP 軟
體升級至 3.5 版,因為 SSP 之前的版本不支援 DR 3.0 作業。
欲取得使用 DR 2.0 的相關資訊,請參閱
Reconfiguration (DR) User Guide
《
關資訊,請參閱
件編號 816-3627-10 )。
Sun Enterprise 10000 Dynamic Reconfiguration (DR) User Guide》(文
DR 模式 3.0 的增強功能
DR 3.0 模式提供以下 DR 2.0 所沒有的增強功能:
■ DR 3.0 透過 Reconfiguration Coordination Manager,對應用程式有較佳的整合架構。
■ DR 3.0 使用 IPMP 支援網路多重路徑。
執行 DR 指令的位置
您可以從兩個地方執行 DR 作業: 從系統服務處理器 (SSP) ,可使用 SSP 指令
—addboard (1M)、moveboard (1M)、deleteboard (1M)、rcfgadm (1M) 和
showdevices (1M);或從領域,可使用 cfgadm(1M) 指令。
2 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
《
Sun Enterprise 10000 Dynamic
》
(文件編號 806-7616-10 )。 欲取得使用 DR 3.0 的相
DR 3.0 多重路徑的需求
要在 DR 模式 3.0 領域上使用多重路徑,請執行 IPMP (Solaris 8 作業環境所提供的 IP
多重路徑軟體)和 MpxIO 軟體,其包含在 Solaris Kernal Update Patches 111412-02 、
111413-02 、111095-02 、111096-02 和 111097-02 之中。
開始使用
當您在領域上執行 DR 作業前,您必須
■ 熟悉在 DR 分離作業前的裝置配置,如第 3 頁的 「裝置先決條件」中的說明。
■ 檢查您的領域是否有足夠的交換空間。
如需詳細資訊,請參閱第 4 頁的 「配置足夠的領域交換空間」。
■ 有合格的協力廠商裝置驅動程式,如第 4 頁的 「合格的協力廠商裝置驅動程式」所
述。
裝置先決條件
DR 需要 DR 分離作業相關的板上裝置之驅動程式為:
■
可安全分離
或目前尚未載入
可安全分離的驅動程式支援裝置驅動程式介面 (DDI) 功能,DDI_DETACH 。此功能
提供可分離驅動程式的特定實例,而不影響正服務其他裝置的其他實例。
非安全分離
在執行 DR 分離作業前將它卸載。如需卸載非安全分離之驅動程式的詳細資訊,請
參閱第 7 頁的 「準備 DR 分離作業」。
■
可安全暫停
可安全暫停之裝置驅動程式支援在分離包含不可分頁 OBP 或核心記憶體的板期間
(暫停) Solaris 作業環境。若要執行 DR 分離作業,作業環境必須暫時停止所有
止
程序、處理器及裝置的活動以解除記憶體元件的配置。
安全暫停裝置支援 DDI_SUSPEND/DDI_RESUME 功能。此功能使裝置可以在系統靜
止期間暫停再恢復。即使裝置在暫停要求發出時為啟動狀態,驅動程式管理的裝置
仍不會嘗試存取領域中央機板 (例如,它不會存取記憶體或中斷系統)。靜止僅會
影響目標領域;而其他領域並不受影響。
如果驅動程式不支援 DDI_SUSPEND/DDI_RESUME 功能,則此裝置便會被視為是
安全暫停
離作業而需要系統靜止,則您必須手動暫停非安全暫停裝置才能使靜止作業進行。
如需詳細資訊,請參閱第 9 頁的 「手動暫停非安全暫停裝置」。
驅動程式不支援 DDI_DETACH 。如果載入非安全分離驅動程式,您必須
或關閉
因為當非安全暫停裝置啟用時,作業環境便無法靜止。如果是因為 DR 分
第一章 配置 DR 3
靜
非
注意 – 目前 Sun Microsystems 所發行的驅動程式被視為可安全暫停的有: st 、sd 、
isp 、 esp 、 fas 、 sbus 、 pci 、 pci-pci 、qfe 、和 hme (Sun FastEthernet
(NPI-FDDI);qe (Quad Ethernet);le (Lance Ethernet); SSA 驅動程式 (soc、 pln 和
ssd );以及 Sun StorEdge A5000 驅動程式 (sf 、socal 、與 ses )。 欲取得可安全暫停
和可安全分離裝置驅動程式的額外資訊,請與 Sun 服務代表人員聯絡。
™ );nf
配置足夠的領域交換空間
領域交換配置是由交換裝置和 swapfs (記憶體)所組成。領域必須有足夠的交換空
間,才能刷新可分頁記憶體。例如,如果您想要從 2 GB 的領域中移除 1 GB 的記憶體,
則根據板的種類,您將需要 1 GB 的交換空間。交換空間不足會使 DR 作業無法完成。
領域交換空間必須配置成磁碟上的多個分割區,而該磁碟則連接至由不同板所裝載的控
制器上。使用這種配置方式時,特定交換分割區便不是重要的資源,因為您可以動態新
增和刪除交換分割區 (詳細資訊請參考 swap(1M) 線上說明手冊)。
注意 – 當分離磁碟上的記憶體 (swapfs ) 或交換空間時,領域中必須保有足夠的記憶體
或交換空間,以容納目前執行的程式。
合格的協力廠商裝置驅動程式
許多協力廠商驅動程式 (向 Sun Microsystems 以外之經銷商所購得的驅動程式)都不
支援標準的 Solaris modunload (1M) 介面,此介面是用來卸載非安全暫停裝置驅動程
式。在一般作業期間,經常會發生無法呼叫驅動程式功能的情況,而有時功能會遺失或
無法正常運作。因此 Sun Microsystems 建議您,在所有協力廠商裝置的評定和安裝階段
期間,測試這些驅動程式的功能。
DR 配置作業概觀
本節說明您在 Solaris 9 領域 (僅支援 DR 模式 3.0 )上執行 DR 作業前需先完成的各種
配置作業。請注意您不需執行本節中所敘述的所有作業,只要視您主機板上的裝置類型
及所欲執行的 DR 作業類型而定。
在配置 DR 或變更 DR 配置以後,您都必須重新啟動您的領域。如果您要將領域重新啟
動的次數減到最少,請決定哪種配置作業適合您的 DR 環境,再執行適當的配置作業
集,然後再重新啟動您的領域。
4 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
1. 如果您要執行 DR 分離作業,請啟用核心約束 (kernel cage) ,如第 5 頁的 「若要啟動
核心約束 (Kernel Cage) 」中所述。
2. 至於裝置,請依以下執行:
■ 如果您手動設定網路配置參數,請依第 6 頁的 「設定網路驅動程式的永久驅動程
式參數」中所說明的設定參數進行。
■ 如果您有 soc 及 pln 裝置,請啟用暫停作業,如第 6 頁的「啟動 soc 與 pln 驅動程
式的裝置暫停作業」所述。
■ 如果您有非安全暫停的裝置,請在非安全驅動程式清單中指定這些裝置,該裝置
即會阻隔靜止作業的進行。
如需詳細資訊,請參閱第 7 頁的 「指定非安全驅動程式清單」。
■ 如果您有磁帶裝置,由於Sun Microsystems 不支援此類裝置,所以請將磁帶裝置設
為可安全分離。
如需詳細資訊,請參閱第 7 頁的 「將不受支援的磁帶裝置設為可安全分離」。
3. 如果您要使用多重路徑的功能,請在您的領域上配置多重路徑並在領域上執行正確
的多重路徑軟體。
4. 重新啟動領域以進行配置變更。
注意 – 在對 DR 配置進行任何變動後,您必須重新啟動該領域。如果您要將重新啟動的
次數減到最少,您可以在執行多項配置作業後再重新啟動領域。
5. 在重新啟動之後,檢視 /var/adm/messages 檔案以查看驗證 DR 配置變更的訊
息。
例如,若您啟動的是核心約束,則會產生以下訊息:
NOTICE: DR Kernel Cage is Enabled
▼ 若要啟動核心約束 (Kernel Cage)
受約束核心會將不可分頁記憶體侷限至最小數目 (通常為 1 )的主機板上。依照預設,
核心約束是停用的,以避免 DR 分離作業。如果您計劃執行 DR 分離作業,您必須使用
system (4) 變數 kernel_cage_enable 以啟動核心約束,如以下程序所示。
請注意,不論您在 kernel_cage_enable 變數中的設定為何,DR 附接或 addboard
作業是預設為啟動。
第一章 配置 DR 5
注意 – 在 Solaris 版本 7 軟體發行前,啟動 DR 的變數為 dr-max-mem 。dr-max-mem
變數不再用來啟動版本 7 的 DR 及其以後的 Solaris 軟體版本。
1. 使用文字編輯器,對領域的 /etc/system 檔案進行編輯,使 kernel_cage_enable
等於 1。
set kernel_cage_enable=1
2. 在完成所有 DR 配置作業後,請重新啟動領域,如此配置才會生效。
3. 驗證在 /var/adm/messages 檔案中的配置變更。
以下範例擷取自 messages 檔案,其中指出核心約束已啟動:
NOTICE: DR Kernel Cage is Enabled
▼ 設定網路驅動程式的永久驅動程式參數
如果您使用 ndd(1M) 指令來設定網路驅動程式的配置參數,則該參數在 DR 作業後可
能無法持續。
● 如果您要設定永久驅動程式配置參數,請在 /etc/system 檔案或在特定驅動程式的
driver.conf 檔案中設定參數。
▼ 啟動 soc 與 pln 驅動程式的裝置暫停作業
如果您的主機板包含 soc 與 pln 裝置,則執行以下步驟以將這些驅動程式設為可安全
暫停。
1. 使用文字編輯器,編輯 /etc/system 檔案,如此 pln_enable_detach_suspend
與 soc_enable_detach_suspend 變數都會設為 1 ,如以下範例所示:
set pln:pln_enable_detach_suspend=1
set soc:soc_enable_detach_suspend=1
2. 在完成所有 DR 配置作業後,請重新啟動領域,如此配置才會生效。
6 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
▼ 指定非安全驅動程式清單
藉由在 ngdr.conf 檔案中指令非安全驅動程式清單,您可以提供 Solaris 作業環境關
於系統內任何非安全暫停裝置的資訊。
當 DR 準備暫停作業環境時會讀取本清單,如此板中包含不可分頁的記憶體才能進行分
離。如果 DR 找到非安全驅動程式清單中仍有作用中的驅動程式便會中斷此項作業並傳
回錯誤訊息。此訊息指出此作用中的非安全驅動程式。您必須手動暫停該裝置,以執行
DR 作業。
1. 使用文字編輯器編輯 /platform/SUNW,Ultra-Enterprise-
10000/kernel/drv/ngdr.conf 檔案並依下面所示指定非安全暫停裝置驅動程式:
unsupported-io-drivers="
驅動程式
其中
2. 在完成所有 DR 配置作業後,請重新啟動領域,如此配置才會生效。
x 代表每個非安全暫停裝置驅動程式。
驅動程式
1","
驅動程式
2","
驅動程式
3";
▼ 將不受支援的磁帶裝置設為可安全分離
在 Solaris 9 作業環境中,Sun Microsystems 原本就支援的磁帶裝置是安全暫停及安全分
離的。如需詳細資訊,請參閱 st(7D) 線上說明以取得原始支援的磁碟機清單。如果您
所分離的主機板含有原始支援的磁帶裝置,則您可以不暫停裝置便安全地分離板。
然而,如果您想要使用 Sun Microsystems 原本未支援的磁帶裝置,您可以使用它,但應
該執行下列步驟以使其安全分離。
1. 編輯 /kernel/drv/st.conf 檔案,設定 ST_UNLOADABLE (0x0400) 旗號。如需詳
細資訊,請參考 st(7D) 線上說明手冊。
2. 在完成所有 DR 配置作業後,請重新啟動領域,如此配置才會生效。
準備 DR 分離作業
您必須依以下步驟準備 DR 分離作業用的板。雖然下列的作業清單隱含某種順序序列,
但您並不一定要嚴格遵守這個順序。以下步驟適用於包含 I/O 的板或非網路裝置。
1. 卸載檔案系統。
例如,如果您使用 Solstice DiskSuite 元裝置,您必須卸載主機板常駐分割區的元裝
置檔案系統 (例如,umount /partit )。
第一章 配置 DR 7
如果您有管理檔案系統的非安全暫停裝置,請在執行分離作業前先卸載檔案系統。
如果必須手動卸載管理檔案系統的非安全暫停裝置,請先使用 lockfs(1M) 指令鎖
住這些檔案系統再手動暫停非安全裝置。
警告 – 使用 share(1M) 公用程式來卸載共享的檔案系統,可能會影響 NFS 客戶端系
統。
2. 使用 swap (1M) 移除交換配置中的磁碟分割區。
3. 如果您要分離裝載 Sun StorEdge A3000 控制器的板,請先閒置這些控制器或使用
rm6 或 rdacutil 程式將其設為離線。
Sun StorEdge A3000 (以前稱為 RSM Array 2000 )擁有雙控制器路徑,此路徑具自
動載入平衡與自動錯誤修復功能。
4. 請執行以下步驟關閉所有非網路裝置:
■ 您可以藉由刪除執行開啟裝置或原始分割區的程序來關閉裝置的所有實例,或引
導程序關閉板上已開啟的裝置。
■ 執行 modunload(1M) 以卸載每個非安全分離或載入裝置的驅動程式。
注意 – 當您無法卸載非安全驅動程式的裝置時,您可以將包含非安全裝置的板列入黑名
單,然後再重新啟動領域。您可以稍後再移除板。如需黑名單的詳細資訊,請參閱
blacklist (1M) 線上說明。
5. 連結至板處理器的程序,可防止該板被分離。您可以使用 pbind (1M) 重新將這些程
序連結到其他處理器。
於 DR 作業期間變更配置
本節說明:
■ 如何控制在 DR 分離作業中影響系統靜止的強制條件
■ 於 DR 分離作業期間 DR 變更多項配置
控制影響系統靜止的強制條件
如果在執行含有不可分頁記憶體之板上的 DR Detach 中 Solaris 作業環境無法靜止,便
會顯示無法靜止的原因。 例如,非安全暫停裝置處於無法由作業環境使其靜止之開啟的
狀態。
8 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
因開啟非安全暫停裝置所導致的靜止失敗,即所謂的
嘗試強制靜止。導致程序無法暫停的情況,一般都是自然發生的暫時現象。您可以在靜
止成功後再重試一次作業。
當您嘗試強制靜止時,即使強制靜止的狀況依舊存在,您仍給予作業環境繼續靜止的權
限。這樣做可強制作業環境允許分離。請注意,即使可以在系統中有開啟的非安全暫停
裝置時強制繼續分離,但卻不可能在非安全分離 裝置常駐板上,且已載入驅動程式的
情況下強制分離。
注意 – 即時程序無法阻止作業環境靜止。
靜止領域最直接的方式是關閉所有非安全暫停裝置。您必須針對每個網路驅動程式執行
ifconfig (1M) 指令,並指定 down 參數,然後再一次指定 unplumb 參數 (詳細資訊
請參考 ifconfig(1M) 線上說明手冊)。
注意 – 所有網路驅動程式應該都可以解除垂直安裝。但在一般環境中卻很少測試這個動
作,因而經常導致驅動程式錯誤的情況。如果您使用 DR,Sun Microsystems 建議您在
所有非安全暫停 裝置的評定和安裝階段期間,測試這些驅動程式功能。
如果有任何非安全暫停裝置已開啟並且無法關閉,您可以手動暫停裝置,然後強制作業
環境靜止。在作業環境恢復後,您可手動恢復裝置,其說明如下。
注意 – 如果您無法使裝置暫停對領域中央機板的存取,請勿強制作業環境靜止。這樣做
可能會導致領域故障或當機。因此,請將 DR 作業延後,直到關閉非安全暫停裝置為
止。
強制情況
。你可以選擇重試作業或
▼ 手動暫停非安全暫停裝置
1. 執行以下一或多個步驟,以移除裝置的使用:
a. 刪除使用此裝置的程序以關閉裝置。
b. 要求使用者不要使用該裝置。
c. 中斷裝置的電纜連接。
例如,如果允許非同步強制輸入的裝置已開啟,則在靜止作業環境前您可以切斷其
電纜的連接,以防止資料流到達裝置,並阻止裝置存取領域中央機板。您可以在作
業環境恢復後重新連接電纜。
d. 使用 modunload (1M) 指令以卸載裝置驅動程式。
2. 再次執行 DR 作業。
3. 請執行以下步驟:
第一章 配置 DR 9
a. 使用 modload (1M) 指令重新載入裝置。
b. 重新連接裝置的電纜連接。
c. 通知使用者裝置可再度使用。
d. 重新啟動任何與裝置相關的程序。
警告 – 如果您在非安全暫停裝置發生活動期間,強制靜止作業可能會造成領域停止作
用。但是,如果領域停止作用,仍然不會影響其他在 Sun Enterprise 10000 系統上所執
行的領域。
▼ 強制系統靜止
警告 – 在使用強制選項時請小心。若欲成功強制作業環境靜止,您必須先手動靜止控
制器。不同裝置靜止的程序各不相同 (如果有的話)。裝置在作業期間必須不能傳輸任
何資料、參考記憶體或產生中斷。請務必在於產品系統上執行控制器之前,在控制器處
於開啟的狀態下,測試用以靜止控制器的所有程序。若沒有先成功靜止控制器,便使用
強制選項靜止作業環境的話,會導致領域當機和後續的重新啟動。
● 在 Solaris 9 ( DR 模式 3.0 )作業中,使用 -f 選項執行 deleteboard(1M) 或
moveboard(1M) 指令。
目標記憶體限制
當分離具不可分頁記憶體的板時,DR 會尋找替代 (目標)記憶體板,以複製不可分頁
的記憶體。
如果在複製命名作業中找不到目標板,則 deleteboard(1M) 與 moveboard(1M) 指令
會顯示以下錯誤訊息:
deleteboard: unconfigure SB2: No available memory target: dr@0:SB2::memory
moveboard: unconfigure SB2: No available memory target: dr@0:SB2::memory
處理器
啟動處理器負責維護 netcon BBSRAM 緩衝區。
10 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
在分離啟動處理器所在的板之前,DR 會指定啟動處理器角色 (role) 到另一個作用中
(線上)的處理器。
網路裝置
若板上任何網路介面符合以下條件,則分離作業會失敗。在這些情況下,分離作業將會
失敗,然後 DR 會顯示錯誤訊息。
■ 此介面是領域的主網路介面;也就是說,介面的IP 位址對應至檔案 /etc/nodename
中所含的網路介面名稱。
注意,關閉領域的主網路介面,會妨礙網路資訊名稱服務的作業,而使網路無法連
接使用應用程式,如 ftp(1) 、rsh(1) 、rcp(1) 、rlogin(1) 的遠端主機。同時 NFS
客戶端和伺服器作業也會受到影響。
■ 介面位在與系統 SSP 主機相同的子網路上;也就是說,對應 SSP 主機名稱之 IP 位址的
子網路,位在 /etc/ssphostname 中。
關閉這個介面會中斷主機與 SSP 之間的通訊。因為 DR 作業是在 SSP 上啟動的,所
以會失去分離程序的控制。請注意,/etc/ssphostname 檔案包含控制主機之 SSP
的名稱;因此,如果重新命名 SSP ,您必須手動更新 /etc/ssphostname 檔案。
警告 – 分離網路介面可能會影響 NFS 客戶端系統。
遠端 DR 通訊
Solaris 9 領域中,領域配置伺服器dcs(1M) 控制 DR 作業。
▼ 在 Solaris 9 ( DR 模式 3.0 )作業期間連接錯誤的疑難排解
1. 檢查領域。
dcs (1M) 必須配置在領域的 /etc/inetd.conf 檔案中。檔案中必須出現下列指令
行:
sun-dr stream tcp wait root /usr/lib/dcs dcs
sun-dr stream tcp6 wait root /usr/lib/dcs dcs
第一章 配置 DR 11
2. 如果 dcs 常駐程式配置在 /etc/inetd.conf ,若 dcs (1M) 目前正在執行中,請加以
清除並傳送 HUP 訊號至 inetd(1M) 常駐程式使它重新讀取 inetd.conf(4) 配置檔:
# kill -9 dcs
# kill -HUP inetd
其中 dcs
程序
程序
ID
程序
ID
ID 為 dcs(1M) 常駐程式的程序 ID ,而 inetd
程序
ID 則為 inetd(1M) 常
駐程式的程序 ID 。
3. 如果您無法啟動 dcs (1M) 的話,可以從 inetd (1M) 中檢查 /var/adm/messages 檔
案中可能的錯誤訊息。
dcs(1M) 常駐程式的可執行檔位於 /usr/lib 目錄。
4. 請從頭開始再試一次 DR 作業。
12 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
索引
A
addboard(1M), 2
C
cfgadm(1M), 2
D
dcs(1M), 11
deleteboard(1M), 2
DR
執行指令的位置 , 2
DR 模式
2.0 模式 , 1
3.0 模式 , 1
M
moveboard(1M), 2
R
rcfgadm(1M), 2
RPC 逾時 , 11
RSM 2000 和分離 , 8
S
showdevices(1M), 2
ST 無法載入旗號和磁帶裝置 , 7
Sun StorEdge
A3000 與分離 , 8
四畫
分離
RSM 2000 和分離 , 8
Sun StorEdge A3000 和分離 , 8
分離期間的可分頁記憶體和交換空間 , 4
交換空間和分離 , 4
關閉裝置 , 7
分離和處理器 , 10
手動暫停非安全暫停裝置 , 9
五畫
可分頁記憶體和交換空間,分離作業期間 , 4
可安全分離的磁帶裝置 , 7
可安全暫停驅動程式清單 , 4
失去連接 , 11
六畫
交換空間,配置分離作業 , 4
交換空間,配置各種板上的 I/O 控制器 , 4
13
多重路徑 , 3
八畫
非安全暫停的磁帶裝置 , 7
非安全暫停裝置和靜止 OS, 8
非安全暫停裝置,手動暫停 , 9
九畫
指令
addboard(1M), 2
cfgadm(1M), 2
deleteboard(1M), 2
moveboard(1M), 2
rcfgadm(1M), 2
showdevices(1M), 2
十畫
配置各種板上的交換空間 I/O 控制器 , 4
磁帶裝置,分離安全 , 7
磁帶裝置,非安全暫停 , 7
磁碟交換空間,和分離 , 4
網路驅動程式,非安全暫停 , 9
十五畫
暫停 OS 和非安全暫停裝置 , 8
暫停失敗和強制情況 , 9
暫停,可能失敗原因 , 8
十六畫
靜止 , 3
非安全暫停驅動程式 , 8
強制情況 , 9
錯誤原因 , 8
十七畫
檔案
st.conf (ST 無法載入旗號和磁帶裝置) , 7
十一畫
強制情況和靜止失敗 , 9
處理器和分離 , 10
連接,失去 , 11
十三畫
裝置
可安全分離 , 3
可安全暫停 , 3
非安全分離 , 3, 9
非安全暫停 , 3
準備分離 , 7
逾時,RPC, 11
十四畫
磁帶裝置和 ST 無法載入旗號 , 7
14 Sun Enterprise 10000 DR 配置指南 • 2002 年 5 月
二十一畫
驅動程式,可安全暫停 , 4