Copyright 2005 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, California 95054, U.S.A. 모든 권리는 저작권자의 소유입니다.
Sun Microsystems, Inc.는 본 설명서에서 사용하는 기술과 관련한 지적 재산권을 보유합니다. 특히 이러한 지적 재산권에는
http://www.sun.com에 나열된 하나 이상의 미국 특허 및 추가 특허 또는 미국 및 기타 국가에서 특허 출원중인 응용프로그램이 포함될 수 있습
니다.
본 제품 또는 설명서는 사용, 복사, 배포 및 역컴파일을 제한하는 라이센스 하에서 배포됩니다. 본 제품 또는 설명서의 어떠한 부분도 Sun 및 해당
사용권자의 사전 서면 승인 없이는 형식이나 수단에 상관없이 재생이 불가능합니다.
글꼴 기술을 포함한 타사 소프트웨어는 저작권이 등록되어 있으며 Sun 공급업체로부터 라이센스를 취득한 것입니다.
본 제품의 일부는 Berkeley BSD 시스템일 수 있으며 University of California로부터 라이센스를 취득했습니다. UNIX는 X/Open Company, Ltd.
를 통해 독점 라이센스를 취득한 미국 및 기타 국가의 등록 상표입니다.
Sun, Sun Microsystems, Sun 로고, Java, AnswerBook2, docs.sun.com 및 Solaris는 미국 및 기타 국가에서 Sun Microsystems, Inc.의 상표 또는 등
록 상표입니다.
모든 SPARC 상표는 라이센스 하에 사용되며 미국 및 기타 국가에서 SPARC International, Inc.의 상표 또는 등록 상표입니다. SPARC 상표가 부착
된 제품은 Sun Microsystems, Inc.가 개발한 아키텍처를 기반으로 합니다.
OPEN LOOK 및 Sun™ Graphical User Interface는 Sun Microsystems, Inc.가 해당 사용자 및 라이센스 소유자를 위해 개발했습니다. Sun은 컴퓨
터 업계에서 시각적 또는 그래픽 사용자 인터페이스 개념을 연구하고 개발하는 데 있어 Xerox의 선구자적 업적을 인정합니다. Sun은 Xerox
Graphical User Interface에 대한 Xerox의 비독점 라이센스를 보유하고 있으며 이 라이센스는 OPEN LOOK GUI를 구현하거나 그 외의 경우 Sun
의 서면 라이센스 계약을 준수하는 Sun의 라이센스 소유자에게도 적용됩니다.
U.S. 정부 권한—상용. 정부 사용자는 Sun Microsystems, Inc. 표준 사용권 계약과 FAR의 해당 규정 및 추가 사항의 적용을 받습니다.
본 설명서는 "있는 그대로" 제공되며 상업성, 특정 목적에 대한 적합성 또는 비침해성에 대한 모든 묵시적 보증을 포함하여 모든 명시적 또는 묵
시적 조건, 표현 및 보증에 대해 어떠한 책임도 지지 않습니다. 이러한 보증 부인은 법적으로 허용된 범위 내에서만 적용됩니다.
재활용
가능
목차
머리말 xi
본 설명서를 읽기 전에 xi
UNIX 명령어 사용 xi
표기 규약 xii
관련 문서 xii
문서, 지원 및 교육 xiii
타사 웹 사이트 xiii
사용자 의견 환영 xiv
1.사전 유지보수 1
성공을 위한 지침 1
변경 관리 2
시스템 육안 검사 2
외부 육안 검사 3
내부 육안 검사 3
문제 해결 덤프 유틸리티 4
2.진단 7
SP 기반진단 7
SP 기반진단시작방법 8
iii
메뉴옵션 10
CD 기반진단 9
CD 기반진단설치및실행9
BIOS 버전 2.2.0.0 이상 9
이전 BIOS 버전 9
CD 기반진단설치 10
옵션메뉴에서 CD 기반진단실행 10
CD 기반진단원격액세스 11
사용 가능한 진단 테스트 및 모듈 13
진단 테스트 실행 14
테스트 결과 15
출력 예제 15
테스트 결과 저장 18
SP 기반진단 18
CD 기반진단 18
테스트중지 18
3.문제해결항목 19
BIOS19
BIOS 오류또는경고이벤트 19
BIOS POST 코드 22
부팅문제 23
CMOS 클리어점퍼 23
DIMM 장애 24
ECC 오류 25
인벤토리 27
표시등, LCD, LED27
로그 파일 28
시스템 점검 오류 28
ivSun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
네트워크 연결성 30
네트워크 공유 볼륨 30
운영 체제 30
조작 패널 31
밝아짐, 판독 가능한 텍스트, 비작동 버튼 31
밝아짐, 판독 불가능한 텍스트 31
밝아짐, 텍스트 없음 31
밝아지지 않음 32
PCI 또는 PCI-X 핫플러그 32
플랫폼 OS가 부팅되지 않음 33
PPCBoot - 불량 CRC 오류 35
기본 설정 복구 35
SCSI 구성유틸리티 36
RAID 등록정보메뉴항목이비활성화됨 36
IM 볼륨이별도의 SCSI ID를사용함 36
구성 유틸리티가
디스크 선택을 비활성화함 37
서비스 프로세서 38
‘Booting SP . . . ’가 조작 패널에 표시됨 38
SP의 연속 부팅 39
부팅실패 40
SP를 통해 40
직렬 포트에 부착된 PC를 통해 41
다운그레이드 후 부팅 실패42
사용자 계정 및 설정 유지 실패 42
네트워크 공유 볼륨에 마운트43
영구 저장 장치 문제 43
SSH 스크립트가 중지함 43
업데이트 실패 44
목차v
시스템 이벤트 44
열 이동 이벤트 45
VRM 크로우바 검증 46
A.진단 테스트 결과 47
테스트 설명 47
전압 47
전압 조정 47
전압 읽기 48
테스트 결과 48
비조정 전압 통과 48
조정 전압 통과 48
전압이 제한값을 초과한 오류 49
하드웨어 오류 49
팬 49
팬 제어기 프로그래밍 50
테스트 결과 50
팬 통과 50
고속 오류 52
저속 오류 53
메모리 54
March 테스트 54
RandAddr 테스트 54
Retention 테스트 54
테스트
결과 55
메모리 테스트 통과 55
서비스 오류 56
ECC 오류 56
BIOS 설정오류 56
viSun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
NIC58
테스트결과 58
NIC 통과 58
서비스 오류 59
링크 다운 오류 59
링크 설정 불일치 오류 59
알 수 없는 링크 상태 오류 59
루프백 오류 59
쓰기 오류 60
읽기 오류 60
비교 오류 60
저장 장치 60
테스트 결과 61
저장 장치 통과 61
장치가 자가 테스트 명령을 인식할 수 없는 오류 61
장치가 자가 테스트 명령을 처리할 수 없는 오류 61
자가
테스트 오류 62
자가 테스트 손상 오류 62
플래시 메모리 62
테스트 결과 63
플래시 메모리 통과 63
시스템 열기 오류 63
시스템 읽기 오류 63
장치 액세스 오류 63
시스템 쓰기 오류 64
지우기 오류 64
매직 번호 오류 64
데이터 비교 오류 64
목차vii
LED65
테스트결과 65
LED 통과 65
장치 없음 경고 67
읽기 오류 67
쓰기 오류 67
온도 67
테스트 결과 68
온도 통과 68
판독 값이 통과된 경고 임계값을 초과함 68
장치 없음 경고 68
읽기 오류 68
판독 값이 위험 임계값을 초과한 오류 69
조작 패널 69
테스트 결과 69
OpPanel 통과 69
읽기 오류 70
쓰기 오류 70
데이터 비교 오류 70
전원 공급 장치 70
테스트 결과 71
전원 통과 71
전원 양호 오류 71
읽기 오류 72
B.시스템 이벤트 73
이벤트 세부 정보 73
C.POST 코드 95
목차viii
Phoenix BIOS의 POST 코드 95
Flash ROM의 부팅 블록 코드용 POST 코드 100
D.용어집 103
목차ix
xSun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
머리말
Sun Fire V20z 및 Sun Fire V40z 서버—문제 해결 기술 및 진단 안내서는 고객에게 발
생할 수 있는 시스템 문제에 대한 정보 및 해결책을 제공합니다. 또한 진단 테스트의 사
용 지침과 모든 시스템 이벤트에 대한 상세 설명을 포함합니다. 본 설명서는 고급 문제
해결 및 하드웨어 교체 경험을 보유한 기술자, 시스템 관리자, 인증된 서비스 제공자
(ASP) 및 사용자를
본 설명서를 읽기 전에
일부 문제 해결 절차에서는 시스템 구성요소의 제거 및 교체가 필요합니다. 따라서
다음 설명서의 안전 지침과 구성요소 제거 및 교체 절차를 검토해야 합니다.
■ Sun Fire V20z and Sun Fire V40z Servers Safety and Compliance Guide
■ Sun Fire V20z 및 Sun Fire V40z 서버 사용 설명서
대상으로합니다.
UNIX 명령어사용
이 설명서에는 시스템 종료, 시스템 부팅 및 장치 구성과 같은 기본적인 UNIX® 명령어
및 절차에 대한 정보는 포함되어 있지 않을 수 있습니다. 이러한 정보에 대해서는 다음
을 참조하여 주십시오.
xii Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 •2005년 7월
Important Safety Information for Sun
Hardware Systems
Sun Fire V20z and Sun Fire V40z
Servers—Safety and Compliance Guide
Sun Fire V20z 및 Sun Fire V40z 서버—설치
설명서
816-7190-xx
817-5251-xx
817-6145-15
적용제목부품 번호
유지보수 절차 및 기타
정보
운영 체제 설치Sun Fire V20z 및 Sun Fire V40z 서버—Linux
문제 해결 및 진단Sun Fire V20z 및 Sun Fire V40z 서버—문제
최신 정보Sun Fire V20z 및 Sun Fire V40z 서버 릴리스
서버 모델 비교Sun Fire V20z 및 Sun Fire V40z 서버 버전간의
Sun Fire V20z 및 Sun Fire V40z 서버—사용
설명서
운영 체제 설치 설명서
해결 기술 및 진단 안내서
노트
차이점
819-2917-15
817-6155-15
819-2927-11
819-2912-15
819-4305-11
문서, 지원및 교육
Sun 기능
문서
지원 및 교육
URL
http://www.sun.com/documentation/
http://www.sun.com/supportraining/
설명
PDF 및 HTML 문서 다운로드, 인쇄 문서
주문
기술 지원, 패치 다운로드, Sun 강의 정보
타사 웹 사이트
Sun은 본 설명서에서 언급된 타사 웹 사이트의 가용성에 대해 책임을 지지 않습니다.
또한 해당 사이트나 리소스를 통해 제공되는 내용, 광고, 제품 및 기타 자료에 대해 어떠
한 보증도 하지 않으며 그에 대한 책임도 지지 않습니다. 따라서 타사 웹사이트의 내용,
제품 또는 리소스의 사용으로 인해 발생한 실제 또는 주장된 손상이나 피해에 대해서도
책임을 지지 않습니다.
머리말xiii
사용자의견환영
Sun은 설명서의 내용 개선에 노력을 기울이고 있으며, 여러분의의견과제안을환영합니다. 다음사이트에여러분의의견을제출하여주십시오.
http://www.sun.com/hwdocs/feedback
아래와같이설명서의제목과문서번호를함께적어보내주시기바랍니다.
Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서, 문서번호 819-2927-12
xiv Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
1 장
사전 유지보수
주의하여 시스템을 설정하고 총괄적으로 변경 사항을 관리하며 설정된 반복되는 절차
를 고수하여 많은 문제를 방지할 수 있습니다.
성공을 위한 지침
문제를 방지하고 간단히 해결하기 위한 일부 지침이 아래에 나열되어 있습니다.
■ 사용중인 서버에 서버 위치를 나타내는 이름과 같은 일관된 명명 규칙을 사용합니다.
■ 사용중인 장치의 고유 ID 또는 이름을 사용하여 동일한 자원에 대한 경쟁의 위험을
줄입니다. 서버 설정 유틸리티를 사용하여 충돌이 발생하지 않을지 확인합니다.
■ 백업 계획을 만듭니다.
■ 데이터가 자주 변경될 경우, 백업을 자주 수행하도록 일정을 작성합니다.
■ 정보 복원 필요성에 따라 백업 라이브러리를 유지합니다.
■ 주기적으로 백업을 테스트하여 데이터가 올바르게 저장되는지 확인합니다.
■ 기업시스템 관리 도구를 사용하여 특정 프로세스를 자동화하거나 다음 정보를 수동
으로 추적합니다.
■ 하드 디스크 공간을 주기적으로 검사합니다. 각 하드 드라이브에 최소 15%의 여
유 공간이 있는지 확인합니다.
■ 기록 데이터를 유지합니다. 예를 들어, 초기 CPU 사용 레벨의 베이스라인 기록을
통해 중요 증가 사항을 인지할 수 있습니다. 문제가 발생할 경우, 베이스라인과 현
재 데이터를 비교할 수 있습니다. 사용자, 버스 및 전원 사용 비율 또한 추적 가능
합니다.
■ 예측 가능한변화를설명할 수 있도록동향분석을유지합니다. 예를들어, 마지막
아침에 CPU 사용 비율이 항상 50% 증가했다면 이는 해당 서버에 대해 정상임을
가정할 수 있습니다.
1
■ 문제해결 노트를만듭니다. 문제가발생할경우, 문제해결을위해취한조치를 기
록합니다. 기록한 정보를 사용하여 차후에 동일한 문제를 더욱 빠르게 해결할 수
있습니다. 이 정보를 통해 부품 교체 문제의 정확성을 보장할 수도 있습니다.
■ 최신 네트워크 토폴로지 맵을 액세스 가능한 위치에 보관하십시오. 이 맵을 통해
네트워크 문제를 위한 문제 해결 노력을 줄일 수 있습니다.
변경 관리
대부분의 서버 문제는 서버의 일부가 변경된 후에 발생합니다. 서버를 변경할 경우 다
음 지침을 참조하십시오.
■ 변경하기 전에 시스템 설정을 적어둡니다.
■ 발생 가능한 문제를 방지하기 위해 가능하면 한번에 한가지만 변경하십시오. 위와
같은 방법으로 제어 환경을 유지하고 문제 해결 범위를 줄일 수 있습니다.
■ 각 변경의 결과를 적어둡니다. 모든 오류 또는 정보 메시지를 포함시킵니다.
■ 새 장치를 추가하기 전에 장치 충돌이 발생하지 않을지 확인합니다.
■ 특히 타사 소프트웨어를 추가할 경우에는 버전간의 종속성이 있는지 확인합니다.
■ 서버 문제의 원인을 찾아 수정하려면 다음 정보를 수집합니다.
■ 장애 전에 발생한 이벤트
■ 하드웨어 또는 소프트웨어가 변경되거나 새로 설치되었는지 여부
■ 서버가 최근에 설치되었거나 이동되었는지 여부
■ 서버의 증상이 나타난 기간
■ 문제의 지속 기간 및 발생 빈도
■ 문제의 상태를 파악하고 현재 사용중인 구성과 환경을 기록해둔 후 다음을 수행하십
시오.
■ 시스템을 육안으로 검사합니다(아래 참조).
■ 진단 테스트를 실행합니다(7페이지의 "진단" 참조).
시스템 육안 검사
잘못 설정된 제어 장치 및 느슨하거나 잘못 연결된 케이블은 하드웨어 구성요소 문제의
일반적인 원인입니다. 시스템 문제를 조사할 때에는 모든 외부 스위치, 제어 장치 및 케이
블 연결을 가장 먼저 확인합니다. 문제가 해결되지 않는 경우 시스템 내부 하드웨어의 카
드나 케이블 커넥터 또는 장착 나사 등이 빠지지 않았는지 육안으로 검사합니다.
2Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
하드웨어 구성요소 제거 및 교체 방법은 Sun Fire V20z 및 Sun Fire V40z 서버 사용 설
명서를 참조하십시오.
참고 – 계속 진행하기전에, 시스템과함께제공된 Important Safety Information
About Sun Hardware Systems의 안전 지침을 읽어보십시오. 또한, Sun Fire V20z 및
Sun Fire V40z 서버 사용 설명서의 구성요소 제거 및 교체에 대한 지침을 검토하십시오.
SM Console의 System Status 화면을 사용하여 모든 시스템 하드웨어 구성요소 및 센서
의 상태 정보를 알아볼 수 있습니다. 이 System Status 화면은 문제가 있거나 장애 발생
으로 인해 교체되어야 할 구성요소의 검색을 단순화합니다. System Status 화면에 표시
되는 구성요소 이미지는 실제 하드웨어 구성요소 및 해당 구성요소의 대략적인 위치와
크기를 나타냅니다. 자세한 사항은 서버 관리 설명서를 참조하십시오.
1. 내부
2. 모든전원케이블을전기콘센트에서연결해제합니다. (일부서버에는두개의전원공
시스템의 육안 검사를 수행하려면 시스템의 전원을 끕니다.
급 장치와 두 개의 전원 케이블이 존재합니다. 모든 전원 공급 장치가 전원 콘센트에서
연결 해제되었는지 확인하십시오.)
주의 – 전원 공급 장치에서 AC 전원 코드를 뽑으면 시스템 접지도 함께 제거됩니다. 시스
템이 정전기 방출 손상을 받지않도록 시스템에 동일한 전압 전위를 유지해야 합니다. 시
스템 구성요소를 만지는 모든 절차와 제거 및 교체 절차 중에는 ESD 손목 띠와 같은 ESD
보호 장비를 착용하십시오.
3. 서버 덮개를 제거합니다(사용중인 서버의 사용 설명서 절차를 따르십시오).
1 장사전 유지보수3
주의 – 시스템 작업 중에 일부 구성요소가 뜨거워질 수 있습니다. 이러한 구성요소를
만지기 전에 열이 식을 때까지 기다리십시오.
4. 필요한경우구성요소를제거하고소켓이깨끗한지확인합니다.
5. 구성요소를교체한후해당구성요소가소켓또는커넥터에단단히장착되었는지확인합니다.
6. 시스템내부의모든케이블커넥터를확인하여적절한커넥터에제대로단단히부착되어있는지확인합니다.
7. 서버덮개를다시덮습니다.
8. 시스템과부착된주변장치를전원소스에
다시연결합니다.
9. 서버및부착된주변장치의전원을켭니다.
문제 해결 덤프 유틸리티
참고 – 문제 해결 덤프 유틸리티는 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리
설명서에서도 논의됩니다(명령 구문, 인수 및 반환 값 포함).
문제 해결 덤프 유틸리티(TDU)는 중요 플랫폼 OS 및 서비스 프로세서(SP) 디버그 데이
터를 캡처합니다. 본 명령을 실행하면 이 데이터가 집결되어 선택한 명령 옵션에 따라
stdout으로 전송되거나지정된
파일과 함께, TDU는 요약 로그 파일을 생성합니다. 해당 요약 로그 파일에는 TDU가 요
청된 각 정보 단위를 성공적으로 집결했는지 여부에 대한 설명이 포함되어 있습니다.
요약 로그 파일은 tar 파일에 포함되어 있습니다.
키 TDU 정의는 다음과 같습니다.
■ GPR - 범용 레지스터
■ MCR - 시스템 점검 레지스터
■ MSR - 시스템 상태 레지스터(MCR 포함)
■ SPR - 전용 레지스터
■ CSR - PCI 구성 공간 레지스터
■ TCB - K-8에서의 추적 버퍼
■ TMB - DRAM에서의 추적 버퍼(TCB)
nfs 디렉토리에 tar 형식으로 저장됩니다. 해당 로그
다음 데이터가 기본으로 캡처됩니다.
4Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
■ SST 데이터(5KB)
■ 지워지지 않은 현재 이벤트(120KB)
■ 소프트웨어 인벤토리(약 25KB)
■ 하드웨어 인벤토리(약 25KB)
■ pstore 데이터:
■ 그룹 파일(약 0.5KB)
■ 이벤트 구성 파일(evcfg, 약 4KB)
■ 보안 구성 파일(seccfg, 약 5KB)
■ 이더넷 구성 파일(netifcfg2-eth0, 약 0.2KB)
■ 서비스 프로세서의 현재 프로세스(10KB)
선택적으로 TDU는 다음 데이터를 캡처할 수 있습니다.
■ K-8 레지스터(-c|--cpuregs) - GPR, SPR, MSR, MCR 및 TCB(19KB) 포함
■ 모든 PCI 구성 레지스터(-p|--pciregs) (25KB)
■ DRAM에서의 TCB(--tmb, 기본 128KB 또는최대 1GB의사용자정의크기)
참고 – 텍스트 모드에서 TMB의 1KB 저장량은디스크의약 4K를차지합니다. 기본
TMB의 32KB 저장량은 128KB를 차지하고 TMB의 128MB 저장량은디스크공간의약
1GB를 차지합니다.
문제해결덤프유틸리티를실행하려면다음명령을사용합니다.
sp get tdulog
-f 옵션을사용하면캡처데이터가집결되어압축된 tar 파일로 SP에저장됩니다. 문제
해결 덤프 유틸리티를 실행하는 데 최대 15분이 소요될 수 있습니다. 실행이 완료되면
시스템이 메시지를 표시합니다.
모든 서버 관리 명령은 완료 시 코드를 반환합니다. 다음은 두개의 리턴 코드(ID, 요약
설명)입니다.
반환 값
NWSE_Success
NWSE_InvalidUsage 1
ID
정의
0
명령이 성공적으로 완료되었습니다.
잘못된 사용: 잘못된 매개변수 사용, 지정된 옵션이 충돌
합니다.
참고 – 리턴 코드 ID가 10진수입니다.
1 장사전 유지보수5
6Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
2 장
진단
진단은 Sun Fire V20z 서버 또는 Sun Fire V40z 서버의 하드웨어 상태를 판별하는 테스
트의 세트입니다. 서버에 포함된 진단 테스트는 플랫폼 및 SP를 검사합니다.
진단 테스트:
■ 하드웨어의 기능을 테스트 및 확인합니다. 예: "팬이 목표 속도에 도달하지 못했습니다."
■ 장치 장애를 표시 및 격리합니다. 예: "장치가 없습니다."
■ 전압 레벨 또는 SP의 읽기 및 기록 플래시 파일과 같이 다양한 하드웨어 또는 소프트
웨어 문제를 격리합니다.
■ 교체 가능한부품을판별합니다. (부품제거 및 교체에대한지침은하드웨어구성요
소 및 서비스 설명서에 포함됩니다.)
다음 방법 중 하나로 해당 진단 테스트를 실행할 수 있습니다.
■ SP 기반진단, 아래에설명, SP를통해실행
■ CD 기반진단, 9페이지에서설명, 진단 CD를통해실행
참고 – 서버에서 진단을 실행하는 동안에는 IPMI의 명령줄 인터페이스를 통해 SP와 상
호 작용하지 않습니다. 이 경우, 센서 명령으로 반환된 값은 신뢰할 수 없습니다. 진단이
로드되는 동안 실행되는 센서 명령은 이벤트 로그에 위험 이벤트로 잘못 기록될 수 있
습니다.
일부 테스트는 SP에서 실행되도록 설계되며, 기타 테스트는 플랫폼 OS에서 실행되도록
설계됩니다. 자세한 정보는 13페이지의 "진단 모듈"을 참조하십시오.
■ SP 또는 플랫폼에서 테스트를 실행할 수 있습니다. (자세한 사항은 13페이지의 "진단
모듈"에 있는 표 2-1을 참조하십시오.)
■ SP에만테스트를실행할수있습니다.
■ 원격으로 테스트를 실행할 수 있습니다.
■ NSV가 마운트된 경우, 테스트결과를외부(NSV) 장소에저장할수있습니다.
SP 설정, NSV 소프트웨어설치및구성, SSH 스크립트사용방법에대한자세한사항은
Sun Fire V20z 및 Sun Fire V40z 서버—설치 설명서를 참조하십시오. 진단 테스트의 업
데이트 방법에 대한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를
참조하십시오.
참고 – NSV의 진단버전은 SP에 설치된진단버전과동일해야합니다.
SP 기반진단시작방법
1. SP와 플랫폼 진단 테스트를 모두 활성화하려면 diags start 명령을 실행합니다. 이
명령은 플랫폼을 진단 모드로 재부팅합니다. 테스트를 실행하기 전에 최소 2-3분 정도
기다립니다.
또는
플랫폼을 재부팅하지 않고 SP 진단 테스트만 활성화하려면 diags start –n 명령을 실행
하십시오.
참고 – CD 기반 진단의 경우, -n 인수는 다음을 지정합니다. 진단과 함께 SP를 로드하
지 않습니다.
2. 해당 진단 테스트를 실행할 수 있는지 판별하려면 diags get state 명령을 실행합
니다. 해당 명령은 다음 중 하나의 상태를 반환합니다.
성공 메시지
The SP and the platform diagnostics systems are available to receive
test requests.
또는
오류 메시지
The platform diagnostics system is not available.
진단 모듈 및 해당 모듈에 포함된 테스트 유형의 표를 보려면 13페이지의 "진단 모듈"을
참조하십시오. 해당 표는 각 테스트 모듈이 SP에서 실행되는지 플랫폼에서 실행되는지
의 여부를 표시합니다.
8Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 20 05 년 7월
CD 기반진단
참고 – 이전 릴리스의 NSV(2.x.x.x 이전)에서플랫폼전용테스트를실행할 수 있습니
다. 그러나 메모리 테스트를 실행하기 위해서는 인터리빙을 비활성화해야 합니다. 이러
한 이전 릴리스의 NSV로는 CD에서 SP 테스트를 실행할 수 없습니다.
■ CD에서진단테스트를실행할수있습니다.
■ SP 또는플랫폼에서테스트를실행할수있습니다.
■ 플랫폼에서만 테스트를 실행할 수 있습니다.
■ CD를 부팅한 후, 원격으로테스트를실행할수있습니다. SSH를사용하여해당진단
테스트에 로그인하십시오.
■ USB 스틱 또는 플로피 디스크에 테스트 결과를 저장할 수 있습니다.
CD 기반 진단 설치 및 실행
기본적으로, BIOS는 진단 모드로 부팅하지 않습니다. 부팅 순서에서 CD 드라이브가
가장 처음인 경우, 시스템 부팅 시 서버에 CD가 설치되어 있으면 BIOS가 해당 CD를
감지하여 진단 모드로 재부팅합니다. 위와 같이 하려면, 아래의 지침을 참조하십시오.
BIOS 버전 2.2.0.0 이상
BIOS 버전 2.2.0.0 이상에서는진단모드로부팅하도록 BIOS를설정할수있습니다. 그
러면 부팅 시 CD가 BIOS 설정을 감지하고 필요할 경우 시스템을 진단 모드로 재부팅합
니다. 이것은 BIOS Advanced Menu의 옵션입니다. 재부팅을 방지하는 방법에 대한 자
세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—사용 설명서의 BIOS 구성 정보를
참조하십시오.
이전 BIOS 버전
사용중인 BIOS 버전이 진단 모드로 부팅할 수 없는 경우(이 정보는 부팅 시 감지됨), 시
스템은 사용자가 BIOS 설정을 구성하고 메모리 테스트를 성공적으로 실행하는 데 필요
한 몇 가지 단계를 표시합니다. (해당 설정이 잘못된 경우, 메모리 테스트가 경고를 출력
합니다.)
2 장진단 9
CD 기반진단설치
CD가 자동으로 부팅되는지 확인하려면 서버 부팅 순서 중에서 가장 먼저 CD 기반진
단을 설치해야 합니다. 부팅 순서는 BIOS Boot 메뉴에서 설정할 수 있습니다. 해당 순서
를 아래에 나타난 것과 같이 변경하십시오.
목록의 상단으로 이동시킵니다. (자세한 정보는 Sun Fire V20z 및 Sun Fire V40z 서
버 설치 설명서를 참조하십시오.)
■ 서버가 하드 디스크 드라이브에서 부팅하는 경우, HDD를 제거하십시오.
■ 서버가 PXE 서버에서 부팅하는 경우, 이더넷 케이블을 분리하십시오.
1. 다음 ISO 이미지의위치는시스템공급자에게문의하십시오.
cd_diags.iso
2. 해당 ISO 이미지를 CD로 굽습니다.
3. 해당 CD를드라이브에삽입한후플랫폼을부팅합니다. (CD 드라이브가부팅목록중가장처음에있으면자동으로수행됩니다. 이를확인하려면위의항목을참조하십시오.)
CD가 부팅될 때, 다음플랫폼 IP 주소가표시됩니다.
Welcome to CD Diagnostics <version displayed>.
Platform eth0 connected for SSH sessions at <ipaddr>
Platform eth1 connected for SSH sessions at <ipaddr>
원격으로 SSH를 사용하려는 경우 이 IP 주소를 사용할 수 있습니다. 11페이지의 "CD
기반 진단 원격 액세스"를 참조하십시오.
CD 부팅 절차가 완료되면 바로 로그인되고 CD 진단 메뉴가 화면에 표시됩니다. 테스
트 실행 및 시스템 정보 캡처 메뉴 옵션을 사용하거나 명령줄을 사용할 수 있습니다.
옵션 메뉴에서 CD 기반 진단 실행
옵션 메뉴는 전체 진단 테스트 실행 과정 및 플로피 또는 USB 저장 장치에 시스템 정보
를 캡처하는 과정을 단순화합니다.
메뉴 옵션
1. View Documentation - 이 옵션을 사용하여 설명서를 엽니다. 온라인 설명서에는
다음 내용이 설명되어 있습니다.
■ 모든 메뉴 옵션
■ 유용한 팁
■ 알려진 문제점
■ 명령줄에서 실행할 수 있는 명령
10Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ 원격 장치에서 SSH를 사용하는 지침
■ 기타 중요 정보
2. Create script run_commans.sh - 이 옵션을 사용하여 테스트를 실행하고 로그 파일
에 시스템 정보를 저장합니다. 이 옵션은 세 가지 프롬프트를 엽니다. 이 프롬프트를
선택할 경우, 스크립트가 작성되어 저장된 로그 파일과 동일한 위치에 저장됩니다.
해당 스크립트를 사용하여 여러 시스템에서 작업을 실행할 수 있습니다.
3. Run script run_commands.sh - 이 옵션을 사용하여 플로피 디스크에 저장한 스크립
트를 실행합니다.
4. Go to Command Line Interface - 이
옵션을사용하여명령줄인터페이스로이동합
니다. 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참
조하십시오.
5. Shutdown System - 이 옵션을 사용하여 진단 테스트를 종료한 후 OS를 종료합니다.
참고 – 자세한 정보를보려면View Documentation을선택하십시오.
CD 기반진단원격액세스
원격 액세스를 위해서는 플랫폼에 관리자 수준의 사용자를 미리 생성해야 합니다. 지침
을 보려면 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SSH 네트워크 액세스를 통해 CD 기반 진단 테스트를 위한 원격 명령줄 인터페이스를
사용하려면 다음을 수행하십시오.
1. 사용자로서 플랫폼 IP 주소에 SSH를 실행합니다: setup
이미 SP에 관리자 수준 사용자를 생성한 경우, 새 계정을 생성하기 위한 사용자 이름과
암호를 묻는 프롬프트가 표시됩니다. 다음을 제외한 모든 사용자 이름을 사용할 수 있
습니다.
전원 백플레인 및 전원 공급 장치가 올바르게 작동하는지
확인합니다. (모든 시스템에 대해 사용할 수 없음)
모든 온도 센서가 제대로 작동하고
온도가 지정 범위 내에
있는지 확인합니다.
파생된(시스템의 여러 VRM에서 생성) 전압 및 대량 전압
을 확인합니다.
진단 테스트 실행
참고 – 플랫폼 OS에서 진단을 실행하면, 시스템이 플로피 드라이브의 마운트를 시도하
고다음오류를반환합니다. mount : Mounting /dev/fd0 on /mnt/floppy
failed. No such device. 이오류메시지는무시해도좋습니다.
명령줄 인터페이스에서 테스트를 실행할 경우, 모든 테스트를 실행하거나 특정 모듈(팬,
메모리, 전압, 온도등)에 여러 테스트를 실행할 수 있으며 하나의 모듈에 실행할 테스트를
지정하거나 이 모든 옵션을 조합할 수 있습니다. diags run tests 명령을 실행할 때
이 옵션을 지정합니다.
■ 테스트를 개별적 또는 일괄적으로 실행합니다.
■ 모든 테스트를 실행하려면 -a 옵션을 사용합니다.
■ 하나 이상의 테스트 모듈을 실행하려면 -m 모듈 옵션을 사용합니다.
■ 하나 이상의 개별 테스트를 실행하려면 -n test_name 옵션을 사용합니다.
■ -m module 및 -n test_name 옵션을모두사용하여하나이상의테스트모듈
및 개별 테스트를 실행합니다.
예를 들어, 조작 패널 진단 모듈을 실행하려면 다음 명령을 실행합니다.
diags run tests –m oppanel
■ 테스트 모듈은 항상 이름 순서대로 실행됩니다.
■ 개별 테스트는 사용자가 명령줄에 지정한 순서대로 실행됩니다.
14Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ 테스트 통과여부에 대한 상태 메시지를 봅니다.
참고 – 테스트 시간 조절에 관한 스크립트를 작성하여 추가적인 제어가 가능합니다. 예
를 들어, 테스트를 지정된 수만큼 반복하는 쉘 스크립트를 작성할 수 있습니다. 자세한
내용은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
테스트 결과
테스트가 완료되면 상태가 반환됩니다. 테스트에서 오류를 감지하면, 소프트웨어가 오
류에 대한 세부 정보를 보고하고 제출된 나머지 테스트를 계속 실행합니다.
참고 – -v|--verbose 옵션을 지정하여 모든 테스트에 대한 세부 정보(통과 여부 포함)를
표시합니다. 예를 들어, 세부 정보에는 최대값, 공칭값 및 최소값이 포함될 수 있습니다.
모든 진단 테스트에 대해 다음 데이터가 생성됩니다.
■ 제출된 테스트 이름
■ 테스트 핸들(다른 쉘 창에서 테스트를 취소할 때 사용되는 고유 ID)
■ 테스트 결과(Passed, Failed)
■ 세부 정보(실패 세부 정보, 테스트 세부 정보등)
참고 – 모든 진단테스트의출력예를보려면 47페이지의 "진단테스트결과"를 참조하
십시오.
진단 테스트에서 식별된 구성요소를 찾으려면 SM Console의 System Status 창을 참조
하십시오. 이 창에는 대표적인 시스템 구성요소 및 관련된 센서가 표시됩니다. SM
Console에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명
서를 참조하십시오. 시스템 및 구성요소 레이블의 그림을 보려면 Sun Fire V20z 및 Sun
Fire V40z 서버—사용 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버—설치 설명서를
참조하십시오.
2 장진단 15
출력 예제
이 절에는 전원이 켜졌을 때 --verbose 인수를 사용하여 비플랫폼 모드에서 진단을
시작할 경우 반환될 수 있는 출력 결과가 포함되어 있습니다.
예:
diags start -n
platform set power state on -f
diags run tests -a -v
Submitted Test Name Test Handle
일반 출력 결과 포함:
speed.allFans 1
Results
Submitted Test Name Test Handle Test Result
speed.allFans 1 Passed
Test Details:
fan1.tach Passed
Controller: fan-ctrl
High Rated: 13000
High Actual: 13740
High Delta: +5.39%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10580
Low Actual: 11100
Low Delta: 4.69%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
fan2.tach Passed
Controller: fan-ctrl
High Rated: 13000
High Actual: 13920
High Delta: +6.61%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10718
Low Actual: 11100
Low Delta: 3.44%
Low Limits: -/+15%
Sensor: Fan 2 measured speed (ID=fan2.tach)
Component(s): Fan 2 (ID=NA)
fan3.tach Passed
Controller: fan-ctrl1
16Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
High Rated: 13000
High Actual: 13860
High Delta: +6.20%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10672
Low Actual: 11040
Low Delta: 3.33%
Low Limits: -/+15%
Sensor: Fan 3 measured speed (ID=fan3.tach)
Component(s): Fan 3 (ID=NA) fan4.tach Passed
Controller: fan-ctrl1
High Rated: 13000
High Actual: 13920
High Delta: +6.61%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10718
Low Actual: 11100
Low Delta: 3.44%
Low Limits: -/+15%
Sensor: Fan 4 measured speed (ID=fan4.tach)
Component(s): Fan 4 (ID=NA)
fan5.tach Passed
Controller: fan-ctrl2
High Rated: 13000
High Actual: 13980
High Delta: +7.01%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10765
Low Actual: 11100
Low Delta: 3.02%
Low Limits: -/+15%
Sensor: Fan 5 measured speed (ID=fan5.tach)
Component(s): Fan 5 (ID=NA)
fan6.tach Passed
Controller: fan-ctrl2
High Rated: 13000
High Actual: 14160
High Delta: +8.19%
High Limits: -10/+35%
Low Setpoint: 10010
Low Expected: 10903
Low Actual: 11340
Low Delta: 3.85%
Low Limits: -/+15%
Sensor: Fan 6 measured speed (ID=fan6.tach)
Component(s): Fan 6 (ID=NA)
2 장진단 17
테스트결과저장
SP 기반진단
SP 기반진단테스트결과를저장하려면, 출력내용을네트워크공유볼륨파일로저장
합니다. 예를 들어, diags.log1에서 실행한 모든 테스트 결과를 저장하려면 다음을 사용
합니다.
diags run tests -all > /mnt/log/diags.log1
CD 기반진단
CD 기반진단테스트결과를저장하려면 USB 스틱또는플로피드라이브를마운트하고결과를저장합니다.
■ USB 스틱을마운트하려면다음명령을사용합니다.
mount /usbstorage
참고 – 시스템에 단일 디스크 드라이브가 있을 경우에만 USB 저장 장치의 마운트가
작동합니다.
■ 플로피를 마운트하려면 이 명령을사용합니다.
mount /floppy
■ 해당 장치를 제거하려면 이 명령을 사용합니다.
umount /<usbstorage | floppy>
테스트 중지
■ 하나 이상의 개별 테스트를 취소하려면 다음 명령을 실행합니다.
diags cancel tests {-t|--test} TEST HANDLE {-a|--all}
■ 모든 테스트를 중지하려면 테스트를 시작한 쉘에서 Ctrl+C를 누릅니다.
■ 모든 진단 테스트와 세션을 종료하려면 diags terminate 명령을 실행합니다.
18Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
3 장
문제 해결 항목
이 장에는 다양한 문제점에 대한 문제 해결 지침과 참조사항이 포함되어 있습니다.
BIOS
이 절에서는 BIOS 관련 시스템 관리 이벤트의 발생 가능한 원인과 제안된 문제 해결 단
계에 대해 설명합니다.
참고 – BIOS 업데이트 방법에 대한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서
버 관리 설명서 및 SM Console Online Help를 참조하십시오. BIOS 업데이트의 문제를
해결하려면 44페이지의 "업데이트 실패"를 참조하십시오.
BIOS 오류 또는 경고 이벤트
아래 표에는 sp get events 명령에 의해 반환되는 오류가 나열되어 있습니다. 문제
의 원인 및 각 문제를 해결하기 위한 제안된 조치가 아래에 나열되어있습니다(경험 기
반의 확률 순으로 나열됨).
참고 – sp get events 명령에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z
서버—서버 관리 설명서를 참조하십시오.
19
표 3-1 BIOS 오류메시지
오류해결책 또는 참조
[CPU ID Error]
이 오류는 CPU 개정판이 일치하지 않을 경우 발생할 수 있습니다. 각 CPU의
개정판을 판별하십시오. 개정판이 동일하지 않을 경우, 개정판이 일치하는
CPU로 교체하십시오.
[Date and Time
Setting Error]
이 오류는 보통 배터리 장애를 나타냅니다. 이 문제를 해결하려면 배터리를
교체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원을 순환하여 전원
이 꺼진 상태에서 5분 후에 전원을 켭니다. 그런 다음
지 확인합니다.
[Diag Failed
Memtest]
이문제를해결하려면보고된 DIMM을교체한후재부팅하십시오. 다른
DIMM이실패할경우, DIMM을교체하고테스트를반복합니다. 동일한
DIMM이실패할경우, 전체 DIMM 세트를정상 DIMM으로교체한후테스트를다시실행합니다. 24페이지의 "DIMM 장애"를참조하십시오.
[Diagnostic Load
Failure]
[DMA Test
Failed],
SP에서플랫폼으로진단을로드하는동안로드작업이실패했습니다. 다시
시도하십시오.
매우 낮은 확률로 이 메시지가 표시되지 않을 수 있습니다. 이 메시지가 수신
될 경우, 서버를 재부팅해보십시오.
다중 HDD 시스템에서 모든 HDD가 실패할 경우 전원 공급 장치가 이 문제
의 원인일 수 있습니다. 단일 HDD 시스템에서도 이 문제의 원인은 전원 공
급 장치입니다. 그러나 아래에 나열된 다른 가능성을 점검해보십시오. HDD
데이터 케이블이 제대로
졌을 수 있습니다. 해당 커넥터가 백플레인에 단단히 연결되었는지 확인합
니다. 드라이브가 완전히 삽입되지 않았을 수 있습니다. 드라이브를 꺼내어
살펴본 후 다시 삽입하고 접합이 부드럽고 완전한지 확인합니다. 드라이브
전자 기술 또는 인터페이스에 오류가 있습니다. 가능한 경우, 드라이브를 동
일한 시스템의 다른 슬롯에 삽입하십시오. 해당 드라이브가 다른 시스템에
서 작동할 경우, 초기 문제가 발생한 서버에 해당 드라이브를 삽입합니다. 다
른 시스템에서도 이 드라이브가 실패할 경우, 가능하면 원래 시스템에 다른
드라이브를 삽입해보십시오. 교체한 드라이브가 두 번째 시스템에서 작동하
고 첫번째 시스템에서는 작동하지 않을 경우, 첫번째 시스템으로 돌아갑니
다. 두 번째 시스템에서 작동한 드라이브가 첫번째 시스템에서 작동하지 않
고 첫번째 시스템의 드라이브가 두
라이브 전자 기술 및 백플레인이 불량일 수 있습니다. 시스템을 되돌립니다.
[Flash Image
Validation Error]
BIOS Update 명령에서 사용되는 BIOS Image가 손상되었거나 BIOS 이미지
가 아닙니다(파일 이름이 잘못됨). 또는 플랫폼으로의 이미지 전송이 실패했
습니다. 해당 작업을 다시 시도하십시오. 여전히 실패할 경우, 해당 파일이
정말로 유효한 BIOS 이미지 파일인지 확인하십시오.
[Flash Process
Failure]
이 오류는 플래시
려면 플래시 칩을 교체하십시오. 문제가 지속될 경우, 해당 문제는 사용자가
해결할 수 있는 문제가 아닐 수 있습니다. 지원 센터에 문의하십시오.
오류가다시발생하는
연결되지않았거나백플레인커넥터접합이비뚤어
번째시스템에서작동하지않을경우, 드
칩에결함이있음을나타낼수있습니다. 이문제를해결하
20Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
이 오류의 가능한 원인은 다음과 같습니다. 드라이브 또는
트 블록이 없음). 사용할 부팅 장치가 BIOS 설정 부팅 설정에 존재하지 않음.
플로피 드라이브에 플로피 디스크가 남아있음. 매체가 손상됨. (하드 드라이브
에서 부팅할 경우, 드라이브 장애가 수정될 때 대개 이 문제가 발견됩니다.)
[Parity Error
(Memory)],
[Extended
BIOS가 매핑 아웃된 불량 DIMM을 보고할 수 있습니다. 이 오류 중 하나가
주기적으로 발생할 경우 메모리
및 54페이지의 "메모리"를 참조하십시오.
Memory
Tr un ca ti on ]
[Real-Time
Clock Error]
이 오류는 사우스브리지 장애, BIOS 장애, 불량 수정 또는 불량 발진기를 나
타낼 수 있습니다. BIOS를 다시 플래시하거나 배터리를 교체하면 문제가 해
결될 수 있습니다.
위오류는일반적인메모리 DIMM 오류를나타냅니다. 처음두가지오류는
RAM의 첫번째 MG 아래에서장애가발생했음을나타냅니다.
은 24페이지의 "DIMM 장애"를 참조하십시오. 진단 커널을 부팅할 수 없을
경우, 모든 DIMM을 정상 DIMM으로 교체하십시오. 위의 작업이 성공적으
로 완료되면 진단을 사용하여 불량 DIMM을 식별하십시오.
이것은 레거시 오류입니다. 이는 사우스브리지 장애 또는 BIOS 장애를 나타
낼 수 있습니다. 가장 유력한 원인은 손상된 BIOS입니다. 이를 수정하려면
BIOS를 다시 플래시하십시오.
Received [early]
fatal error from
BIOS: [Unable to
BIOS는 시스템이 보다 자세한 오류 코드를 보고하기 전에 일부 하드웨어 오
류를 감지할 수 있습니다. 정상으로 알려진 CPU가 설치되었을 경우, 지원
센터에 문의하십시오.
do anything]
매체가 비어있음(부
테스트를 실행하십시오. 7페이지의 "진단"
자세한 사항
3 장문제 해결 항목21
표 3-2 BIOS 경고메시지
경고해결책 또는 참조
[CMOS
Checksum
Failure],
[CMOS
Settings do not
match
이 문제를 해결하려면 설정을 다시 실행하고(소프트웨어 설치 및 구
성 설명서의 “BIOS 설정 유틸리티” 참조) 저장 및 종료한 후 전원을
껐다가 켭니다. 해당 오류 중 하나가 다시 발생할 경우, 배터리를 교
체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원을 순환하여
전원이 꺼진 상태에서 5분 후에 전원을 켭니다. 문제가
경우, 지원 센터에 문의하십시오.
hardware
configuration],
[CMOS
Invalid]
다시발생할
[PCI-X Slot
disabled for
8131 Errata 56]
설정중에(소프트웨어설치및구성설명서의 “BIOS 구성” 참조)
Advanced 메뉴에서카드인식을허용하는옵션을설정했는지확인
합니다. 카드로 인해 데이터 손상이 유발되지 않음을 확신하거나 위
험을 감수할 의사가 있을 때에만 이를 수행하십시오. 데이터 손상을
방지하기 위해 카드의 전원이 꺼졌습니다. 자세한 정보는 Sun Fire
릴리스 노트를 참조하십시오.
Received
warning from
BIOS: [CMOS
Battery
V20z 및 Sun Fire V40z 서버—
이 오류는 배터리 장애를 나타낼 수 있습니다. 이 문제를 해결하려면
배터리를 교체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원
을 순환하여 전원이 꺼진 상태에서 5분 후에 전원을 켭니다. 문제가
다시 발생할 경우, 지원 센터에 문의하십시오.
Failure]
BIOS POST 코드
하드웨어 또는 구성 오류가 발생하면 BIOS는 비디오 디스플레이에(있을 경우) 경고
또는 오류 메시지를 표시합니다. 그러나 심각한 일부 오류로 인해 BIOS가 비디오를
초기화하지 못하고 즉시 정지할 수 있습니다. 이러한 경우, BIOS가 실행한 마지막
POST(Power On Self Test) 작업을 판별할 수 있습니다. 포트 80에 적힌 값으로 표시
됩니다.
■ sp get port80 - 이 명령을 사용하여 마지막 포트 80 POST 코드를 검색하는 방법
은 SM Console Online Help 또는 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리
설명서를 참조하십시오.
■ 마지막 10 POST 코드 - 조작 패널을 사용하여 마지막 10 포트 80 POST 코드를 검색하
는 방법은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
■ POST 코드 및 정의 - POST 코드 및 요약 정의가 95페이지의 "POST 코드"에 나열되
어 있습니다.
22Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ BIOS 오류 또는 경고 이벤트 - 위의 절에는 자주 보고되는 POST 코드를 생성하는 문
제에 대한 정보와 문제 해결 팁이 포함되어 있습니다.
Sun Fire V20z 및 Sun Fire V40z 서버에서 보고되는 공통 POST 코드와 제안된 문제 해
결 조치가 아래 표에 나열되어 있습니다.
표 3-3 공통 POST 코드
POST 코드참조또는해결책
00
C0
28
2C
49
BIOS가 POST 코드를쓸만큼충분히실행되지않았음을나타냅니다. 이는
대개 전원 켜기 실패, 치명적 CPU 또는 치명적인 BIOS 플래시 부품 문제로
인해 발생합니다.
운영 체제가 감지되지 않음을 나타냅니다.
DIMM의 SPD를 정확히 읽지 못했음을 나타냅니다. DIMM이 불량임을 나
타낼 수 있습니다. 24페이지의 "DIMM 장애"를 참조하십시오.
주소 또는 불량 DIMM, VRM 또는 CPU에서 유발된
의 "DIMM 장애"를 참조하십시오.
PCI 구성 공간 오류 PCI 보드를 제거하여 거슬리는 보드를 찾아 순서를 바꾸
어 교체하거나, 필요할 경우 다른 상표의 보드를 사용하십시오.
데이터 오류, 24페이지
부팅 문제
플랫폼 OS와 관련된 부팅 문제에 대한 사항은 33페이지의 "플랫폼 OS가 부팅되지 않음"
을 참조하십시오. SP와 관련된 부팅 문제를 보려면 38페이지의 "서비스 프로세서"를 참조
하십시오.
CMOS 클리어 점퍼
일부 문제 해결 절차에서는 CMOS 점퍼를 제거해야 합니다. 이 절차에 대한 지침은 다
음과 같습니다.
■ Sun Fire V20z 서버에서는 CMOS 점퍼가 J110입니다.
■ Sun Fire V40z 서버에서는 CMOS 점퍼가 J125입니다.
1. 서버의전원을끕니다.
2. AC 전원코드의연결을해제하십시오. 두개의전원공급장치가있는경우모든 AC 전원코드를연결해제하십시오.
3 장문제 해결항목23
3. 사용설명서의지침에따라시스템커버를제거합니다.
4. 적절한점퍼를찾습니다. 서버를전면패널쪽으로배치합니다.
■ Sun Fire V20z 서버에서, J110은 마더보드의 좌측 전면 영역에 위치합니다.
■ Sun Fire V40z 서버에서, J125는 마더보드의 중앙 우측 영역에 위치합니다.
5. 다음부팅시 CMOS가삭제되도록점퍼를정지위치로이동(점에서멀리)합니다.
6. 시스템커버를교체한후 AC 전원을다시연결합니다.
7. 서버를재부팅하고부팅중에 F2를눌러 BIOS 설정으로들어갑니다.
8. F9를 눌러 기본값으로 설정합니다.
9. F10을 눌러 변경 사항을 저장합니다.
10. 서버전원을끄고 AC 전원
코드의연결을해제한후시스템커버를제거합니다.
11. 점퍼를다시활성위치(점에가까이)로옮겨 CMOS에서다음부팅설정을유지할수있도록합니다.
12. 시스템커버를덮고 AC 전원을다시연결한후서버를재부팅합니다.
DIMM 장애
참고 – DIMM 장애 보고를 활성화하려면 Sun Fire V20z 및 Sun Fire V40z 서버—설치
설명서에 나타난 바와 같이 시스템에 NSV 소프트웨어를 설치해야 합니다. 이 드라이버
는 NSV에서 사용 가능하지만 위의 기능을 활성화하기 위해 NSV를 SP로 마운트할 필
요는 없습니다.
시스템 장애 LED가 깜박이고 임계값을 초과한 복구 불가능한 DIMM 오류 또는 복구
가능한 오류를 식별합니다. 오류는 이벤트 로그, SM Console 및 진단 메모리 테스트에
도 보고됩니다. (DIMM 장애를 보고하는 진단의 출력 예를 보려면 25페이지의 "ECC 오
류"를 참조하십시오.) 시스템은 장애의 유형, 장애 발생 위치 및 플랫폼 운영 체제의 견
고성에 따라 계속 정상적으로 작동할
DIMM ECC 오류(복구 가능한 오류 및 복구 불가능한 오류)에 대한 IPMI SEL(System
Event Log) 기록이 생성됩니다. 오류 유형을 판별하려면 Event Data 1의 센서별 오프셋
을 검사합니다. CPU(메모리 뱅크) 및 DIMM 번호는 각각 Event Data 3 필드의 상위 니
블 및 하위 니블에 있습니다.
■ 오류를 복구할 수 없는경우, 시스템을종료한 후 DIMM을 교체합니다.
수 있습니다.
24Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ 오류를 복구할 수 있을경우, 초기 및 복구가능 DIMM 오류를제거한 후, 시스템을
모니터링하여 문제가 다시 발생하는지 판별합니다. 계속해서 복구 가능한 오류를 제
거하고 시스템을 모니터링할 수 있으나 복구 가능한 오류가 반복되면 결국 복구할
수 없는 오류가 발생할 수 있음을 유의하십시오.
참고 – Sun Fire V20z 및 Sun Fire V40z 서버—서버관리설명서의조작패널서버 메
뉴 옵션을 참조하십시오. 이 오류는 시스템 이벤트 로그에도 나타납니다. 73페이지의
"시스템이벤트"를참조하십시오.
ECC 오류
Sun Fire V20z 및 Sun Fire V40z 서버에서는 각 CPU가네 개의 DIMM을 지원할 수 있습니다.
■ 네 개의 DIMM 슬롯은각 CPU에대하여각각두개의슬롯을포함하는두개의뱅
크(뱅크 0 및뱅크 1)로그룹화됩니다.
■ DIMM은 한번에한뱅크씩일치하도록쌍으로설치해야합니다. 주어진 하나의 뱅
크의 두 DIMM은 크기, 유형 및 공급업체가 같아야 합니다.
■ 각 CPU는 두 개의 DIMM 뱅크를 지원할 수 있습니다. 각 뱅크가 일치하는 DIMM 쌍
을 포함해야 하는 반면, 뱅크 0 및 뱅크 1 사이의 DIMM 크기 및 공급업체는 일치하
지 않아도 됩니다.
메모리 DIMM의 문제 또는 ECC 오류가 로그 파일에 보고될 경우, 다음 단계를 수행합
니다.
■ 이 예제에서는 CPU0의 뱅크0에 있는 두개의 DIMM을 제거하여 슬롯 사이의 DIMM
을 서로 바꿉니다.
10. 서버의전원을켜고 DIMM 오류를유발한프로세스를실행합니다.
11. 로그파일을검토합니다. (출력예제는 56페이지의 "ECC 오류" 참조)
12. CPU0, 뱅크 0, 슬롯 0(원래의오류와반대)에오류가나타날경우, 현재슬롯0에있는
개별 DIMM과 관련된 문제입니다.
또는
해당 오류가 CPU0, 뱅크 0,
슬롯 1(원래 오류와 같이)에서 여전히 나타날 경우, 개별
DIMM과 관련된 문제가 아닙니다. 대신, CPU0 또는 CPU0에 대한 DDR VRM에 의해
발생한 문제일 수 있습니다.
13. 단일 CPU가 포함된 Sun Fire V20z 서버를 사용하고있는 경우, 더 이상 해당 문제를 독
립적으로 해결할 수 없습니다. 부품 교체가 필요할 수 있습니다.
또는
두개 이상의 CPU를 사용하는 서버의 경우, 14단계로
이동하십시오.
14. 두 CPU 사이의 메모리 VRM에 레이블을 붙인 후 서로 교체합니다.
■ 이 단계에서는 문제를 CPU0에 대한 메모리 VRM으로 격리하거나 해당 문제가 다른
원인으로 유발되었는지를 확인할 수 있습니다.
■ 이 예에서는 CPU0 및 CPU1에 대한 VRM을 제거한 다음 CPU 사이의 DDR VRM을
교체합니다.
15. 서버의전원을켜고 DIMM 오류를유발한프로세스를실행합니다.
16. 로그파일을검토합니다.
17. 이제오류가 CPU1(원래오류와관계없는 CPU)에서발생할경우, 문제는원래 CPU0
에 장착되었던 DDR VRM과 관련된 것입니다. 부품 교체가 필요할 수 있습니다.
또는
해당 오류가 CPU0, 뱅크 0, 슬롯 1(원래 오류와 같이)
에서 여전히 나타날 경우, 메모리
VRM과 관련된 문제가 아닙니다. 이는 마더보드의 CPU0으로 인한 문제일 수 있으며
부품 교체가 필요할 수 있습니다.
26Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
인벤토리
교체 가능 하드웨어 구성요소 또는 현재 소프트웨어 구성요소 및 버전을 보려면
inventory get all, inventory get hardware 및 inventory get
software 명령을사용하십시오. 위명령에대한자세한사항은 Sun Fire V20z 및 Sun
Fire V40z 서버—서버 관리 설명서를 참조하십시오.
NSV 버전 2.2 이하를사용하고동일한위치에새 NSV 버전을추가한경우,
inventory get software 명령을 [{-a|--all}] 인수와 함께 사용하면 시간이 초
과할 수 있습니다. 이러한 경우
1. 새 NSV 버전을 2.2 버전의 NSV와 다른 위치로 옮겨 압축을 풉니다.
또는
기존의 NSV를 검토한 후 더 이상 필요하지 않은 운영 체제에 대한 폴더를 삭제합니다.
2. 명령을 다시 시도합니다.
, 다음 지침을 따르십시오.
표시등, LCD, LED
표 3-4 전면 패널 표시등
문제해결책 또는 참조
위치 표시등이
깜박임
시스템 장애 LED
가 밝아짐
위치 표시등 뒤의 버튼을 누르면 위치 표시등이 밝아질 수 있습니다(또는 꺼
짐). 시스템 관리자는 위치 표시등을 켜서 특정 서버의 위치를 간단히 알아낼
수 있습니다. 깜박이는 위치 표시등은 문제를 나타내는 것이 아닙니다.
분산이 발생하면 시스템 장애 LED(시스템 점검 오류) 등이 밝아집니다. 문
제 해결 팁을 보려면
한 사항은 44페이지의 "시스템 이벤트" 및 73페이지의 "시스템 이벤트"를 참
조하십시오.
28페이지의 "시스템 점검 오류"를 참조하십시오. 자세
3 장문제 해결 항목27
표 3-4 전면 패널 표시등
문제해결책 또는 참조
플랫폼 전원 상태
표시등이 밝아지
지 않음
조작 패널 LCD가
밝아지지 않음
LCD에 "SP
booting"이 표시된후멈춤
AC에 대한 전원 연결을 확인하십시오. Sun Fire V20z 서버의경우, 후면패널의 AC 전원스위치와 AC 존재표시기를확인하십시오.
AC에 대한 전원 연결을 확인하십시오. Sun Fire V20z 서버의경우, 후면패널의 AC 전원스위치와 AC 존재표시기를확인하십시오. 또한 38페이지의
"서비스프로세서"의다양한 SP 부팅문제및해결책을
SP Reset 버튼을 사용하여 SP를 재부팅합니다. (SP Reset 버튼은 후면 패널에있습니다.)
참조하십시오.
로그 파일
사용중인 기능 및 특징에 따라 서버가 다음과 같은 로그 파일을 생성할 수 있습니다.
■ IPMI 이벤트 로그 - IPMI 기능에 대한 자세한 사항은 시스템 관리 설명서를 참조하
십시오. IPMI 로그가 가득 차면 새 항목은 거부됩니다.
■ SP 이벤트 로그 - 자세한 사항은 73페이지의 "시스템 이벤트" 및 90페이지의 "Service
Processor, ResourceAllocation"을 참조하십시오.
■ 진단 로그 파일 - 자세한 사항은 47페이지의 "진단 테스트 결과"를 참조하십시오.
■ TDU 로그파일 - 자세한사항은 4페이지의 "문제해결덤프유틸리티" 및시스템관
리 설명서를 참조하십시오.
시스템 점검 오류
이 절에서는 시스템 점검과 관련된 이벤트 및 원인에 대해 설명하며 제안된 문제 해결
단계를 제공합니다.
시스템 점검 오류가 발생할 경우, 시스템 장애 LED가 밝아집니다. 시스템 점검 오류는
ECC 오류(25페이지의 "ECC 오류" 참조) 또는 VRM Crowbar 이벤트(46페이지의
"VRM 크로우바검증" 참조)를나타냅니다. 이러한오류는시스템이벤트로그에보고됩니다(73페이지의 "시스템이벤트" 참조).
28Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 3-5 시스템 점검 오류
오류해결책 또는 참조
[Bus Unit]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
[Correctable ECC
error.]
[Detected on a
scrub.]
Error detected in
[Data Cache]
[Error IP Valid.]
이 오류는 ECC가 켜져 있을 때 메모리 ECC 오류를 나타냅니다. 25페이지
의 "ECC 오류" 및 24페이지의 "DIMM 장애"를 참조하십시오.
Raw data: <data> 이 오류는 CPU 오류 또는 메모리 오류와 함께 발생해야
합니다. 24페이지의 "DIMM 장애"를 참조하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를
체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
[Error not
corrected]
[Error occurred at
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
24페이지의 "DIMM 장애"를참조하십시오.
address
<address>.]
[Error reporting
disabled.]
[InstructionCache]
시스템 점검 기능이 꺼졌습니다. 최대 시스템 안정성을 위해 이 옵션을 켜
두십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이
체하십시오.
[Invalid bank
reached]
[Load/Store unit]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
Machine Check
error detected on
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
cpu <CPU>
[Machine Check in
Progress.]
[Misc. register
contains more
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
info.]
[North Bridge]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
[Processor state
may have been
이 오류 메시지에 포함된 특정 정보(예: 주소)가 정확하지 않을 수 있으며
문제 해결을 위해 신뢰할 수 없습니다.
corrupted]
해결하려면 CPU를교
문제를해결하려면 CPU를교
3 장문제 해결 항목29
표 3-5 시스템 점검 오류 (계속)
오류해결책 또는 참조
[Restart IP Valid.]
[Second error
detected.]
[Un-correctable
ECC error.]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교
체하십시오.
이 오류는 메모리 ECC 오류를 나타냅니다. 25페이지의 "ECC 오류" 및 24
페이지의 "DIMM 장애"를 참조하십시오.
네트워크 연결성
참고 – 네트워크 연결성에대한자세한사항은 Sun Fire V20z 및 Sun Fire V40z 서버—설
치 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 검토하십시오.
■ SP 이더넷 포트를 핑(ping)할 수 없을 경우, 조작 패널을 사용하여 IP 주소를 재설정하
십시오.
■ DHCP를 사용하고 있을 경우, DHCP 서버가 가동되었는지 확인하십시오.
네트워크 공유 볼륨
참고 – 네트워크 공유볼륨(NSV)의설치, 업그레이드 및 관리방법에대한자세한사항
은 Sun Fire V20z 및 Sun Fier V40z 서버—설치 설명서, Sun Fire V20z 및 Sun Fire
V40z 서버—서버 관리 설명서 및 SM Console Online Help를 참조하십시오. 35페이지
의 "기본 설정 복구"도 참조하십시오.
운영 체제
사용중인 서버의 운영 체제 설치 및 업데이트에 대한 사항은 Sun Fire V20z 및 Sun Fire
V40z 서버—Linux 운영체제설치설명서, 사전설치된 Solaris 10 운영체제용 Sun Fire
V20z 및 Sun Fire V40z 서버설명서또는다른운영체제공급자가제공한설명서를참조하십시오.
30Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ ECC 오류에대한사항은 25페이지의 "ECC 오류"를참조하십시오.
■ OS 부팅중지에대한사항은 24페이지의 "DIMM 장애"를참조하십시오.
조작 패널
참고 – 조작 패널및다른제어장치의사용에대한자세한사항은 Sun Fire V20z 및
Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
이 절에서는 조작 패널 LCD 디스플레이 문제의 해결 방법을 제공합니다.
밝아짐, 판독 가능한 텍스트, 비작동 버튼
LCD가 밝아져 판독 가능한 텍스트가 표시되지만 버튼은 작동하지 않을 수 있으며
DHCP 설정에문제가있을수있습니다. SP가 DHCP 서버를찾을수없을수있습니다.
1. SM Console 또는 SM 명령을 사용하여 SP 네트워크가 DHCP로 설정되었는지 확인합
니다.
2. SP를 재부팅합니다.
참고 – 이 증상을 유발한 SP 문제에 대한 해결책을 보려면 38페이지의 "서비스 프로세
서"에 설명된 SP 부팅 문제를 참조하십시오.
밝아짐, 판독 불가능한 텍스트
LCD가 밝아졌으나 텍스트를 판독할 수 없는 경우, 케이블을 점검하고 다시 장착합니다.
이 문제가 지속될 경우, 마더보드에 장애가 있을 수 있습니다. 마더보드를 교체하십시오.
밝아짐, 텍스트 없음
LCD가 밝아졌으나 텍스트가 표시되지 않을 경우, 다음 중 하나가 원인일 수 있습니다.
■ PIC 업데이트를 수행했을 경우, 이 증상은 부팅 모드가 변경되었고 SP가 부팅될 수
있기 전에 기본 값으로 재설정되어야 함을 나타냅니다. 이를 수행하는 방법은 40페
이지의 "부팅 실패" 및 42페이지의 "다운그레이드 후 부팅 실패"를 참조하십시오.
3 장문제 해결항목31
■ PPCBoot를 업데이트했을경우, 이 증상은업데이트가시스템을손상시켰음을나타
냅니다. 시스템을 교체해야 합니다.
■ PRS를 업데이트하려고시도한경우, 이 증상은해당프로세스가완료되지않아시스
템이 손상되었음을 나타냅니다. 시스템을 교체해야 합니다.
■ 어떤 업데이트도수행하지않은경우, 문제는조작패널어셈블리에의한것일 수 있
습니다. 조작 패널 어셈블리를 교체하십시오.
밝아지지 않음
27페이지의 "표시등, LCD, LED"에 나타난 바와 같이, 해당 패널이 밝아지지 않을 경우, 케
이블 연결을 확인하십시오. 모든 케이블이 단단히 장착되어있을 경우, LCD, 조작 패널 어
셈블리 또는 마더보드의 문제가 이 증상의 다른 원인일 수 있습니다.
PCI 또는 PCI-X 핫 플러그
PCI 또는 PCI-X 카드가오작동할경우, 아래의지침을따르십시오.
PCI 또는 PCI-X 핫 플러그기능을위한드라이버및 OS 지원 - PCI 또는 PCI-X 핫플러
그 기능에 문제가 있을 경우, 서버에 적절한 드라이버 및 운영 체제 지원이 존재하는지
확인하고 서버별 설명서에 나타난 요구 사항을 충족했는지 확인하십시오.
핫 플러그 슬롯 카드의 오류 - 핫 플러그 슬롯의 카드에 오류가 발생할
러그 장치를 추가 또는 제거하기 전에 AMD HotPlug Control Utility를 사용하여 슬롯
의 전원을 제거했는지 확인하십시오.
다운로드 및 설치 - 카드 제조업체의 웹사이트에서 사용중인 운영 체제에 대한 최신 펌
웨어, Option ROM(OPROM, Option BIOS) 및 장치 드라이버를 다운로드하십시오. 카
드 펌웨어를 먼저 설치하고 OPROM을 설치한 후 드라이버를 설치합니다.
OPROM 활성화 - OPROM 기반구성유틸리티를실행하기위해Ctrl-A(또는Ctrl-
또는Ctrl-S또는Ctrl-any키)를누르라는프롬프트를표시해야하는 SCSI 카드
C
를 설치했지만 부팅 시 프롬프트가 나타나지 않을 경우, OPROM이 비활성화되지 않았
는지 확인하십시오. 이 문제는 보드의 점퍼 설정으로 인한 것일 수 있습니다. 부팅 시
F2를 눌러 BIOS Setup 유틸리티를실행한후 Advanced 메뉴에서PCI
Configuration을 선택합니다. 문제의 카드에 OPROM이 활성화되어 있는지 확인하
십시오.
Expansion ROM not initialized -PCI Mass Storage Controller in slot 3
Bus:3, Device:02, Function:01
32Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
다음과 같은 오류를 수신할 수 있습니다.
경우, PCI 핫 플
이 메시지는 OPROM이 활성화되었으나 OPROM 이미지의 초기 크기가 너무 커서 표
준 OPROM 섀도우 공간에 맞지 않음을 나타냅니다. 이는 해당 카드에서 부팅할 수 없
으며 카드에 부팅 시간 설정 유틸리티가 있을 경우, 해당 기능을 사용할 수 없음을 나타
냅니다. 다른 OPROM을 비활성화하려는 경우(더 많은 OPROM 섀도우 공간의 확보를
위해), 해당 OPROM을 로드할 수 있습니다.
Advanced 메뉴에서 PCI Configuration을 선택하십시오.
이를 수행하려면 BIOS Setup 유틸리티의
참고 – BIOS 구성 정보는 Sun Fire V20z 및 Sun Fire V40z 서버—사용 설명서를 참조
하십시오.
각 OPROM 이미지는 처음 로드될 때 초기 크기를 갖지만 이 크기는 나중에 더 작은 나머
지 크기로 줄어듭니다. 처음에 더 큰 초기 크기로 카드를 로드할 경우, 추가 OPROM은 맞
지 않을 수 있습니다. 초기 크기를 판별하려면 제조업체의 설명서를 참조하십시오.
OPROM은 다음 순서로 스캔됩니다.
1. 온보드장치(비디오, NIC, SCSI)
2. 실제슬롯 1
3. 실제슬롯
4. 실제슬롯 3
5. 실제슬롯 6
6. 실제슬롯 7
7. 실제슬롯 4
8. 실제슬롯 5
2
참고 – BIOS Setup 유틸리티의 Boot 메뉴에서 부팅순서를변경할 수 있으나 OPROM
스캔의 순서는 변경할 수 없습니다.
플랫폼 OS가 부팅되지 않음
이 문제점은 케이블 연결이 느슨하거나 하드웨어가 제대로 장착되지 않은 경우에 발생
합니다. 플랫폼 OS가 부팅되지 않는 경우 다음 단계를 따르십시오.
3 장문제 해결항목33
1. AC 전원이 사용 가능하고 해당 AC 전원 코드가 서버의 전원 공급 장치 AC 커넥터에
단단히 연결되어 있는지 확인하십시오. 서버에 두 개의 전원 공급 장치가 있을 경우, 모
두 단단히 연결되어 있는지 확인합니다. 2100 서버를 사용중인 경우, 서버 후면의 AC
스위치가 “on” 위치에 있는지 확인하십시오.
2. 플랫폼이 아닌 SP에 전원이 공급되고 있는 경우, 서버의 전원을 끄고 플러그에서 AC
커넥터를
연결 해제한 후 시스템 커버를 제거하십시오. 시스템 커버 제거 방법에 대한
지침은 하드웨어 구성요소 및 서비스 설명서를 참조하십시오.
a. SCSI 신호 케이블, SCSI 전원 케이블 및 기타 내부 케이블이 단단히 연결되었는지
확인합니다.
b. DIMM, DDR VRM 및 CPU VRM이 각 슬롯에 단단히 장착되어 있는지 확인합니다.
c. 서버에서모든 PCI 옵션카드를제거합니다.
3. 시스템커버를덮고 AC 전원을다시연결한후
■ 플랫폼이 부팅되지 않을 경우, 7단계로 이동하십시오.
서버를 재부팅합니다.
또는
■ 플랫폼이 문제없이 부팅되고 2단계의 지침과 같이 PCI 옵션 카드를 제거한 경우, 4
단계로 이동합니다.
4. 서버전원을끄고 AC 전원을단절한후시스템커버를제거합니다.
5. PCI 옵션카드중하나를다시설치합니다.
6. 시스템커버를덮고 AC 전원을다시연결한후서버를재부팅합니다.
■ 플랫폼이 문제없이 부팅될 경우, 모든 PCI 옵션 카드가 다시 설치될 때까지 4단계, 5
단계 및 6단계를 반복합니다.
또는
■ 모든 PCI 옵션카드를다시설치한 후 플랫폼이부팅되지않을경우, 해당문제가 개
별 PCI 옵션 카드로 격리된 것입니다.
7. 서버의 CMOS 점퍼를 제거하십시오. 23페이지의 "CMOS 클리어 점퍼"에 나타난 절차
를 따르십시오.
8. 서버를 재부팅합니다.
■ 플랫폼이 문제없이 부팅되고 PCI 옵션 카드를 모두 제거한 경우 5, 6단계의 지침을
따라 PCI 옵션 카드를 교체하여 문제를 유발한 옵션 카드를 격리합니다.
또는
■ 플랫폼이 부팅되지않을경우, 마더보드를교체해야 할 수 있습니다.
34Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
참고 – 2.3 버전이상에서는 CMOS를삭제하도록 IPMI 부팅옵션매개변수를설정할
수 있습니다. 이로 인해 시스템 커버를 제거하지 않아도 되고 점퍼를 활성 위치에서 정
지 위치로 이동하지 않아도 됩니다.
PPCBoot - 불량 CRC 오류
이 오류 메시지는 위험 오류를 나타내지 않습니다. 이 메시지를 트리거하는 상황은 직
렬 포트를 통한 연결, 플래시 업데이트 수행 및 PPCBoot 업데이트가 완료되기 전에 SP
를 단절 또는 재설정할 경우에만 발생합니다.
“Bad CRC Error” 메시지가 표시되자마자 시스템은 필요한 환경 변수를 검색하여 적절
한 파티션에 기록합니다. PPCBoot 업데이트가 완료되기 전에 SP를 다시 설정하지 않는
한, 다음 재부팅 시
오류 메시지는 표시되지 않습니다.
기본 설정 복구
참고 – 관련 내용은 42페이지의 "사용자 계정 및 설정 유지 실패"에 포함되어 있습니다.
SP에 일반적인 문제가 발생할 경우(또는 원래 설정으로 복구하고 싶을 경우), sp
reset to default-settings 명령을사용하여선택한설정을복구할수있습니다.
참고 – 조작 패널의 LCD 버튼을사용하여기본값을복구할수도있습니다. 자세한 사
항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SP 구성파일은 /pstore 디렉토리의 영구 파일 시스템에 저장되어 있습니다. SP가 부
팅될 때 이 파일에서 기존의 구성 정보를 확인합니다. 기본적으로, sp reset to default-settings 명령이 실행된 후 60초가 지나면 SP가 재부팅됩니다. --nowait
옵션을 지정하면 바로 SP가 재부팅됩니다. 재부팅이 실행된다는 메시지가 20초마다 표
시됩니다.
sp reset to default-settings {-a|--all}
[{-c|--config}] [{-n|--network}] [{-s|--ssh}]
[{-u|--users}] [{-W|--nowait}]
3 장문제 해결항목35
예:
sp reset to default-settings {-a|--all}
--all 옵션을사용하면이벤트및 IPMI 설정(파일이즉시삭제됨)을포함한모든 SP
설정이 기본 구성으로 재설정됩니다.
참고 – IPMI 설정만재설정하려면 SP 명령을사용하지말고 IPMI 명령인 ipmi
reset을 사용하십시오. IPMI 및 모든 명령에 대한 자세한 사항은 Sun Fire V20z 및
Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SCSI 구성유틸리티
참고 – 서버에 포함된 SCSI 구성유틸리티의사용방법은 Sun fire V20z 및 Sun Fire
V40z 서버—사용설명서를참조하십시오.
RAID 등록정보메뉴항목이비활성화됨
이문제를해결하려면다음사항을확인하십시오.
■ 부팅 어댑터 목록에 어댑터가 있습니까?
■ LSI 어댑터에통합미러링펌웨어가있습니까?
■ 시스템의 각 Fusion-MPT 어댑터에 IM 볼륨이 이미 생성되어 있습니까?
■ Global Properties 화면에서 “Disable Integrated RAID”가 Yes로 설정되어 있습니까?
■ 선택된 SCSI 버스에 최소 두개의 디스크가 있습니까?
IM 볼륨이 별도의 SCSI ID를 사용함
이 상황에서, 두 개의 미러된 디스크가 포함된 IM 볼륨은 버스 밖에서 별도의 SCSI ID
를 사용하며(IM 볼륨의 모든 물리적 디스크와 IM 볼륨의 SCSI ID가 다름) 구성 유틸리
티는 볼륨 ID로 최근 정의된 ID의 디스크가 구성되도록 허용하지 않습니다.
IM 볼륨 구성에서, 별도의 SCSI ID를 사용하지 않고 동일한 볼륨 ID를 유지하도록 변경
하려면 다음을 수행하십시오.
36Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
1. RAID Properties 화면으로 이동합니다. 기본 디스크가 어떤 SCSI ID를 사용하고 있는
지, 볼륨이 어떤 SCSI ID를 사용하고 있는지 판별합니다. 또한 IM 볼륨에 있는 남은 디
스크의 SCSI ID를 판별합니다.
2. IM 볼륨디스크를 “No”로설정하고구성을저장한후볼륨을중지합니다.
3. RAID Properties 화면으로 돌아가 IM 볼륨을 다음과 같이 재구성합니다.
■ 기본 디스크는 이전과 같은 ID
■ 보조 디스크는 이전에 볼륨에서 사용한 ID
■ 핫 스페어는 이전에 보조 디스크에서 사용한 SCSI ID
4. 해당 구성을 저장하려면 Esc를 누르고 화면의 지침을 따릅니다. 이는 IM 볼륨을 생성하
고 자동 재동기화를 트리거합니다.
구성 유틸리티가 디스크 선택을 비활성화함
이 상황에서, 해당 구성 유틸리티는 디스크가 IM 볼륨에 대해 선택되도록 허용하지 않
습니다.
해당 디스크가 선택될 수 없는 이유를 판별하려면 RAID Properties 화면에서 F4를 누
르십시오. 각 디스크용 진단 코드는 Size 열에 표시됩니다. 코드 정의는 아래의 표에 나
열되어 있습니다.
표 3-6 디스크용 진단 코드
코드정의
0
1
2
3
4
5
6
7
8
상태가 양호합니다.
디스크에서 일련 번호를 읽을 수 없습니다.
디스크에 SMART 기능이 있는지 확인할 수 없습니다.
최대 디스크가 이미 볼륨에 구성되어 있습니다.
반환된 조회 데이터는 디스크가 와이드, 대기열 태그, 단절을 지원하지 않거
나 섹터 크기가 512 바이트가 아님을 표시합니다.
사용자가 장치 등록정보 화면에서 디스크에 대한 대기열 태그 또는 단절을
비활성화했습니다.
디스크의
수 있는 크기를 초과했습니다.
디스크가 선택된 기본 디스크에 포함된 파티션을 미러할 수 있을 만큼 크지
않습니다.
IM 볼륨이 존재하지 않는 동안 핫 스페어가 감지되었습니다. 핫 스페어를 제
거하고 해당 구성을 저장해야 합니다.
파티션이 이미 선택된 보조 또는 핫 스페어 디스크에 의해 미러될
3 장문제 해결 항목37
표 3-6 디스크용 진단 코드 (계속)
코드정의
9
10
11
12
13
디스크 파티션이 해당 디스크의 모든 마지막 32 섹터의 일부(16KB)를 사용합
니다. 마지막 32 섹터는 IR(Integrated RAID) 내부 프로세스에 필요합니다.
디스크 섹터 크기가 512 바이트가 아닙니다.
장치가 장치 유형과 호환되지 않습니다. 제거 불가능한 디스크여야 합니다.
핫 스페어가 너무 작아서 볼륨을 미러할 수 없습니다.
최대 디스크가 이미 볼륨에 구성되어 있습니다.
서비스 프로세서
이 절에는 SP와 관련된 문제에 대한 정보가 포함되어 있습니다.
참고 – SP 설치, 업데이트및사용방법에대한자세한사항은 Sun Fire V20z 및 Sun
Fire V40z 서버—설치 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를참조하십시오.
‘Booting SP . . . ’가 조작 패널에 표시됨
SP 이미지가손상된경우, SP는부팅에실패하고 Operator Panel LCD는계속다음메
시지를 표시합니다. ‘Booting SP.’ 몇 분동안 남아있을 경우, 오류 표시등이 깜박이
기 시작하고 SP 재설정 버튼 및 전면 버튼이 작동하지 않습니다. 이 문제의 결과로, 조
작 패널을 통해 SP에 액세스하거나 SP를 구성할 수 없으며 SP는 시스템을 모니터링 또
는 관리할 수 없습니다.
복구 작업이
1. 서버 관리 설명서의 절차에 따라 Java Update Server를 설치하십시오. 서버의 IP 주소
및 포트 번호를 기록합니다.
2. 시스템을 AC 전원으로부터분리합니다.
3. 시스템을 AC 전원에다시연결합니다. SP가부팅을시작하고다음메시지가전면패널에표시됩니다.
SP Boot: <3..2..1> secAny Key for menu
4. 3초 이내에 조작 패널의 Select(중앙) 버튼을 눌러 SP 부팅 프로세스를 방해합니다. 이
를 수행한 후 Operator Panel LCD에 다음이 표시됩니다.
38Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
필요합니다. 이 작업은 AC 전원 재설정 후 조작 패널을 통해 수행됩니다.
Menu:
Update SP?
5. Select 버튼을 눌러 업데이트 작업을 선택합니다. 조작 패널 LCD에 다음과 같이 표시
됩니다.
SP’s IP addr:
0.0.0.0
6. 시스템 관리 설명서의 절차에 따라 조작 패널의 버튼을 사용하여 SP의 IP 주소, 넷마스
크 및 게이트웨이 주소를 지정 및 입력합니다. SP의 네트워크 정보를 지정한 후 다음이
표시됩니다.
Update from IP:
0.0.0.0
7. 위의설명과같이전면패널버튼을사용하여, 1단계에서설치한 Java Update Server의
IP 주소와포트번호를지정합니다.
8. Select(중앙) 버튼으로업데이트를확인합니다.
SP 업데이트가 진행됩니다. 조작 패널 뿐만 아니라 해당 업데이트 서버의 업데이트 프
로세서를 모니터링할 수 있습니다.
참고 – 해당 업데이트서버의결과를 볼 수 없거나조작패널이‘Booting SP’상태
로 돌아갈 경우, SP는 해당 업데이트 서버에 도달할 수 없습니다. 네트워크 연결과 설정
을 확인한 후 다시 시도하십시오.
업데이트가 완료되면 SP는 완전하게 작동해야 합니다.
SP의 연속 부팅
초기화 실패는 대개 DHCP 주소 지정 또는 NSV 서버 중 하나와 관련된 네트워크 문제
로 인해 유발될 수 있습니다.
■ DHCP 및 해당 DHCP 서버가 비응답 또는 느리게 응답하도록 구성된 경우, SP 초기
화 및 PRS 칩에 의한 재설정에 많은 시간이 소요될 수 있습니다. 이러한 경우, DHCP
로 문제를 해결하거나 정적 주소 지정으로 전환하십시오.
■ 비응답 또는느리게응답하는 NSV 서버또한초기화실패를유발할 수 있습니다. 이
러한 경우, NSV 서버의 문제를 해결하거나 sp delete mount 명령을 사용하여 SP로
부터 NSV 마운트를 제거합니다.
대개 네트워크 문제 또는 일반 연결 문제(외부 액세스가 활성화될 경우)가 심박동 손실
을 유발할 수 있습니다. 또한 센서 교착 또는 응용프로그램 장애와 같은 SP의 주기적인
문제로 인해
유발될 수도 있습니다.
3 장문제 해결항목39
■ SP 네트워크 설정이 여전히 유효한지 확인(예: DHCP/정적 IP 주소)하고 만약 사용
되었다면 NSV 마운트 지점이 유효하고 사용 가능한지 확인하십시오.
■ SP를 재부팅하고 문제가 지속되는지 살펴봅니다.
■ 문제가 해결되지 않을 경우, 문제 해결을 위해 시스템 AC 전원 순환이 필요할 수있
습니다.
■ 가능할 경우, 정상 상태의 이미지에서 sp update flash all 명령을 사용하여 SP 소프
트웨어를 다시 로드해보십시오.
참고 – SP 부팅이 중지할 경우, 서버 후면 패널의 SP Reset 버튼을 누르십시오. 38페이
지의 "‘Booting SP . . . ’가 조작 패널에 표시됨"도 참조하십시오.
부팅 실패
부팅 모드가 변경되지 않았을 수 있습니다. 부팅 기본 값으로 재설정합니다. 이를 수행
하려면 우선 다음을 수행하십시오.
■ 관리자 또는 서비스 계정으로 SP에 로그인하십시오.
또는
■ PC를 직렬포트에부착합니다.
SP를 통해
1. 서버전원을끄고 AC 전원코드의연결을해제한후시스템커버를제거합니다.
2. 점퍼를 66MHz PCI-X 슬롯의끝에위치한 TH84 핀세트위에놓습니다. (필요한경우,
CMOS 점퍼인 J110 또는 J125를 이 용도로 사용하십시오.)
3. SP에 SSH 세션을설정하십시오. Sun Fire V20z 및 Sun Fire V40z 서버—설치 설명서의절차에따라필요한초기관리자계정을생성합니다.
4. 서비스레벨의계정을생성하려면다음을입력하십시오.
access add user -g service -u s -p s3
5. 서비스계정에수퍼유저로로그온하려면다음을입력합니다.
su s
6. 루트계정을활성화하려면다음을입력합니다.
sp set root on
7. 프롬프트에 대해 서비스 계정 암호와 새 루트 계정 암호를 지정합니다. 루트 계정으로
로그온하려면 $ 입력 프롬프트에 다음을 입력하십시오.
40Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
su -
8. 다음 프롬프트에 대해 5단계에서 설정한 루트 계정 암호를 지정합니다. # 입력 프롬프
트에서 다음을 입력합니다.
setenv uboot 0
9. 서버전원을끄고 AC 전원을해제한후시스템커버를제거합니다.
10. TH84 점퍼를제거합니다.
11. 시스템커버를덮고 AC 전원을다시연결한후서버의전원을켭니다.
SP 부팅이 성공하고 LCD에 적절한 텍스트가 표시되어야 합니다.
직렬 포트에 부착된 PC를 통해
1. 서버전원을끄고 AC 전원코드의연결을해제한후시스템커버를제거합니다.
2. 점퍼를 66MHz PCI-X 슬롯의끝에위치한 TH84 핀세트위에놓습니다. (필요한경우,
CMOS 점퍼인 J110 또는 J125를 이 용도로 사용하십시오.)
3. J19의 점퍼를 이동하여 SP 출력을직렬포트로설정합니다.
4. PC를 직렬 포트에 부착합니다.
5. 시스템커버를교체한후 AC 전원코드를다시연결합니다.
6. 서버의
Hit any Key to Stop Autoboot = 0.
7. 바로스페이스바를누릅니다(부팅후처음 3초이내에).
8. => 프롬프트에서다음을입력합니다.
saveenv
9. 서버전원을끄고 AC 전원코드의연결을해제한후시스템커버를제거합니다.
10. TH84 핀 세트에 놓은 점퍼를 제거합니다.
11. 시스템커버를덮고 AC 전원코드를다시연결한후서버의전원을켭니다.
SP 부팅이 성공하고 LCD에 적절한 텍스트가 표시되어야 합니다.
전원을 켭니다. Serial Power에 다음과 같은 내용이 표시됩니다.
3 장문제 해결항목41
다운그레이드후부팅실패
SP 부팅이시작된후이문제가바로발생할경우, 조작패널을사용하여플래시를업데이트합니다. 자세한사항은 Sun Fire V20z 및 Sun Fire V40z 서버—설치설명서및 Sun
Fire V20z 및 Sun Fire V40z 서버—사용 설명서를 참조하십시오.
참고 – sp update flash all 명령은 pstore 데이터를업데이트하지않습니다.
sp update flash all 명령은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설
명서에 자세히 설명되어 있습니다.
사용자 계정 및 설정 유지 실패
SP 상태 정보 유지에 사용되는 플래시 파티션의 손상은 사용자 계정 유지 및 SP 재부팅
설정 또는 AC 전원 재설정 유지의 실패를 유발할 수 있습니다. 이 문제의 결과로 각 SP
가 재부팅된 후 원하는 설정을 재설정해야 합니다. SP가 작동하고 액세스 가능하더라도
이 문제가 발생할 수 있습니다.
이 문제점을 확인하려면 SP에 로그인 후 마운트 명령을 입력하십시오.
한 항목은 나타나지 않습니다.
localhost $ mount
/dev/rd/0 on / type ext2 (rw)
none on /dev type devfs (rw)
proc on /proc type proc (rw)
localhost $
이 문제가 발생할 경우, SSH 세션을 통해 다음 복구 작업을 수행하십시오.
1. SP에 SSH 세션을 설정하십시오. 서버 관리 설명서의 절차에 따라 필요한 초기 관리자
계정을 생성합니다.
2. 서비스 레벨의 계정을 생성하려면 다음을 입력합니다.
access add user -g service -u s -p s3
3. 서비스계정에수퍼유저로로그온하려면다음을입력합니다.
su s
4. 루트계정을활성화하려면다음을입력합니다.
sp set root on
5. 서비스계정암호와새루트계정암호를지정합니다.
6. 루트계정에수퍼유저로로그온하려면다음을입력합니다.
/pstore에 대
42Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
su -
7. 5단계에서설정한루트계정암호를지정합니다.
8. SP 상태정보를포함하는플래시파티션을제거하려면다음을입력합니다.
eraseall /dev/mtd/flashfs
9. SP를 재부팅하려면 다음을 입력합니다.
sp reboot
재부팅 후, SP가 완전히 작동합니다.
네트워크 공유 볼륨에 마운트
SP 마운트를 NSV에 추가하려고 시도할 때 권한 오류가 수신될 경우, 원격 마운트가 읽
기/쓰기 권한을 허용받았는지 확인하십시오.
영구 저장 장치 문제
서버에서 사용 가능한 방법을 통해 시스템 이벤트를 모니터링할 경우, 영구 저장 장치
문제에 대한 오류 메시지를 수신할 수 있습니다. 정상 작동 중에 영구 저장 장치 영역이
가득 차는 것은 드문 경우입니다. 영구 저장 장치가 가득 차있고 루트 액세스가 이 공간
에 다른 파일을 저장하는 데 사용된 경우, 해당 저장 장치를 제거하십시오.
성 파일을 제거합니다. 예를 들어, access delete trust, access delete public key, sensor set -R 및 sp delete event를 사용하십시오.
그런 다음 구
시스템 이벤트 및 문제 해결 제안 사항을 보려면 73페이지의 "시스템 이벤트"를 참조하
십시오.
사용 가능한 모든 이벤트 모니터링 방법을 보려면 Sun Fire V20z 및 Sun Fire V40z 서
버—서버 관리 설명서를 참조하십시오.
SSH 스크립트가 중지함
스크립트의 SSH를 사용하여 콘솔 명령을 실행하면, {-W|--nowait} 옵션이 실행하려
는 명령에 대한 옵션이 아닌 SSH에 대한 매개변수로서 SSH에 적용됩니다. 해당 명령이
실행된 후 SSH가 바로 반환되도록 하려면 {-n|--no platform} 및 {-f|--forced} SSH 옵션을 {-W|--nowait} 옵션과 함께 사용하십시오.
예:
ssh -n -f manager@10.10.20.30 “platform set os state update-bios -i
48 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Actual Trim Nominal: 3.321
Actual Trim Low:: 3.237
Nominal: 3.300
Maximum Limit: 3.465
Minimum Limit: 3.135
Sensor: Bulk 3.3V S0 voltage (ID=bulk.v3_3-s0)
Component(s): Motherboard (ID=planar.vpd)
전압이 제한값을 초과한 오류
limits.bulk.v1_8-s5 46 FAILED
Failure Details:
Failure: Voltage exceeds maximum limit.
Actual: 1.932
Nominal: 1.800
Maximum Limit: 1.890
Minimum Limit: 1.710
Sensor: Bulk 1.8V S5 voltage (ID=bulk.v1_8-s5)
Component(s): Motherboard (ID=planar.vpd)
하드웨어 오류
limits.bulk.v1_8-s5 46 FAILED
Failure Details:
Failure: Unable to set voltage trim. No such
device or address.
Sensor: Bulk 1.8V S5 voltage (ID=bulk.v1_8-s5)
Component(s): Motherboard (ID=planar.vpd)
팬
이 테스트는 팬의 최대 속도가 사양 이내에 있어 해당 팬 속도가 제어될 수 있는지 확인
합니다.
부록 A진단 테스트 결과49
테스트 시작 시, 모든 팬은 완전히 켜지도록 설정됩니다. 이는 내부 제어 루프를 우회하
여 해당 팬이 최대한 빠른 속도로 움직이도록 합니다. 팬이 24초 동안 대상 속도에 고정
되면 최대 속도가 기록됩니다. 그런 다음, 팬은 낮은 속도로 돌아가도록 설정됩니다. 팬
이 24초 동안 대상 속도에 고정되면 최저 속도가 기록됩니다. 속도 값은 상위 및
한과 비교되어 테스트가 실패했는지 판별합니다.
때때로 팬은 점근적으로 설정 지점에 도달하며 요구 범위에서 약간 바깥쪽에 맴돕니
다. 직렬식 팬(팬0,1 팬2,3 팬4,5)은 다운윈드 팬(팬1,3,5)의 1000 RPM 순서로 특성에 따
른 속도 증가를 보여줍니다. 각 팬에는 +/-(+ 또는 -) 10%에 온도 및 전압 변동을 더하여
지정되는 내부 클럭이 있습니다.
하위 제
통과/실패를 결정하는
를 허용하며 최저 한계에 대해서는 -/+15%(-15에서 +15%)를 허용합니다.
허용 한계는 최고 한계에 대해 -10/+35%(-10에서 +35%)의 편차
팬 제어기 프로그래밍
팬 제어기를 조작하기 전에, 테스트는 해당 팬 제어기의 초기 상태를 저장하여 테스트
완료 후 이 초기 상태로 복구합니다.
각 제어기는 두 개의 팬(기본 및 보조)을 제어합니다. 각 팬에는 회전 당 2 펄스를 생성
하는 회전 속도계 출력이 있습니다. 마스터 팬의 회전 속도계 출력(tach0)은 제어기의
내부 제어 루프에 대한 피드백
슬레이브 팬의 속도 읽기에만 사용됩니다. 제어기는 전체 켜기 및 끄기 제어 뿐만 아니
라 Open-Loop 또는 Closed-Loop 조작을 지원합니다.
신호입니다. 슬레이브 팬의 회전 속도계 출력(tach1)은
테스트 결과
모든 테스트 결과는 Sun Fire V40z 서버에 해당됩니다. Sun Fire V20z 서버도 유사한 출
력 결과를 표시하지만 팬 그룹이 더 적습니다.
팬 통과
speed.allFans 2 Passed
Test Details:
fan1.tach Passed
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7920
High Delta: -1.01%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
50 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Low Actual: 6780
Low Delta: 10.05%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
fan2.tach Passed
Controller: fan-ctrl2
High Rated: 8000
High Actual: 8580
High Delta: +6.76%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6607
Low Actual: 7320
Low Delta: 9.75%
Low Limits: -/+15%
Sensor: Fan 2 measured speed (ID=fan2.tach)
Component(s): Fan 2 (ID=NA)
fan3.tach Passed
Controller: fan-ctrl3
High Rated: 8000
High Actual: 8100
High Delta: +1.23%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6237
Low Actual: 6900
Low Delta: 9.61%
Low Limits: -/+15%
Sensor: Fan 3 measured speed (ID=fan3.tach)
Component(s): Fan 3 (ID=NA)
fan4.tach Passed
Controller: fan-ctrl3
High Rated: 8000
High Actual: 8760
High Delta: +8.68%
부록 A진단 테스트 결과51
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6745
Low Actual: 7320
Low Delta: 7.85%
Low Limits: -/+15%
Sensor: Fan 4 measured speed (ID=fan4.tach)
Component(s): Fan 4 (ID=NA)
고속 오류
speed.allFans 1 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is excessively fast at high speed
setting; inlet air path may be obstructed.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 10900
High Delta: +36.25%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6329
Low Actual: 6900
Low Delta: 8.27%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
speed.allFans 2 FAILED
Test Details:
fan1.tach FAILED
Failure: fan1 is too fast at low setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7920
High Delta: -1.01%
52 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
Low Actual: 7200
Low Delta: 16.88%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
저속 오류
speed.allFans 1 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is too slow at low setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 8760
High Delta: +8.68%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6329
Low Actual: 5200
Low Delta: -18.46%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
speed.allFans 2 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is too slow at high setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7000
High Delta: -14.28%
부록 A진단 테스트 결과53
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
Low Actual: 6780
Low Delta: 10.05%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
메모리
메모리 테스트는 로드 가능한 커널 모듈 및 사용자 공간 구성요소로써 구현됩니다. 커
널 모듈은 대부분의 테스트를 실제로 수행하는 ioct1 기능을 구현합니다.
참고 – 2.x.x.x 이전 버전의 경우, 메모리 테스트를 실행하기 전에 BIOS 설정에서 인터
리빙이 비활성화되어 있는지 확인하십시오. 2.x.x.x 이상 버전의 경우, BIOS에서 인터리
빙을 비활성화하지 마십시오.
March 테스트
데이터는 아래에서 위로 메모리에 기록됩니다. 먼저 모든 0x0을 기록합니다. 그 다음, 0x0
을 읽고 확인하면서 0x5를 기록합니다. 0x5를 읽고 확인하면서 0x0을 기록합니다. 그 다음,
위에서 아래로 이동하며 읽기를 시작합니다. 0x0을 읽고 확인하면서 0x5를 기록합니다.
0x5를 읽고 확인하면서 0x0을 기록합니다. 그런 다음, 0x0을 읽고 확인합니다. 이 전체 프로
세스는 반복되지만 0x5는 0xa로 대체됩니다
.
RandAddr 테스트
데이터는 아래에서 시작하여 위를 향해 이동하면서 메모리에 기록됩니다. 메모리 데이
터의 위치는 주소 공간에 기록됩니다. 그런 다음, 테스트가 주소 공간에서 임의 확인을
수행합니다. 해당 공간에 주소와 동일한 데이터가 없으면 테스트는 실패합니다.
Retention 테스트
데이터는 아래에서 시작하여 위쪽으로 이동하면서 메모리에 기록됩니다. 테스트는 메
모리의 0x5와 0xa를 교대로 채워 메모리의 체커보드 레이아웃을 완료합니다. 테스트는
100ms 동안 정지한 다음 0x5 및 0xa에 대한 메모리를 읽고 확인합니다.
54 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
테스트 결과
메모리 테스트 통과
march.allDimms PF3 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
randaddr.allDimms PF4 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
retention.allDimms PF5 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
00 MCA NB STAT LOW: 85080a13 MCA NB STAT HIGH: 85080a13
Memory Configuration: Total: 7680Mb
CPU0-2560Mb CPU1-5120Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 0256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1dfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
*DIMM 2 512Mb Addr 01a0000000 - 01dfffffff Even Quad Word
DIMM 3 512Mb Addr 01a0000000 - 01dfffffff Odd Quad Word
BIOS 설정오류
march.allDimms 1 FAILED
Test Details:
Failure: Need to disable interleaving in BIOS setup before
running memory tests.
Data Comparison Failure
march.allDimms 1 FAILED
Test Details:
Failure: Data Miscompare @ Addr 0x1a0000008, CPU 1 DIMM 3
56 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Expected : [5555555555555555]
Observed : [5555555555505555]
Difference : [50000]
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
*DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
randaddr.allDimms 2 Passed
Test Details:
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
retention.allDimms 3 FAILED
Test Details:
Failure: Data Miscompare @ Addr 0x1a0000008, CPU 1 DIMM 3
Expected : [5555555555555555]
부록 A진단 테스트 결과57
Observed : [5555555555505555]
Difference : [50000]
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
*DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
NIC
NIC phyLoop 테스트는 PHY에 루프백 테스트를 수행합니다. 이를 수행하기 위해 해당 테스트는 NIC 장치드라이버에 PHY 루프백모드를설정하고증가바이트패턴
[0x00,0x01,0x02…0xff]으로 1500 바이트의데이터버퍼를초기화하여 NIC에데이터를기록합니다. 그런다음, 테스트는고정된 0xe5 패턴으로두번째버퍼를초기화하고
NIC으로부터 1500 바이트를읽습니다. 테스트는해당값으로부터기록된데이터를비
교합니다. 마지막으로, 테스트는 루프백 모드를 끕니다.
테스트 결과
NIC 통과
phyLoop.Nic.0 PF1 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
phyLoop.Nic.1 PF2 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
58 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
서비스 오류
Unable to load the driver bcm5700.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Unable to load service.
Component(s): Motherboard (ID=planar.vpd)
링크 다운 오류
The link status of the device is down.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link is down.
Component(s): Motherboard (ID=planar.vpd)
링크 설정 불일치 오류
The link status of the device is mismatched.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link setting mismatch.
Component(s): Motherboard (ID=planar.vpd)
알 수 없는 링크 상태 오류
The link status of the device is unknown.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link status unknown.
Component(s): Motherboard (ID=planar.vpd)
루프백 오류
The loopback is off.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Loopback is off.
부록 A진단 테스트 결과59
Component(s): Motherboard (ID=planar.vpd)
쓰기 오류
Unable to write to loopback device.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Write error. Tried to write <X> bytes, only
wrote <Y>.
Component(s): Motherboard (ID=planar.vpd)
읽기 오류
Unable to read the loopback device.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Read error. Tried to read <X> bytes, only read <Y>.
Component(s): Motherboard (ID=planar.vpd)
비교 오류
해당 장치의 값이 방금 기록된 것과 다릅니다. 해당 오류의 오프셋은 데이터 버퍼 앞 부
분의 16진수 오프셋입니다. 예상 및 실제 오프셋은 일치하지 않는 첫 번째 16진수 바이
트입니다.
phyLoop.Nic.1 PF2 FAILED
Failure Details:
Failure: Compare error. At offset 343 expected 43, got bc.
Component(s): Motherboard (ID=planar.vpd)
저장 장치
저장 장치 테스트는 SCSI 장치에 대해 자가 테스트 명령을 실행합니다. 자가 테스트 명
령에는 긴 형식과 짧은 형식이 있습니다. 해당 테스트의 실행 시간은 해당 장치 자체의
기능입니다.
해당 장치가 존재할 경우, 짧거나 긴 형식의 Send Diagnostic 명령이 포함된 SCSI 하위
시스템 제어 블록은 실행을 위해 SCSI 드라이버로 전달됩니다.
60 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
테스트 결과
저장 장치 통과
long.SCSI_0 PF1 Passed
Test Details:
Device: SEAGATE ST336607LC
Version: 0004
Serial number: 3JA0KJF6000073248EGM
Device type: disk
Component(s): Hard disk drive 0 (ID=NA)
장치가 자가 테스트 명령을 인식할 수 없는 오류
The device does not recognize the self-test command.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Error starting DST background short test: Illegal
Request
Component(s): Hard disk drive 1 (ID=NA)
장치가 자가 테스트 명령을 처리할 수 없는 오류
The device is unable to accept and process self-test commands. The
output includes the SCSI sense key.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: SCSI command failed: Sense Key[3]: Not Ready
Component(s): Hard disk drive 1 (ID=NA)
The following is the list of sense keys.
No Sense
Recovery Data
Not Ready
Medium Error
Hardware Error
Illegal Request
Unit Attention
부록 A진단 테스트 결과61
Data Protect
Blank Check
Vendor Specific
Copy Aborted
Volume Overflow
Miscompare
Reserved
자가 테스트 오류
자가 테스트 명령이 실패합니다. "첫 번째 오류 주소"는 공급자의 테스트에서 어떤 세그
먼트가 실패했는지 나타냅니다.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Test failed (Failing segment) Address of first
failure{0x0).
Component(s): Hard disk drive 1 (ID=NA)
자가 테스트 손상 오류
이 자가 테스트 명령은 불필요한 정보를 반환합니다.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Invalid Self-Test Results Page Returned by System.
Component(s): Hard disk drive 1 (ID=NA)
플래시 메모리
플래시 메모리 진단은 SP 플래시 메모리에 쓸 수 있는지를 검증합니다. 진단을 반복하
면 초기에 삭제된 상태(1)의 두 비트(각 칩의 한 비트씩)가 0으로 뒤집어집니다. 결국, 플
래시의 진단 영역의 "1" 비트가 모두 "사용"되어 플래시의 진단 섹터는 두 비트에 기록
하기 전에 테스트가 진행 중일 때 삭제됩니다.
62 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
테스트 결과
발생 가능한 장애의 대부분은 MTD 드라이버를 통해 쉽게 플래시 부품에 액세스하지
못하는 것과 관련이 있습니다. 이는 자주 발생하지 않으며 소프트웨어에 문제가 있을
가능성이 높습니다. 이 문제가 지속될 경우, 재조정을 위해 우선 서비스 프로세서의 전
체 플래시를 삭제한 후 다시 프로그래밍 해보십시오. 서비스 프로세서 업데이트 방법에
대한 사항은 시스템 관리 설명서를 참조하십시오.
플래시 메모리 통과
write.flash 2 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
시스템 열기 오류
읽기/쓰기 액세스를 위한 플래시 섹터를 열 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to open flash driver: <errno string>
Component(s): Motherboard (ID=planar.vpd)
시스템 읽기 오류
플래시 섹터를 읽을 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to read flash memory: <errno string>
Component(s): Motherboard (ID=planar.vpd)
장치 액세스 오류
플래시 섹터의 크기를 판별할 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Canít determine erase size of device: <errno
string>
Component(s): Motherboard (ID=planar.vpd)
부록 A진단 테스트 결과63
시스템 쓰기 오류
플래시 섹터에 쓸 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to open flash driver: <errno string>
Component(s): Motherboard (ID=planar.vpd)
지우기 오류
플래시 섹터를 지울 수 없습니다. 이 오류는 결함이 있는 부품이나 기타 하드웨어 오류
를 나타낼 수 있습니다.
write.flash 1 FAILED
Failure Details:
Failure: Erase operation failure: <errno string>
Component(s): Motherboard (ID=planar.vpd)
매직 번호 오류
플래시 예약된 파티션의 0x0 오프셋 매직 번호가 정확하지 않습니다. 예상되는 값은
0x44494147 또는 0xffffffff(지워짐)입니다. 이는 일부 프로세스가 우연히 진단 영역에 쓰
여졌음을 나타낼 수 있습니다. 서비스 프로세서를 다시 플래시하고 테스트하십시오. 서
비스 프로세서 업데이트 방법에 대한 사항은 시스템 관리 설명서를 참조하십시오.
write.flash 1 FAILED
Failure Details:
Failure: Magic number of diagnostics area incorrect,
Expected [0x44494147], Actual [0xNNNNNNNN].
Component(s): Motherboard (ID=planar.vpd)
데이터 비교 오류
플래시 섹터의 값이 방금 기록된 것과 다릅니다. 이것은 하드웨어 장애일 수 있습니다.
서비스 프로세서를 다시 플래시하고 테스트하십시오. 서비스 프로세서 업데이트 방법
에 대한 사항은 시스템 관리 설명서를 참조하십시오.
write.flash 1 FAILED
Failure Details:
Failure: Data Miscompare: Expected [0xNNNNNNNN], Actual
[0xNNNNNNNN].
64 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Component(s): Motherboard (ID=planar.vpd)
LED
해당 테스트 그룹은 LED 드라이버의 기능을 확인합니다. 테스트는 I2C로 연결된 LED
드라이버 칩의 인터레스트 비트 값을 포함하며 해당 비트 값을 반대로 하여 칩에 기록
하고 새 값을 읽습니다. 또한, 실제로 토글되었는지 확인한 후 초기 값을 다시 기록하고
해당 값이 정확한지 확인합니다. LED는 이 동작을 나타내도록 변경되지 않습니다.
테스트 결과
다음 예는 4300 서버에 적용됩니다. 2100 서버의 경우 LED 구성요소가 다르고 수가 적
지만 테스트 결과는 동일합니다. 이 예는 축약된 버전의 보고서로 구성됩니다.
LED 통과
toggleLED.allLeds 3 Passed
Test Details:
cd Passed
Sensor: CDROM Light path location LED (ID=cd.lp)
Component(s): CD ROM drive (ID=NA)
cpu0 Passed
Sensor: CPU 0 Light path location LED (ID=cpu0.lp)
Component(s): CPU 0 (ID=cpu0.vpd)
cpu0.mem0 Passed
Sensor: CPU 0 Dimm 0 Light path location LED (ID=
cpu0.mem0.lp)
Component(s): CPU 0 DIMM 0 (ID=cpu0.mem0.vpd)
cpu0.mem1 Passed
Sensor: CPU 0 Dimm 1 Light path location LED (ID=
cpu0.mem1.lp)
Component(s): CPU 0 DIMM 1 (ID=cpu0.mem1.vpd)
cpu0.mem2 Passed
Sensor: CPU 0 Dimm 2 Light path location LED (ID=
cpu0.mem2.lp)
Component(s): CPU 0 DIMM 2 (ID=cpu0.mem2.vpd)
cpu0.mem3 Passed
부록 A진단 테스트 결과65
Sensor: CPU 0 Dimm 3 Light path location LED (ID=
cpu0.mem3.lp)
Component(s): CPU 0 DIMM 3 (ID=cpu0.mem3.vpd)
cpu0.memvrm Passed
Sensor: CPU 0 Memory VRM Light path location LED
(ID=cpu0.memvrm.lp)
Component(s): CPU 0 memory VRM (ID=cpu0.memvrm.vpd)
cpu0.vrm Passed
Sensor: CPU 0 VRM Light path location LED (ID=
cpu0.vrm.lp)
Component(s): CPU 0 VRM (ID=cpu0.vrm.vpd)
cpuplanar Passed
Sensor: Daughtercard Light path location LED (ID=
cpuplanar.lp)
Component(s): CPU Daughter Card (ID=cpuplanar.vpd)
fault Passed
Sensor: System Fault Indication (ID=faultswitch)
Component(s): Fault light (ID=NA)
floppy Passed
Sensor: Floppy Light path location LED (ID=floppy.lp)
Component(s): Floppy disk drive (ID=NA)
oppanel Passed
Sensor: LCD Light path location LED (ID=frontpanel.lp)
Component(s): Front panel (ID=pic.vpd)
identify Passed
Sensor: Identify switch (ID=identifyswitch)
Component(s): Identify light (ID=NA)
front-fans Passed
Sensor: Fan Board Light path location LED (ID=pcifan.lp)
Component(s): Front Fan backplane (ID=NA)
planar Passed
Sensor: Motherboard Light path location LED (ID=
planar.lp)
Component(s): Motherboard (ID=planar.vpd)
disk-backplane Passed
Sensor: SCSI Backplane Light path location LED (ID=
scsibp.lp)
Component(s): SCSI backplane (ID=scsibp.vpd)
66 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
장치 없음 경고
toggleLED.allLeds 3 Warning
Test Details:
cd Not Present
Sensor: CDROM Light path location LED (ID=cd.lp)
Component(s): CD ROM drive (ID=NA)
읽기 오류
Unable to read the device.
toggleLED.allLeds 3 FAILED
Test Details:
planar FAILED
Failure: Unable to read LED. <errno string>
Sensor: Motherboard Light path location LED (ID=
planar.lp)
Component(s): Motherboard (ID=planar.vpd)
쓰기 오류
Unable to write to the device.
toggleLED.allLeds 3 FAILED
Test Details:
planar FAILED
Failure: Unable to write to LED. <errno string>
Sensor: Motherboard Light path location LED (ID=
planar.lp)
Component(s): Motherboard (ID=planar.vpd)
온도
각 온도 센서가 초기화되고 현재 온도가 해당 장치에서 읽히면 온도가 위험 및 경고 임
계값과 비교됩니다. 온도가 임계값을 초과할 경우, 오류가 표시됩니다.
주어진 온도에 대한 현재 임계값 설정을 보려면 SP 명령 sensor get을 사용하십시오.
localhost # sensor get -i cpu0.temp -cwWC
Identifier Crit Low Warn Low Warn High Crit High
부록 A진단 테스트 결과67
cpu0.memtemp NA NA 68.00 70.00
테스트 결과
온도가 허용 가능한 범위에 있을 경우, 해당 값이 섭씨로 표시됩니다.
온도 통과
read.cpu0.memtemp 1 Passed
Test Details:
Temperature: 67.3
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
판독 값이 통과된 경고 임계값을 초과함
온도 값은 경고 임계값 이상 또는 이하입니다.
read.ambient.temp 2 Passed
Test Details:
Temperature: 26.8
Warning: Temperature exceeds the warning threshold of
22.0, but is still safe.
Sensor: Ambient air temp (ID=ambienttemp)
Component(s): Box (enclosure) (ID=NA)
장치 없음 경고
장치가 없습니다.
Read.cpu0.memtemp 1 Warning
Failure Details:
Failure: Device not present.
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
읽기 오류
장치를 읽을 수 없습니다.
68 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
read.cpu0.memtemp 1 FAILED
Failure Details:
Failure: Unable to read device temperature.
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
판독 값이 위험 임계값을 초과한 오류
온도 값은 위험 임계값 이상 또는 이하입니다.
read.cpu0.temp 2 FAILED
Test Details:
Failure: Sensor is below critical threshold: 29.2 < 30.0
조작 패널 테스트 모듈은 현재의 디스플레이 버퍼 내용을 읽어 저장합니다. 그런 다음,
디스플레이 버퍼에 대해 5가지의 다른 데이터 패턴(0xFF 0xAA 0x55 0x66 0x99)의 쓰
기/읽기/비교를 수행합니다. 테스트가 완료된 후, 해당 디스플레이의 초기 내용이 복
원됩니다.
전원 테스트 모듈은 이중 전원 공급 장치가 있는 Sun Fire V40z 서버에서만 사용 가능
합니다.
해당 전원 공급 장치는 각 전원 공급 장치의 존재를 확인하고 전원 백플레인의 상태 레
지스터를 읽습니다. 공급 장치가 있을 경우, PRS의 활성화된 전원 양호 상태 비트를 읽
습니다. 해당 공급 장치에 대한 VPD를 읽으면 검사값이 확인됩니다. 각 공급 장치에 대
, 통과 상태는 다음과 같은 기준에 따라 판별됩니다.
해
■ 공급 장치가 있습니다.
70 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
■ 활성 비트가 PRS에 설정되어 있습니다.
■ 전원 양호 상태가 true입니다.
■ VPD를 읽을 수 있습니다(검사값 오류가 치명적이지 않음).
공급 장치가 있는 경우, 경고 상태가 없거나 전원 양호 상태가 있으면 오류로 간주됩니
다. 누락된 전원 공급 장치에서 오류가 아닌 경고만 발생합니다. 각 전원 공급 장치에 대
한 전원 공급 장치 상태는 "Passed", "FAILED" 또는 "Warning" 중 하나입니다. 전원 공
급 장치 마더보드의 NPUI(Net Power Usage Indicator)를 읽어 각 공급
장치의 현재 전
원 소비를 판별합니다. 각 공급 장치는 출력 신호를 생성합니다. 이 신호의 전압은 해당
공급 장치의 전원 소비에 비례합니다. 이 전압은 전원 공급 장치 마더보드의 PCF8591
이중 ADC에 대한 입력입니다. 변환된 값은 여기서 읽혀지며 전원 소비를 계산할 때 사
용됩니다.
테스트 결과
전원 통과
read.allPowerSupplies 9 Passed
Test Details:
Power Supply 1 Status: Passed
Presence Detect: Present
Enabled: True
Power Good: True
Part Number: S00440
ECN: A01
Serial Number: PM16768
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 1 (ID=ps1.vpd)
Power Supply 2 Status: Not Present
전원 양호 오류
read.allPowerSupplies 9 FAILED
Failure Details:
Power Supply 1 Status: Power good indicator is false.
Presence Detect: Present
Enabled: True
부록 A진단 테스트 결과71
Power Good: False
Part Number: S00440
ECN: A01
Serial Number: PM16768
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 1 (ID=ps1.vpd)
Power Supply 2 Status: Passed
Presence Detect: Present
Enabled: True
Power Good: True
Part Number: S00440
ECN: A01
Serial Number: PM16769
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 2 (ID=ps2.vpd)
읽기 오류
read.allPowerSupplies 9 FAILED
Failure Details:
Failure: Unable to read device. (Power supply 2)
72 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
부록 B
시스템 이벤트
이벤트 세부 정보
이 부록에는 시스템 이벤트의 세부 정보 및 문제 해결을 위한 제안 사항이 나열된 표가
포함되어 있습니다. 해당 표는 구성요소 및 하부 유형의 알파벳 순서로 구성됩니다.
참고 – sp get events 명령을 사용하거나 SM 콘솔의 시스템이벤트테이블을열면시스
템 이벤트를 볼 수 있습니다. IPMI 이벤트는 대개 시스템의 센서에 대한 정보를 제공합
니다. 자세한 사항은 시스템 관리 명령 설명서를 참조하십시오.
표 B-1 <comp id>, Voltage, Temp 또는 Fan:Sensor
필드 값설명
구성요소<comp id>, Voltage, Temp 또는 Fan
하부 유형Sensor:Voltage, Temp 또는 Fan
심각도Critical, Warning 또는 Informational
요약 설명센서 임계값이 교차되었습니다.
73
표 B-1 <comp id>, Voltage, Temp 또는 Fan:Sensor(계속)
필드 값설명
메시지
Sensor <sensor> reports <value> <type> [ [but should be [between
A and B] | [greater than B] | [less than A] ] | [and has returned to
normal]
상세 설명시스템 관리 소프트웨어는 전압, 온도, 팬 속도 등의 다양한 센서를 모
니터링합니다. 센서에는 공칭, 경고 및 위험 범위를 정의하는 임계값이
있습니다. 센서 값이 이 범위에서 움직이면 시스템 이벤트가 생성되어
지속됩니다.
단계센서 임계값을 수정하지 마십시오. 센서 임계값이 수정되었을 경우 기
본 설정으로 재설정하십시오.
온도 센서는 사이트 공기 조절이 제대로 작동하고
시스템에 대한 공기
흐름이 적절한지 확인합니다. 시스템 구성요소에 먼지가 쌓여있지는
않은지 확인합니다(특히 팬, 방열판 및 통풍구). CPU 방열판이 제대로
부착되었는지 확인합니다(나사가 규격에 맞고 레버가 올바른 위치에
고정되어 있는지). CPU와 방열판 사이에 충분한 열 그리스(Thermal
Grease)가 있는지 확인합니다.
팬 센서는 팬에 먼지가 쌓여있지는 않은지 확인합니다. 외부 요인이 팬
날개에 방해가
되지 않는지 확인합니다. 팬이 작동하고 있는지 확인하
고, 작동하지 않을 경우 팬을 교체하십시오. 문제가 지속될 경우, 상태
가 양호한 팬으로 교체하십시오.
전압 문제의 경우, A/C 전압이 정확한지 확인하십시오. 최근에 A/C
불안정 현상(약화, 급전압, 절전)이 있었는지 판별합니다. VRM 모듈이
제대로 장착되었는지 확인합니다. 전압이 플러그 가능한 VRM 모듈에
서 나올 경우, 해당 모듈을 정상 모듈로 교체하여
문제가 지속되는지
확인합니다.
문제가 저절로 해결되거나 핫 플러그 가능한 구성요소(팬 또는 전원 공
급 장치)를 핫 스왑할 경우, 정상으로 돌아올 수 있습니다. SP를 재부팅
할 경우, 문제가 다시 발생하지 않으면 오류 상태는 정보로 재설정됩니
다.
표 B-2 CPU Planar, Configuration
필드 값설명
구성요소
하부 유형
심각도
CPU planar
Configuration
War ni ng
요약설명호환되지않는 Planar 및 CPU Planar가감지되었습니다.
74 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-2 CPU Planar, Configuration (계속)
필드 값설명
메시지
CPU Planar card is a different revision from main Planar card. This
configuration may not operate properly and is unsupported.
상세 설명CPU 카드에는 두 개정판이 있으며 서로 물리적 및 전자적으로 호환됩
니다. 시스템은 버전 1 카드와 버전 1 플래너, 버전 2 카드와 버전 2 플
래너의 연결만을 지원합니다. 이 경고는 혼합 버전을 사용중임을 나타
냅니다. 시스템이 작동하지만 특정 기능이 제대로 작동하지 않을 수 있
습니다(개정판 E CPU, DDR 400 메모리).
단계CPU 카드를 적절한 버전으로 교체합니다.
표 B-3 CPU <X>, Configuration
필드 값설명
구성요소
하부 유형
심각도
CPU <X>
Configuration
War ni ng
요약 설명알 수 없는 CPU 모델이 시스템에 설치되었습니다.
메시지
CPU Family <x>, Model <y>, Stepping <z> is unknown, Thermal
offset may lead to erroneous shutdowns.
상세 설명SP가 시스템에 설치된 CPU의 특정 개정을 지원하지 않습니다.
단계설치한 CPU가 이 시스템 유형에 맞는지, 엔지니어링 샘플은 아닌지 확
인합니다. SP 소프트웨어(필요한 경우, BIOS 소프트웨어 포함)를 최신
개정판으로 업데이트한 후 다시 시도합니다. 해당 문제가 지속될 경우,
추가
지원을 위해 판매 담당자에게 문의하십시오.
표 B-4 CPU <X>, Heartbeat
필드 값설명
구성요소
하부 유형
심각도
CPU <X>
Heartbeat
Critical, Information
요약 설명심박동이 중지 또는 재개되었습니다. 플랫폼 OS 실행이 중지되었거나
플랫폼 POCI 드라이버가 중지되었습니다.
부록 B시스템 이벤트75
표 B-4 CPU <X>, Heartbeat (계속)
필드 값설명
메시지
CPU<x> [has not sent a heartbeat in the last minute] | [has resumed
sending heartbeats] | [Platform no longer running OS]
상세 설명플랫폼 측 드라이버가 SP에 대한 심박동 신호 전송을 중지했거나 재개
했습니다. 또는 심박동이 손실되는 동안 플랫폼 OS가 종료되었습니다.
적절한 플랫폼 드라이버가 설치되어 정상으로 작동할 때, 플랫폼은 주
기적인 신호를 SP로 전송하여 플랫폼이 활동 중임을 나타냅니다. 심박
동 신호가 1분 이상 손실될 경우, SP는 경고 메시지를 생성합니다. 심박
동 신호가 다시
시작되거나 시스템이 재부팅되면 해당 메시지가 전송
됩니다.
단계SP가 이 이벤트를 감지하지 못하면 플랫폼 측에서 플랫폼 OS 종료가 초
기화되며 이로 인해 이 문제가 발생합니다. (플랫폼 OS가 종료되면 SP에
서 이 이벤트를 인식하기 전에 플랫폼 드라이버가 중지될 수 있습니다.)
이는 플랫폼 드라이버 재설치 또는 업그레이드로 인해 유발될 수도 있습
니다. 또한, 플랫폼 OS의 충돌
또는 중지로 인해 발생할 수 있습니다. 이
러한 경우, 시스템을 재부팅하면 문제를 해결할 수 있습니다.
표 B-5 CPU <X>, MachineCheck
필드 값설명
구성요소
하부 유형
심각도
CPU<X>
MachineCheck
Critical, Warning, Information
요약 설명호환되지 않는 Planar 및 CPU Planar가 감지되었습니다.
메시지
상세 설명
A platform CPU has issued a machine check.
Machine Check error detected on cpu <CPU>. [Machine Check in
Progress.] [Error IP Valid.] [Restart IP Valid.] Error detected in [Data
Cache] | [InstructionCache] | [Bus Unit] | [Load/Store unit] |
[North Bridge] | [Invalid bank reached]. [Second error detected.]
[Error not corrected] [Error reporting disabled.] [Misc. register
contains more info.] [Error occurred at address <address>.]
[Processor state may have been corrupted] [Correctable ECC error.]
[Un-correctable ECC error.] [Detected on a scrub.] Raw data: <data>
단계28페이지의 "시스템점검오류"를참조하십시오.
76 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-6 CPU <X>, TempSensor
필드 값설명
구성요소
하부 유형
심각도
CPU<X>
Te mp Se ns or
Critical
요약 설명CPU 열 이동이 발생했습니다.
메시지
CPU thermal trip has occurred.
상세 설명CPU가 열 이동 이벤트를 나타내고 결과적으로 시스템이 종료되었습
니다.
단계이는 CPU 온도가 약 120C에 도달했을 때 발생하며 프로세서가 손상을
받지 않도록 안전을 보장해주는 조작입니다. 이 조작이 발생할 경우,
유일한 도움은 시스템에 대해 A/C 전원을 순환하는 것입니다. 45페이
지의 "열 이동 이벤트"를
표 B-7 CPU <X>DIMM<X>, MachineCheck
필드 값설명
구성요소
하부 유형
심각도
CPU<X>DIMM<X>
MachineCheck
Critical, Warning, Information
참조하십시오.
요약 설명DIMM 오류가 발생했습니다.
메시지
[A [fatal | recoverable] machine check error occurred on cpu <cpu>:
dimm <dimm>] | [Correctable error rate exceeded, consider
replacing the dimm.]
상세 설명복구 가능한 오류의 경우, DIMM 모듈에서는 높은 비율의 수정 가능한
오류가 발생합니다. 이는 시스템 성능과 안정성에 영향을 미칩니다. 치
명적인 오류의 경우, DIMM 모듈에 복구 불가능한 오류가 발생하고 데
이터가 손상됩니다.
끗하고 부식되지 않았는지 확인합니다. 시스템에 적합한 메모리만 사용
하십시오. 커넥터 부분을 깨끗이 한 후, DIMM을 교체합니다.
부록 B시스템 이벤트77
표 B-8 Planar, Crowbar
필드 값설명
구성요소
하부 유형
심각도
Planar
Crowbar
Critical, Information
요약 설명Crowbar, 전원 공급 장치 또는 VRM 모듈에 치명적인 오류가 발생했
습니다.
메시지
Sensor <sensor> reports that [crowbar failure has been detected attempting to power system off] | [crowbar failure has been
cleared].
상세 설명VRM 모듈 중 하나가 과열 상황 및 과전류 상황이거나 전압을 제대로
조정할 수 없거나 해당 상황이 제거되었음을 나타냅니다. 이는 보통 장
애가 감지되었을 때의 과열 오류입니다.
단계45페이지의 "열 이동 이벤트"를 참조하십시오.
표 B-9 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Critical
요약 설명전원 공급 장치 팬이 실패했습니다.
메시지
Sensor <sensor> reports that the [fans have failed].
상세 설명전원 공급 장치 내부 팬이 실패했습니다.
단계전원 공급 장치를 교체합니다.
표 B-10 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
War ni ng
요약설명전원공급장치 AC의연결이해제되었습니다.
78 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-10 Planar, Power (계속)
필드 값설명
메시지
<power supply> does not appear to be connected to AC power
상세 설명전원 공급 장치가 시스템에 연결되었지만 전원을 공급하지 않습니다.
단계AC 라인 코드가 연결되어 있는지 확인하고 연결되지 않은 콘센트에
AC 전원이 있는지 확인하십시오. 상태가 양호한 전원 공급 장치로 교
체하십시오.
표 B-11 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명전원 공급 장치가 복구되었습니다.
메시지
<power supply> has resumed normal operation
상세 설명이전에 실패했거나 연결이 해제된 전원 공급 장치가 현재 사용 가능하
며 정상적으로 작동합니다.
단계해당 없음
표 B-12 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명전원 공급 장치가 설치되었습니다.
메시지
<power supply> installed
상세 설명새 전원 공급 장치가 시스템에 연결 및 인식되었습니다.
단계해당 없음
부록 B시스템 이벤트79
표 B-13 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명전원 공급 장치가 제거되었습니다.
메시지
<power supply> removed
상세 설명전원 공급 장치 중 하나에 더 이상 액세스할 수 없습니다. 해당 전원 공
급 장치가 제거되었을 수 있습니다.
단계해당 없음
표 B-14 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명전원 공급 장치 팬이 장애로부터 복구되었습니다.
메시지
Sensor <sensor> reports that the fans have resumed normal
operation.
상세 설명전원 공급 장치 안의 내부 팬이 장애로부터 복구되어 현재 정상적으로
작동합니다.
단계해당 없음
표 B-15 Planar, Power
필드 값설명
구성요소
하부 유형
심각도
Planar
Power
Critical
요약설명전원공급장치에장애가발생했습니다.
80 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-15 Planar, Power (계속)
필드 값설명
메시지
<power supply> has failed (or is not plugged in), now running in
degraded condition
상세 설명전원 공급 장치가 실패했거나 연결되지 않았습니다.
단계AC 라인 코드가 연결되어 있는지 확인하고 연결되지 않은 플러그에
AC 전원이 있는지 확인하십시오. 상태가 양호한 전원 공급 장치로 교
체하십시오.
표 B-16 Planar, PowerGood
필드 값설명
구성요소
하부 유형
심각도
Planar
PowerGood
War ni ng
요약 설명전원 양호 장애가 발생했습니다.
메시지
Power good failure detected - latched values are DDR: <x>, CPU,
<X>, LTD: <x>, S0: <x>.
상세 설명PRS 칩이 전원 양호 신호 중 하나에서 오류를 감지했으며 결과적으로
시스템을 종료했습니다. 이는 대개 불량 전압 조절 모듈, 불량 전원 공
급 장치 또는 A/C 약화 또는 장기간의 급전압으로 인해 발생합니다.
DDR 값은 어떤 DDR VRM이 문제를 유발했는지 나타냅니다(각 니블
에 3210
의 고 비트부터 저 비트로 번호를 매기며 두 니블은 각 VRM과
관련됩니다). CPU 값은 어떤 CPU VRM이 문제를 유발했는지 나타냅
니다(상위 니블은 VRM 모듈을 나타냄). LDT 값은 어떤 LDT 조정자가
문제를 유발했는지 나타냅니다. S0 값은 어떤 기타 조정자가 문제를 유
발했는지 나타냅니다(0x40 = A/C, 0x20 = 전원 공급 장치). LDT 값의
일부인 CPU 값의 하위 니블 또는 S0 값의 2-4 비트에 나타난 장애는 온
보드
조정자를 나타내며 교체할 수 없습니다.
단계장애가 플러그 가능한 모듈을 나타내고 일관적일 경우, 해당 모듈을 교체
가능한 예비 모듈로 교체하십시오. 해당 오류가 플래너의 조정자를 나타
내고 일관적일 경우, 플래너를 수리해야 할 수 있습니다. 장애가 전원 공
급 장치를 나타내거나 일관적이지 않을 경우(조정자에서 조정자로 이동),
시스템의 A/C 전원이 정상이고 적절한 전압인지 확인하십시오. 문제가
해결되지
않을 경우, 두 개의 전원 공급 장치가 모두 설치되고 제대로 장
착, 연결되어 작동하고 있는지 확인하십시오(플랫폼 전원이 켜지면 녹색
LED가 밝아짐). 문제가 지속될 경우, 전원 공급 장치를 한번에 하나씩 교
체하십시오.
부록 B시스템 이벤트81
표 B-17 Planar, TempSensor
필드 값설명
구성요소
하부 유형
심각도
Planar
Te mp Se ns or
Critical, Information
요약 설명전원 공급 장치 온도가 너무 높거나 정상으로 돌아왔습니다.
메시지
Sensor <sensor> reports that the [temperature has exceeded
specification] | [temperature has returned to normal].
상세 설명해당 전원 공급 장치 온도가 너무 높거나 정상으로 돌아왔습니다.
단계45페이지의 "열 이동 이벤트"를 참조하십시오.
표 B-18 Platform BIOS, BIOS
필드 값설명
구성요소
하부 유형
심각도
Platform BIOS
BIOS
Critical
요약 설명BIOS 오류가 발생했습니다.
메시지
Received [early] fatal error from BIOS: [Unable to do anything] |
[Fixed Disk Failure] | [Shadow RAM Failed] | [System RAM Failed]
| [Extended RAM Failed] | [System Timer Error] | [Real-Time
Clock Error] | [Date and Time Setting Error] | [CPU ID Error] |
[DMA Test Failed] | [Software NMI Failed] | [Fail-Safe Timer NMI
Failed] | [Operating System not found] | [Parity Error (Memory)] |
[Extended Memory Truncation] | [Memory Mismatched] | [Flash
Image Validation Error] | [Flash Process Failure] | [Diagnostic Load
Failure] | [IP Failure] | [Diag Failed Memtest] | [Incorrect BIOS
image file (wrong platform type?)], Post Code: <code>
상세 설명
단계19페이지의 "BIOS 오류 또는 경고 이벤트"를 참조하십시오.
82 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-19 Platform BIOS, BIOS
필드 값설명
구성요소
하부 유형
심각도
Platform BIOS
BIOS
War ni ng
요약 설명BIOS가 DIMM 장애를 보고합니다.
메시지
Dimm Fault: CPU <cpu>, Dimm <dimm>, [Fault Detected] | [Paired
with faulty Dimm] | [Unknown]
상세 설명메모리 구성 및 초기화 중에 플랫폼 BIOS가 DIMM에서 오류를 발견했
습니다. 해당 오류는 특정 DIMM으로 격리될 수 있거나 격리될 수 없
습니다. (메모리의 특정 구성은 단일 메모리 채널의 DIMM 쌍 간의 오
류 격리를 허용하지 않습니다.)
단계메모리 진단 테스트를 실행하고 24페이지의 "DIMM 장애
"를 참조하십
시오.
표 B-20 Platform BIOS, BIOS
필드 값설명
구성요소
하부 유형
심각도
Platform BIOS
BIOS
War ni ng
요약 설명BIOS 경고가 발생했습니다.
메시지
Received warning from BIOS: [CMOS Battery Failure] | [CMOS
Invalid] | [I20 Block Storage Device excluded from Boot Menu] |
[CMOS Checksum Failure] | [CMOS Settings do not match
hardware configuration] | [Memory truncated to valid functional
memory] | [PCI-X Slot disabled for Golem Errata 56] | [Last Good
Config Checksum Invalid] | [Last Good Config Invalid], Post Code:
<code>
상세 설명
단계19페이지의 "BIOS 오류 또는 경고 이벤트"를 참조하십시오.
부록 B시스템 이벤트83
표 B-21 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명사용자 키 디렉토리 생성 오류가 발생했습니다.
메시지
Error creating users' authorized_keys directories. It is likely that the
persistent filesystem is full.
상세 설명사용자 키 디렉토리를 SP의 영구 저장 장치에 저장하는 중 오류가 발생
했습니다.
단계43페이지의 "영구 저장 장치 문제"를 참조하십시오.
표 B-22 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명Add Trusted Host 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent
filesystem is full.
상세 설명인증된 호스트 구성을 SP의 영구 저장 장치에 저장하는 중 오류가 발생
했습니다.
단계43페이지의 "영구 저장 장치 문제"를 참조하십시오.
표 B-23 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약설명ADS keytab 오류가발생했습니다.
84 Sun Fire V20z 및 Sun Fire V40z 서버문제해결기술및진단안내서 • 2005년 7월
표 B-23 Service Processor, Configuration (계속)
필드 값설명
메시지
Error persisting user configuration. It is likely that the persistent
filesystem is full.
상세 설명NIS 구성을 SP의 영구 저장 장치에 저장하는 중 오류가 발생했습니다.
단계43페이지의 "영구 저장 장치 문제"를 참조하십시오.
표 B-24 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명Delete Trusted Host 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent
filesystem is full.
상세 설명인증된 호스트 구성을 서비스 프로세서의 영구 저장 장치에 저장하는
중 오류가 발생했습니다.
단계43페이지의 "영구 저장 장치 문제"를 참조하십시오.
표 B-25 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명NIS 구성 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent
filesystem is full.
상세 설명NIS 구성을 서비스 프로세서의 영구 저장 장치에 저장하는 중 오류가
발생했습니다.
단계43페이지의 "영구 저장 장치 문제"를 참조하십시오.
부록 B시스템 이벤트85
표 B-26 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명NIS Domain 연결 오류가 발생했습니다.
메시지
Unable to bind to NIS Domain <domain>, Server(s):<server(s)>
상세 설명NIS 구성 요청이 오류로 인해 완료될 수 없습니다. 서버 목록이 잘못되
어 NIS 서버가 응답하지 않거나 도메인이 잘못되었습니다.
단계모든 구성 매개변수가 정확한지 확인하고 NIS 서버가 제대로 작동하고
있는지 확인하십시오.
표 B-27 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명ADS Kerberos 티켓 캐시 생성 오류가 발생했습니다.
메시지
Unable to generate Kerberos ticket cache with Active Directory
Account:<account>, Domain:<domain>, Server(s):<server(s)>
상세 설명오류로 인해 특정 사용자, 도메인 및 서버에 대한 티켓 캐시가 생성되
지 않았습니다. 사용자 계정, 도메인 또는 서버 목록이 정확하지 않거
나 서버가 응답하지 않습니다.
단계모든 구성 매개변수가 올바르고 Active Directory 서버가 제대로 작동
하고 있는지 확인합니다.
표 B-28 Service Processor, Configuration
필드 값설명
구성요소
하부 유형
심각도
86 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Service Processor
Configuration
War ni ng
Loading...
+ hidden pages
You need points to download manuals.
1 point = 1 manual.
You can buy points or you can get point for every manual you upload.