Sun Microsystems Sun Fire V20z, Sun Fire V40z User’s Manual [ko]

Sun Fire™ V20z Sun Fire V40z
서버
문제 해결 기술
Sun Microsystems, Inc. www.sun.com
부품 번호: 819-2927-12 2005 7, 개정판 01
다음 사이트로 설명서에 대한 귀하의 의견을 보내주십시오. http://www.sun.com/hwdocs/feedback
Copyright 2005 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, California 95054, U.S.A. 모든 권리는 저작권자의 소유입니다. Sun Microsystems, Inc.는 본 설명서에서 사용하는 기술과 관련한 지적 재산권을 보유합니다. 특히 이러한 지적 재산권에는
http://www.sun.com나열된 하나 이상의 미국 특허 및 추가 특허 또는 미국 및 기타 국가에서 특허 출원중인 응용프로그램이 포함될 수 있습
니다. 본 제품 또는 설명서는 사용, 복사, 배포 및 역컴파일을 제한하는 라이센스 하에서 배포됩니다. 본 제품 또는 설명서의 어떠한 부분도 Sun 및 해당
사용권자의 사전 서면 승인 없이는 형식이나 수단에 상관없이 재생이 불가능합니다. 글꼴 기술을 포함한 타사 소프트웨어는 저작권이 등록되어 있으며 Sun 공급업체로부터 라이센스를 취득한 것입니다. 본 제품의 일부는 Berkeley BSD 시스템일 수 있으며 University of California로부터 라이센스를 취득했습니다. UNIX는 X/Open Company, Ltd.
를 통해 독점 라이센스를 취득한 미국 및 기타 국가의 등록 상표입니다. Sun, Sun Microsystems, Sun 로고, Java, AnswerBook2, docs.sun.com 및 Solaris는 미국 및 기타 국가에서 Sun Microsystems, Inc.의 상표 또는 등
록 상표입니다. 모든 SPARC 상표는 라이센스 하에 사용되며 미국 및 기타 국가에서 SPARC International, Inc.의 상표 또는 등록 상표입니다. SPARC 상표가 부착
된 제품은 Sun Microsystems, Inc.가 개발한 아키텍처를 기반으로 합니다. OPEN LOOK 및 Sun™ Graphical User Interface는 Sun Microsystems, Inc.가 해당 사용자 및 라이센스 소유자를 위해 개발했습니다. Sun은 컴퓨
터 업계에서 시각적 또는 그래픽 사용자 인터페이스 개념을 연구하고 개발하는 데 있어 Xerox의 선구자적 업적을 인정합니다. Sun은 Xerox Graphical User Interface에 대한 Xerox의 비독점 라이센스를 보유하고 있으며 이 라이센스는 OPEN LOOK GUI를 구현하거나 그 외의 경우 Sun 의 서면 라이센스 계약을 준수하는 Sun의 라이센스 소유자에게도 적용됩니다.
U.S. 정부 권한—상용. 정부 사용자는 Sun Microsystems, Inc. 표준 사용권 계약과 FAR의 해당 규정 및 추가 사항의 적용을 받습니다. 본 설명서는 "있는 그대로" 제공되며 상업성, 특정 목적에 대한 적합성 또는 비침해성에 대한 모든 묵시적 보증을 포함하여 모든 명시적 또는 묵
시적 조건, 표현 및 보증에 대해 어떠한 책임도 지지 않습니다. 이러한 보증 부인은 법적으로 허용된 범위 내에서만 적용됩니다.
재활용
가능
목차
머리말 xi
본 설명서를 읽기 전에 xi
UNIX 명령어 사용 xi
표기 규약 xii
관련 문서 xii
문서, 지원교육 xiii
타사사이트 xiii
사용자 의견 환영 xiv
1. 사전 유지보수 1
성공을 위한 지침 1
변경 관리 2
시스템 육안 검사 2
외부 육안 검사 3
내부 육안 검사 3
문제 해결 덤프 유틸리티 4
2. 진단 7
SP 기반 진단 7
SP 기반 진단 시작 방법 8
iii
메뉴 옵션 10
CD 기반 진단 9
CD 기반 진단 설치 실행 9
BIOS 버전 2.2.0.0 이상 9
이전 BIOS 버전 9
CD 기반 진단 설치 10
옵션 메뉴에서 CD 기반 진단 실행 10
CD 기반 진단 원격 액세스 11
사용 가능한 진단 테스트 및 모듈 13
진단 테스트 실행 14
테스트 결과 15
출력 예제 15
테스트 결과 저장 18
SP 기반 진단 18
CD 기반 진단 18
테스트 중지 18
3. 문제 해결 항목 19
BIOS 19
BIOS 오류 또는 경고 이벤트 19
BIOS POST 코드 22
부팅 문제 23
CMOS 클리어 점퍼 23
DIMM 장애 24
ECC 오류 25
인벤토리 27
표시등, LCD, LED 27
로그 파일 28
시스템 점검 오류 28
iv Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7
네트워크 연결성 30
네트워크 공유 볼륨 30
운영 체제 30
조작 패널 31
밝아짐, 판독 가능한 텍스트, 비작동 버튼 31
밝아짐, 판독 불가능한 텍스트 31
밝아짐, 텍스트 없음 31
밝아지지 않음 32
PCI 또는 PCI-X 플러그 32
플랫폼 OS가 부팅되지 않음 33
PPCBoot - 불량 CRC 오류 35
기본 설정 복구 35
SCSI 구성 유틸리티 36
RAID 등록정보 메뉴 항목이 비활성화됨 36
IM 볼륨이 별도의 SCSI ID 사용함 36
구성 유틸리티가
디스크 선택을 비활성화함 37
서비스 프로세서 38
‘Booting SP . . . ’가 조작 패널에 표시됨 38
SP의 연속 부팅 39
부팅 실패 40
SP를 통해 40
직렬 포트에 부착된 PC를 통해 41
다운그레이드부팅 실패 42
사용자 계정 및 설정 유지 실패 42
네트워크 공유 볼륨에 마운트 43
영구 저장 장치 문제 43
SSH 스크립트가 중지함 43
업데이트 실패 44
목차 v
시스템 이벤트 44
열 이동 이벤트 45
VRM 크로우바 검증 46
A. 진단 테스트 결과 47
테스트 설명 47
전압 47
전압 조정 47
전압 읽기 48
테스트 결과 48
비조정 전압 통과 48
조정 전압 통과 48
전압이 제한값을 초과한 오류 49
하드웨어 오류 49
49
팬 제어기 프로그래밍 50
테스트 결과 50
팬 통과 50
고속 오류 52
저속 오류 53
메모리 54
March 테스트 54
RandAddr 테스트 54
Retention 테스트 54
테스트
결과 55
메모리 테스트 통과 55
서비스 오류 56
ECC 오류 56
BIOS 설정 오류 56
vi Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
NIC 58
테스트 결과 58
NIC 통과 58
서비스 오류 59
링크 다운 오류 59
링크 설정 불일치 오류 59
알 수 없는 링크 상태 오류 59
루프백 오류 59
쓰기 오류 60
읽기 오류 60
비교 오류 60
저장 장치 60
테스트 결과 61
저장 장치 통과 61
장치가 자가 테스트 명령을 인식할 수 없는 오류 61
장치가 자가 테스트 명령을 처리할 수 없는 오류 61
자가
테스트 오류 62
자가 테스트 손상 오류 62
플래시 메모리 62
테스트 결과 63
플래시 메모리 통과 63
시스템 열기 오류 63
시스템 읽기 오류 63
장치 액세스 오류 63
시스템 쓰기 오류 64
지우기 오류 64
매직 번호 오류 64
데이터 비교 오류 64
목차 vii
LED 65
테스트 결과 65
LED 통과 65
장치 없음 경고 67
읽기 오류 67
쓰기 오류 67
온도 67
테스트 결과 68
온도 통과 68
판독 값이 통과된 경고 임계값을 초과함 68
장치 없음 경고 68
읽기 오류 68
판독 값이 위험 임계값을 초과한 오류 69
조작 패널 69
테스트 결과 69
OpPanel 통과 69
읽기 오류 70
쓰기 오류 70
데이터 비교 오류 70
전원 공급 장치 70
테스트 결과 71
전원 통과 71
전원 양호 오류 71
읽기 오류 72
B. 시스템 이벤트 73
이벤트 세부 정보 73
C. POST 코드 95
목차 viii
Phoenix BIOS POST 코드 95
Flash ROM의 부팅 블록 코드용 POST 코드 100
D. 용어집 103
목차 ix
x Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
머리말
Sun Fire V20z 및 Sun Fire V40z 서버문제 해결 기술 및 진단 안내서는 고객에게 발 생할 수 있는 시스템 문제에 대한 정보 및 해결책을 제공합니다. 또한 진단 테스트의 사 용 지침과 모든 시스템 이벤트에 대한 상세 설명을 포함합니다. 본 설명서는 고급 문제 해결 및 하드웨어 교체 경험을 보유한 기술자, 시스템 관리자, 인증된 서비스 제공자 (ASP) 및 사용자를
본 설명서를 읽기 전에
일부 문제 해결 절차에서는 시스템 구성요소의 제거 및 교체가 필요합니다. 따라서 다음 설명서의 안전 지침과 구성요소 제거 및 교체 절차를 검토해야 합니다.
Sun Fire V20z and Sun Fire V40z Servers Safety and Compliance Guide
■ Sun Fire V20z 및 Sun Fire V40z 서버 사용 설명서
대상으로 합니다.
UNIX 명령어 사용
이 설명서에는 시스템 종료, 시스템 부팅 및 장치 구성과 같은 기본적인 UNIX® 명령어 및 절차에 대한 정보는 포함되어 있지 않을 수 있습니다. 이러한 정보에 대해서는 다음 을 참조하여 주십시오.
시스템에 포함되어 있는 소프트웨어 설명서
Solaris™ 운영 체제 설명서는 다음 URL 참조하여 주시기 바랍니다.
http://docs.sun.com
xi
표기 규약
서체 또는 기호
AaBbCc123
AaBbCc123
AaBbCc123
AaBbCc123
* 사용자가 사용하는 브라우저의 설정과 설정이 다를 있습니다.
*
의미
명령어 및 파일, 디렉토리 이름; 컴 퓨터 화면에 출력되는 내용입니다.
사용자가 입력하는 내용으로 컴퓨 터 화면의 출력 내용과 반대입니다.
새로 나오는 용어, 강조 표시할 용 어입니다.
명령줄 변수를 실제 이름이나 값으 로 바꾸십시오.
책 제목, 장, 절 Solaris 사용자 설명서
관련 문서
온라인 문서는 다음 URL에서 사용 가능합니다.
.login 파일을 편집하십시오. 모든 파일 목록을 보려면 ls -a 명령어
를 사용하십시오.
% You have mail.
%
su
Password:
이는 class 옵션입니다. 이를 실행하기 위해서는 반드시 수퍼
유저여야 합니다. 파일 삭제 명령어는 rm filename 입니다.
6장 데이터 관리를 참조하시기 바랍니 다.
http://www.sun.com/products-n-solutions /hardware/docs/Servers/Workgroup_Servers/Sun_Fire_V20z/ index.html
적용 제목 부품 번호
안전 정보
안전 통지 및 국제 준수 증명서
하드웨어 및 시스템 소프 트웨어 설치
xii Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 •2005년 7월
Important Safety Information for Sun Hardware Systems
Sun Fire V20z and Sun Fire V40z ServersSafety and Compliance Guide
Sun Fire V20z Sun Fire V40z 서버설치
설명서
816-7190-xx
817-5251-xx
817-6145-15
적용 제목 부품 번호
유지보수 절차 및 기타 정보
운영 체제 설치 Sun Fire V20z 및 Sun Fire V40z 서버—Linux
문제 해결 및 진단 Sun Fire V20z 및 Sun Fire V40z 서버문제
최신 정보 Sun Fire V20z 및 Sun Fire V40z 서버 릴리스
서버 모델 비교 Sun Fire V20z Sun Fire V40z 서버 버전간의
Sun Fire V20z Sun Fire V40z 서버사용 설명서
운영 체제 설치 설명서
해결 기술 및 진단 안내서
노트
차이점
819-2917-15
817-6155-15
819-2927-11
819-2912-15
819-4305-11
문서, 지원 교육
Sun 기능
문서
지원교육
URL
http://www.sun.com/documentation/
http://www.sun.com/supportraining/
설명
PDF 및 HTML 문서 다운로드, 인쇄 문서 주문
기술 지원, 패치 다운로드, Sun 강의 정보
타사사이트
Sun은 본 설명서에서 언급된 타사 웹 사이트의 가용성에 대해 책임을 지지 않습니다. 또한 해당 사이트나 리소스를 통해 제공되는 내용, 광고, 제품 및 기타 자료에 대해 어떠 한 보증도 하지 않으며 그에 대한 책임도 지지 않습니다. 따라서 타사 웹사이트의 내용, 제품 또는 리소스의 사용으로 인해 발생한 실제 또는 주장된 손상이나 피해에 대해서도 책임을 지지 않습니다.
머리말 xiii
사용자 의견 환영
Sun은 설명서의 내용 개선에 노력을 기울이고 있으며, 여러분의 의견과 제안을 환영합 니다. 다음 사이트에 여러분의 의견을 제출하여 주십시오.
http://www.sun.com/hwdocs/feedback
아래와 같이 설명서의 제목과 문서 번호를 함께 적어 보내주시기 바랍니다.
Sun Fire V20z Sun Fire V40z 서버 문제 해결 기술 진단 안내서, 문서 번호 819-2927-12
xiv Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
1
사전 유지보수
주의하여 시스템을 설정하고 총괄적으로 변경 사항을 관리하며 설정된 반복되는 절차 를 고수하여 많은 문제를 방지할 수 있습니다.
성공을 위한 지침
문제를 방지하고 간단히 해결하기 위한 일부 지침이 아래에 나열되어 있습니다.
사용중인 서버에 서버 위치를 나타내는 이름과 같은 일관된 명명 규칙을 사용합니다.
사용중인 장치의 고유 ID 또는 이름을 사용하여 동일한 자원에 대한 경쟁의 위험을
줄입니다. 서버 설정 유틸리티를 사용하여 충돌이 발생하지 않을지 확인합니다.
백업 계획을 만듭니다.
데이터가 자주 변경될 경우, 백업을 자주 수행하도록 일정을 작성합니다.
정보 복원 필요성에 따라 백업 라이브러리를 유지합니다.
주기적으로 백업을 테스트하여 데이터가 올바르게 저장되는지 확인합니다.
기업시스템 관리 도구를 사용하여 특정 프로세스를 자동화하거나 다음 정보를 수동
으로 추적합니다.
하드 디스크 공간을 주기적으로 검사합니다. 각 하드 드라이브에 최소 15%의 여
유 공간이 있는지 확인합니다.
기록 데이터를 유지합니다. 예를 들어, 초기 CPU 사용 레벨의 베이스라인 기록을
통해 중요 증가 사항을 인지할 수 있습니다. 문제가 발생할 경우, 베이스라인과 현 재 데이터를 비교할 수 있습니다. 사용자, 버스 및 전원 사용 비율 또한 추적 가능 합니다.
예측 가능한 변화를 설명할있도록 동향 분석을 유지합니다. 예를 들어, 마지막
아침에 CPU 사용 비율이 항상 50% 증가했다면 이는 해당 서버에 대해 정상임을 가정할 수 있습니다.
1
문제해결 노트를 만듭니다. 문제가 발생할 경우, 문제 해결을 위해 취한 조치를
록합니다. 기록한 정보를 사용하여 차후에 동일한 문제를 더욱 빠르게 해결할 수 있습니다. 이 정보를 통해 부품 교체 문제의 정확성을 보장할 수도 있습니다.
최신 네트워크 토폴로지 맵을 액세스 가능한 위치에 보관하십시오. 이 맵을 통해
네트워크 문제를 위한 문제 해결 노력을 줄일 수 있습니다.
변경 관리
대부분의 서버 문제는 서버의 일부가 변경된 후에 발생합니다. 서버를 변경할 경우 다 음 지침을 참조하십시오.
변경하기 전에 시스템 설정을 적어둡니다.
발생 가능한 문제를 방지하기 위해 가능하면 한번에 한가지만 변경하십시오. 위와
같은 방법으로 제어 환경을 유지하고 문제 해결 범위를 줄일 수 있습니다.
각 변경의 결과를 적어둡니다. 모든 오류 또는 정보 메시지를 포함시킵니다.
새 장치를 추가하기 전에 장치 충돌이 발생하지 않을지 확인합니다.
특히 타사 소프트웨어를 추가할 경우에는 버전간의 종속성이 있는지 확인합니다.
서버 문제의 원인을 찾아 수정하려면 다음 정보를 수집합니다.
장애 전에 발생한 이벤트
하드웨어 또는 소프트웨어가 변경되거나 새로 설치되었는지 여부
서버가 최근에 설치되었거나 이동되었는지 여부
서버의 증상이 나타난 기간
문제의 지속 기간 발생 빈도
문제의 상태를 파악하고 현재 사용중인 구성과 환경을 기록해둔 다음을 수행하십
시오.
시스템을 육안으로 검사합니다(아래 참조).
진단 테스트를 실행합니다(7페이지의 "진단" 참조).
시스템 육안 검사
잘못 설정된 제어 장치 및 느슨하거나 잘못 연결된 케이블은 하드웨어 구성요소 문제의 일반적인 원인입니다. 시스템 문제를 조사할 때에는 모든 외부 스위치, 제어 장치 및 케이 블 연결을 가장 먼저 확인합니다. 문제가 해결되지 않는 경우 시스템 내부 하드웨어의 카 드나 케이블 커넥터 또는 장착 나사 등이 빠지지 않았는지 육안으로 검사합니다.
2 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
하드웨어 구성요소 제거 및 교체 방법은 Sun Fire V20z 및 Sun Fire V40z 서버 사용 설 명서를 참조하십시오.
외부 육안 검사
외부 시스템의 육안 검사를 수행하려면,
1. 구성요소 오작동을 표시하는 상태 표시기를 검사합니다. 27페이지의 "표시등, LCD, LED"를 참조하십시오.
2. 모든 전원 케이블이 시스템, 모니터 해당 주변 장치에 올바르게 연결되어 있는지, 원이 제대로 공급되는지 확인합니다.
3. 직렬 포트에 연결된 장치와 모든 연결 장치(네트워크 케이블, 키보드, 모니터, 마우스)
가 제대로 연결되었는지 점검합니다.
내부 육안 검사
참고계속 진행하기 전에, 시스템과 함께 제공된 Important Safety Information
About Sun Hardware Systems의 안전 지침을 읽어보십시오. 또한, Sun Fire V20z Sun Fire V40z 서버 사용 설명서의 구성요소 제거 교체에 대한 지침을 검토하십시 .
SM Console System Status 화면을 사용하여 모든 시스템 하드웨어 구성요소 센서
의 상태 정보를 알아볼 수 있습니다. 이 System Status 화면은 문제가 있거나 장애 발생 으로 인해 교체되어야 할 구성요소의 검색을 단순화합니다. System Status 화면에 표시 되는 구성요소 이미지는 실제 하드웨어 구성요소 및 해당 구성요소의 대략적인 위치와 크기를 나타냅니다. 자세한 사항은 서버 관리 설명서를 참조하십시오.
1. 내부
2. 모든 전원 케이블을 전기 콘센트에서 연결 해제합니다. (일부 서버에는 개의 전원
시스템의 육안 검사를 수행하려면 시스템의 전원을 끕니다.
급 장치와 두 개의 전원 케이블이 존재합니다. 모든 전원 공급 장치가 전원 콘센트에서 연결 해제되었는지 확인하십시오.)
주의 – 전원 공급 장치에서 AC 전원 코드를 뽑으면 시스템 접지도 함께 제거됩니다. 시스
템이 정전기 방출 손상을 받지않도록 시스템에 동일한 전압 전위를 유지해야 합니다. 시 스템 구성요소를 만지는 모든 절차와 제거 및 교체 절차 중에는 ESD 손목 띠와 같은 ESD 보호 장비를 착용하십시오.
3. 서버 덮개를 제거합니다(사용중인 서버의 사용 설명서 절차를 따르십시오).
1 장사전 유지보수 3
주의 – 시스템 작업 중에 일부 구성요소가 뜨거워질 있습니다. 이러한 구성요소를
만지기 전에 열이 식을 때까지 기다리십시오.
4. 필요한 경우 구성요소를 제거하고 소켓이 깨끗한지 확인합니다.
5. 구성요소를 교체한 해당 구성요소가 소켓 또는 커넥터에 단단히 장착되었는지 확인 합니다.
6. 시스템 내부의 모든 케이블 커넥터를 확인하여 적절한 커넥터에 제대로 단단히 부착되 있는지 확인합니다.
7. 서버 덮개를 다시 덮습니다.
8. 시스템과 부착된 주변 장치를 전원 소스에
다시 연결합니다.
9. 서버 부착된 주변 장치의 전원을 켭니다.
문제 해결 덤프 유틸리티
참고 – 문제 해결 덤프 유틸리티는 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리
설명서에서도 논의됩니다(명령 구문, 인수 및 반환 값 포함).
문제 해결 덤프 유틸리티(TDU)는 중요 플랫폼 OS 및 서비스 프로세서(SP) 디버그 데이 터를 캡처합니다. 본 명령을 실행하면 이 데이터가 집결되어 선택한 명령 옵션에 따라 stdout으로 전송되거나 지정된 파일과 함께, TDU는 요약 로그 파일을 생성합니다. 해당 요약 로그 파일에는 TDU가 요 청된 각 정보 단위를 성공적으로 집결했는지 여부에 대한 설명이 포함되어 있습니다. 요약 로그 파일은 tar 파일에 포함되어 있습니다.
키 TDU 정의는 다음과 같습니다.
GPR - 범용 레지스터
■ MCR - 시스템 점검 레지스터
■ MSR - 시스템 상태 레지스터(MCR 포함)
SPR - 전용 레지스터
■ CSR - PCI 구성 공간 레지스터
■ TCB - K-8에서의 추적 버퍼
■ TMB - DRAM에서의 추적 버퍼(TCB)
nfs 디렉토리에 tar 형식으로 저장됩니다. 해당 로그
다음 데이터가 기본으로 캡처됩니다.
4 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
SST 데이터(5KB)
지워지지 않은 현재 이벤트(120KB)
소프트웨어 인벤토리( 25KB)
하드웨어 인벤토리( 25KB)
pstore 데이터:
그룹 파일( 0.5KB)
이벤트 구성 파일(evcfg, 4KB)
보안 구성 파일(seccfg, 5KB)
이더넷 구성 파일(netifcfg2-eth0, 0.2KB)
서비스 프로세서의 현재 프로세스(10KB)
선택적으로 TDU는 다음 데이터를 캡처할 수 있습니다.
K-8 레지스터(-c|--cpuregs) - GPR, SPR, MSR, MCR TCB(19KB) 포함
모든 PCI 구성 레지스터(-p|--pciregs) (25KB)
DRAM에서의 TCB(--tmb, 기본 128KB 또는 최대 1GB 사용자 정의 크기)
참고텍스트 모드에서 TMB 1KB 저장량은 디스크의 4K 차지합니다. 기본
TMB 32KB 저장량은 128KB를 차지하고 TMB 128MB 저장량은 디스크 공간의 1GB를 차지합니다.
문제 해결 덤프 유틸리티를 실행하려면 다음 명령을 사용합니다.
sp get tdulog
-f 옵션을 사용하면 캡처 데이터가 집결되어 압축된 tar 파일로 SP 저장됩니다. 문제
해결 덤프 유틸리티를 실행하는 데 최대 15분이 소요될 수 있습니다. 실행이 완료되면 시스템이 메시지를 표시합니다.
모든 서버 관리 명령은 완료 시 코드를 반환합니다. 다음은 두개의 리턴 코드(ID, 요약 설명)입니다.
반환
NWSE_Success
NWSE_InvalidUsage 1
ID
정의
0
명령이 성공적으로 완료되었습니다.
잘못된 사용: 잘못된 매개변수 사용, 지정된 옵션이 충돌 합니다.
참고 – 리턴 코드 ID가 10진수입니다.
1 장사전 유지보수 5
6 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
2
진단
진단은 Sun Fire V20z 서버 또는 Sun Fire V40z 서버의 하드웨어 상태를 판별하는 테스 트의 세트입니다. 서버에 포함된 진단 테스트는 플랫폼 및 SP를 검사합니다.
진단 테스트:
하드웨어의 기능을 테스트 확인합니다. 예: "팬이 목표 속도에 도달하지 못했습니다."
장치 장애를 표시 격리합니다. 예: "장치가 없습니다."
전압 레벨 또는 SP의 읽기 기록 플래시 파일과 같이 다양한 하드웨어 또는 소프트
웨어 문제를 격리합니다.
교체 가능한 부품을 판별합니다. (부품 제거교체에 대한 지침은 하드웨어 구성요
소 및 서비스 설명서에 포함됩니다.)
다음 방법 중 하나로 해당 진단 테스트를 실행할 수 있습니다.
SP 기반 진단, 아래에 설명, SP 통해 실행
CD 기반 진단, 9페이지에서 설명, 진단 CD 통해 실행
참고 – 서버에서 진단을 실행하는 동안에는 IPMI의 명령줄 인터페이스를 통해 SP와 상
호 작용하지 않습니다. 이 경우, 센서 명령으로 반환된 값은 신뢰할 수 없습니다. 진단이 로드되는 동안 실행되는 센서 명령은 이벤트 로그에 위험 이벤트로 잘못 기록될 수 있 습니다.
일부 테스트는 SP에서 실행되도록 설계되며, 기타 테스트는 플랫폼 OS에서 실행되도록 설계됩니다. 자세한 정보는 13페이지의 "진단 모듈"을 참조하십시오.
SP 기반 진단
SP로부터 진단 테스트를 실행할 있습니다. 진단 파일은 네트워크 공유 볼륨(NSV) 렉토리에 포함됩니다. SP 기반 진단 테스트를 실행하려는 경우:
7
SP 또는 플랫폼에서 테스트를 실행할 수 있습니다. (자세한 사항은 13페이지의 "진단
모듈"에 있는 표 2-1을 참조하십시오.)
SP에만 테스트를 실행할 있습니다.
원격으로 테스트를 실행할 있습니다.
■ NSV가 마운트된 경우, 테스트 결과를 외부(NSV) 장소에 저장할 있습니다.
SP 설정, NSV 소프트웨어 설치 구성, SSH 스크립트 사용 방법에 대한 자세한 사항은 Sun Fire V20z Sun Fire V40z 서버설치 설명서를 참조하십시오. 진단 테스트의
데이트 방법에 대한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
참고 – NSV진단 버전은 SP설치된 진단 버전과 동일해야 합니다.
SP 기반 진단 시작 방법
1. SP와 플랫폼 진단 테스트를 모두 활성화하려면 diags start 명령을 실행합니다. 이 명령은 플랫폼을 진단 모드로 재부팅합니다. 테스트를 실행하기 전에 최소 2-3분 정도 기다립니다.
또는
플랫폼을 재부팅하지 않고 SP 진단 테스트만 활성화하려면 diags start –n 명령을 실행 하십시오.
참고 – CD 기반 진단의 경우, -n 인수는 다음을 지정합니다. 진단과 함께 SP를 로드하
지 않습니다.
2. 해당 진단 테스트를 실행할 수 있는지 판별하려면 diags get state 명령을 실행합 니다. 해당 명령은 다음 중 하나의 상태를 반환합니다.
성공 메시지
The SP and the platform diagnostics systems are available to receive test requests.
또는
오류 메시지
The platform diagnostics system is not available.
진단 모듈 및 해당 모듈에 포함된 테스트 유형의 표를 보려면 13페이지의 "진단 모듈"을 참조하십시오. 해당 표는 각 테스트 모듈이 SP에서 실행되는지 플랫폼에서 실행되는지 의 여부를 표시합니다.
8 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 20 05 년 7월
CD 기반 진단
참고 – 이전 릴리스의 NSV(2.x.x.x 이전)에서 플랫폼 전용 테스트를 실행할있습니
다. 그러나 메모리 테스트를 실행하기 위해서는 인터리빙을 비활성화해야 합니다. 이러 한 이전 릴리스의 NSV로는 CD에서 SP 테스트를 실행할 수 없습니다.
CD에서 진단 테스트를 실행할 있습니다.
SP 또는 플랫폼에서 테스트를 실행할 있습니다.
플랫폼에서만 테스트를 실행할 있습니다.
■ CD를 부팅한 후, 원격으로 테스트를 실행할 있습니다. SSH 사용하여 해당 진단
테스트에 로그인하십시오.
USB 스틱 또는 플로피 디스크에 테스트 결과를 저장할 수 있습니다.
CD 기반 진단 설치 및 실행
기본적으로, BIOS는 진단 모드로 부팅하지 않습니다. 부팅 순서에서 CD 드라이브가 가장 처음인 경우, 시스템 부팅 시 서버에 CD가 설치되어 있으면 BIOS가 해당 CD를 감지하여 진단 모드로 재부팅합니다. 위와 같이 하려면, 아래의 지침을 참조하십시오.
BIOS 버전 2.2.0.0 이상
BIOS 버전 2.2.0.0 이상에서는 진단 모드로 부팅하도록 BIOS 설정할 있습니다.
러면 부팅 시 CD가 BIOS 설정을 감지하고 필요할 경우 시스템을 진단 모드로 재부팅합 니다. 이것은 BIOS Advanced Menu의 옵션입니다. 재부팅을 방지하는 방법에 대한 자 세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버사용 설명서의 BIOS 구성 정보를 참조하십시오.
이전 BIOS 버전
사용중인 BIOS 버전이 진단 모드로 부팅할 수 없는 경우(이 정보는 부팅 시 감지됨), 시 스템은 사용자가 BIOS 설정을 구성하고 메모리 테스트를 성공적으로 실행하는 데 필요 한 몇 가지 단계를 표시합니다. (해당 설정이 잘못된 경우, 메모리 테스트가 경고를 출력 합니다.)
2 장진단 9
CD 기반 진단 설치
CD가 자동으로 부팅되는지 확인하려면 서버 부팅 순서 중에서 가장 먼저 CD 기반
단을 설치해야 합니다. 부팅 순서는 BIOS Boot 메뉴에서 설정할 수 있습니다. 해당 순서 를 아래에 나타난 것과 같이 변경하십시오.
BIOS Boot 메뉴에서, 더하기(+) 또는 빼기(-) 기호를 사용하여 CD-ROM 드라이브를
목록의 상단으로 이동시킵니다. (자세한 정보는 Sun Fire V20z 및 Sun Fire V40z 서 버 설치 설명서를 참조하십시오.)
서버가 하드 디스크 드라이브에서 부팅하는 경우, HDD를 제거하십시오.
서버가 PXE 서버에서 부팅하는 경우, 이더넷 케이블을 분리하십시오.
1. 다음 ISO 이미지의 위치는 시스템 공급자에게 문의하십시오.
cd_diags.iso
2. 해당 ISO 이미지를 CD로 굽습니다.
3. 해당 CD 드라이브에 삽입한 플랫폼을 부팅합니다. (CD 드라이브가 부팅 목록 처음에 있으면 자동으로 수행됩니다. 이를 확인하려면 위의 항목을 참조하십시오.)
CD가 부팅될 때, 다음 플랫폼 IP 주소가 표시됩니다.
Welcome to CD Diagnostics <version displayed>.
Platform eth0 connected for SSH sessions at <ipaddr>
Platform eth1 connected for SSH sessions at <ipaddr>
원격으로 SSH를 사용하려는 경우 이 IP 주소를 사용할 수 있습니다. 11페이지의 "CD 기반 진단 원격 액세스"를 참조하십시오.
CD 부팅 절차가 완료되면 바로 로그인되고 CD 진단 메뉴가 화면에 표시됩니다. 테스 트 실행 및 시스템 정보 캡처 메뉴 옵션을 사용하거나 명령줄을 사용할 수 있습니다.
옵션 메뉴에서 CD 기반 진단 실행
옵션 메뉴는 전체 진단 테스트 실행 과정 및 플로피 또는 USB 저장 장치에 시스템 정보 를 캡처하는 과정을 단순화합니다.
메뉴 옵션
1. View Documentation - 이 옵션을 사용하여 설명서를 엽니다. 온라인 설명서에는
다음 내용이 설명되어 있습니다.
모든 메뉴 옵션
유용한
알려진 문제점
명령줄에서 실행할 있는 명령
10 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
원격 장치에서 SSH를 사용하는 지침
기타 중요 정보
2. Create script run_commans.sh - 이 옵션을 사용하여 테스트를 실행하고 로그 파일 에 시스템 정보를 저장합니다. 이 옵션은 세 가지 프롬프트를 엽니다. 이 프롬프트를 선택할 경우, 스크립트가 작성되어 저장된 로그 파일과 동일한 위치에 저장됩니다. 해당 스크립트를 사용하여 여러 시스템에서 작업을 실행할 수 있습니다.
3. Run script run_commands.sh - 이 옵션을 사용하여 플로피 디스크에 저장한 스크립 트를 실행합니다.
4. Go to Command Line Interface -
옵션을 사용하여 명령줄 인터페이스로 이동합
니다. 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참 조하십시오.
5. Shutdown System - 이 옵션을 사용하여 진단 테스트를 종료한 후 OS를 종료합니다.
참고자세한 정보를 보려면 View Documentation 선택하십시오.
CD 기반 진단 원격 액세스
원격 액세스를 위해서는 플랫폼에 관리자 수준의 사용자를 미리 생성해야 합니다. 지침 을 보려면 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SSH 네트워크 액세스를 통해 CD 기반 진단 테스트를 위한 원격 명령줄 인터페이스를 사용하려면 다음을 수행하십시오.
1. 사용자로서 플랫폼 IP 주소에 SSH를 실행합니다: setup
이미 SP에 관리자 수준 사용자를 생성한 경우, 새 계정을 생성하기 위한 사용자 이름과 암호를 묻는 프롬프트가 표시됩니다. 다음을 제외한 모든 사용자 이름을 사용할 수 있 습니다.
diagUser
setup
root
새 사용자 이름과 암호가 검증되면 로그오프됩니다.
2. 이제 사용자 이름과 암호를 사용하여 플랫폼에 SSH 실행합니다.
3. SP 테스트를 로드하지 않고 플랫폼 진단 테스트만 활성화하려면 diags start –n 명령을 실행하십시오.
2 장진단 11
SP 기반 진단의 경우, -n 인수는 "진단과 함께 플랫폼을 재부팅하지 않음"을 지정합니 다.
또는
SP와 플랫폼 진단 테스트를 모두 활성화하려면 diags start 명령을 실행합니다. 이 명령 은 플랫폼을 진단 모드로 재부팅합니다.
테스트를 실행하기 전에 최소 2-3분 정도 기다립니다.
또는
쉘 또는 Perl에서 다음 중 하나를 구현합니다.
diags start
sleep 240
rc = diags get state
if (rc ==0)
then
# run desired tests using diags run tests command
else
echo "Diagnostics not loaded in expected time. rc = $rc"
fi
또는
rc = diags get state
timer = 0
while (rc == 25 (device error)) and (timer < MAX_WAIT)
do
sleep SLEEP_TIME
timer=time+SLEEP_TIME
rc = diags get state
done
if (timer < MAX_WAIT)
then
# run desired tests using diags run tests command
else
echo "Error loading platform diagnostics. rc = $rc"
fi
4. diags get state 명령을 실행하여 해당 진단 테스트를 실행할 수 있는지 판별할 수 있습 니다.
12 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
해당 명령은 다음 중 하나의 상태를 반환합니다.
성공 메시지
The SP and the platform diagnostics systems are available to receive test requests.
또는
오류 메시지
The platform diagnostics system is not available.
end
if re == 0
diags run tests -a
참고 – 명령줄 인수에 대해서는 아래의 "진단 테스트 실행"을 참조하십시오. 시스템
리에 필요한 명령 및 스크립트 사용에 대한 자세한 내용은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
사용 가능한 진단 테스트 및 모듈
사용 가능한 모듈 및 해당 모듈에 포함된 테스트의 목록을 보려면 다음 명령을 실행하 십시오.
diags get tests
아래 표는 사용 가능한 진단 모듈을 나열하고 해당 모듈이 플랫폼 OS에서 실행되는지 SP에서 실행되는지의 여부를 표시합니다. 모듈은 하나 이상의 개별 테스트를 포함합 니다.
2-1 진단 모듈
모듈 이름 (명령)
메모리
(memory)
네트워크 제어기 (nic)
저장 장치 (storage)
(fan)
실행 위치 테스트 설명
플랫폼 메모리 오류, 주소 디코딩 오류 및 데이터라인 장애를 판별
합니다.
플랫폼 내부 루프백 테스트를 사용하여 플랫폼 NIC 인터페이스를
테스트합니다.
플랫폼 SCSI 드라이브에서 자가 테스트를 호출합니다.
SP
모든 팬이 회전 중이고 RPM이 지정 범위 내에 있는지 확인 합니다.
2 장진단 13
2-1 진단 모듈
모듈 이름 (명령)
플래시
실행 위치 테스트 설명
SP
플래시 파일을 읽고 씁니다.
(flash)
LED (led)
조작 패널 (oppanel)
전원
(power)
온도
(temp)
전압 (voltage)
SP
SP
SP
SP
SP
LED 드라이브 회로가 올바르게 작동하는지 확인합니다. (비대화식 테스트)
조작 패널의 메모리를 확인합니다. 모든 오류의 위치 및 값 을 나타냅니다.
전원 백플레인 및 전원 공급 장치가 올바르게 작동하는지 확인합니다. (모든 시스템에 대해 사용할 수 없음)
모든 온도 센서가 제대로 작동하고
온도가 지정 범위 내에
있는지 확인합니다.
파생된(시스템의 여러 VRM에서 생성) 전압 및 대량 전압 을 확인합니다.
진단 테스트 실행
참고 – 플랫폼 OS에서 진단을 실행하면, 시스템이 플로피 드라이브의 마운트를 시도하
다음 오류를 반환합니다. mount : Mounting /dev/fd0 on /mnt/floppy failed. No such device. 오류 메시지는 무시해도 좋습니다.
명령줄 인터페이스에서 테스트를 실행할 경우, 모든 테스트를 실행하거나 특정 모듈(팬, 메모리, 전압, 온도등)에 여러 테스트를 실행할 수 있으며 하나의 모듈에 실행할 테스트를 지정하거나 이 모든 옵션을 조합할 수 있습니다. diags run tests 명령을 실행할 때 이 옵션을 지정합니다.
테스트를 개별적 또는 일괄적으로 실행합니다.
모든 테스트를 실행하려면 -a 옵션을 사용합니다.
하나 이상의 테스트 모듈을 실행하려면 -m 모듈 옵션을 사용합니다.
하나 이상의 개별 테스트를 실행하려면 -n test_name 옵션을 사용합니다.
-m module -n test_name 옵션을 모두 사용하여 하나 이상의 테스트 모듈
및 개별 테스트를 실행합니다.
예를 들어, 조작 패널 진단 모듈을 실행하려면 다음 명령을 실행합니다.
diags run tests –m oppanel
테스트 모듈은 항상 이름 순서대로 실행됩니다.
개별 테스트는 사용자가 명령줄에 지정한 순서대로 실행됩니다.
14 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
테스트 통과여부에 대한 상태 메시지를 봅니다.
참고 – 테스트 시간 조절에 관한 스크립트를 작성하여 추가적인 제어가 가능합니다. 예
를 들어, 테스트를 지정된 수만큼 반복하는 쉘 스크립트를 작성할 수 있습니다. 자세한 내용은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
테스트 결과
테스트가 완료되면 상태가 반환됩니다. 테스트에서 오류를 감지하면, 소프트웨어가 오 류에 대한 세부 정보를 보고하고 제출된 나머지 테스트를 계속 실행합니다.
참고 – -v|--verbose 옵션을 지정하여 모든 테스트에 대한 세부 정보(통과 여부 포함)를
표시합니다. 예를 들어, 세부 정보에는 최대값, 공칭값 및 최소값이 포함될 수 있습니다.
모든 진단 테스트에 대해 다음 데이터가 생성됩니다.
제출된 테스트 이름
테스트 핸들(다른 창에서 테스트를 취소할 사용되는 고유 ID)
테스트 결과(Passed, Failed)
세부 정보(실패 세부 정보, 테스트 세부 정보등)
참고 – 모든 진단 테스트의 출력 예를 보려면 47페이지의 "진단 테스트 결과"를 참조하
십시오.
진단 테스트에서 식별된 구성요소를 찾으려면 SM Console의 System Status 창을 참조 하십시오. 이 창에는 대표적인 시스템 구성요소 및 관련된 센서가 표시됩니다. SM Console에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명 서를 참조하십시오. 시스템구성요소 레이블의 그림을 보려면 Sun Fire V20z 및 Sun Fire V40z 서버사용 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버설치 설명서를 참조하십시오.
2 장진단 15
출력 예제
이 절에는 전원이 켜졌을 때 --verbose 인수를 사용하여 비플랫폼 모드에서 진단을 시작할 경우 반환될 수 있는 출력 결과가 포함되어 있습니다. 예:
diags start -n
platform set power state on -f
diags run tests -a -v
Submitted Test Name Test Handle
일반 출력 결과 포함:
speed.allFans 1
Results Submitted Test Name Test Handle Test Result speed.allFans 1 Passed Test Details: fan1.tach Passed Controller: fan-ctrl High Rated: 13000 High Actual: 13740 High Delta: +5.39% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10580 Low Actual: 11100 Low Delta: 4.69% Low Limits: -/+15% Sensor: Fan 1 measured speed (ID=fan1.tach) Component(s): Fan 1 (ID=NA) fan2.tach Passed Controller: fan-ctrl High Rated: 13000 High Actual: 13920 High Delta: +6.61% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10718 Low Actual: 11100 Low Delta: 3.44% Low Limits: -/+15% Sensor: Fan 2 measured speed (ID=fan2.tach) Component(s): Fan 2 (ID=NA) fan3.tach Passed Controller: fan-ctrl1
16 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
High Rated: 13000 High Actual: 13860 High Delta: +6.20% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10672 Low Actual: 11040 Low Delta: 3.33% Low Limits: -/+15% Sensor: Fan 3 measured speed (ID=fan3.tach) Component(s): Fan 3 (ID=NA) fan4.tach Passed Controller: fan-ctrl1 High Rated: 13000 High Actual: 13920 High Delta: +6.61% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10718 Low Actual: 11100 Low Delta: 3.44% Low Limits: -/+15% Sensor: Fan 4 measured speed (ID=fan4.tach) Component(s): Fan 4 (ID=NA) fan5.tach Passed Controller: fan-ctrl2 High Rated: 13000 High Actual: 13980 High Delta: +7.01% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10765 Low Actual: 11100 Low Delta: 3.02% Low Limits: -/+15% Sensor: Fan 5 measured speed (ID=fan5.tach) Component(s): Fan 5 (ID=NA) fan6.tach Passed Controller: fan-ctrl2 High Rated: 13000 High Actual: 14160 High Delta: +8.19% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10903 Low Actual: 11340 Low Delta: 3.85% Low Limits: -/+15% Sensor: Fan 6 measured speed (ID=fan6.tach) Component(s): Fan 6 (ID=NA)
2 장진단 17
테스트 결과 저장
SP 기반 진단
SP 기반 진단 테스트 결과를 저장하려면, 출력 내용을 네트워크 공유 볼륨 파일로 저장
합니다. 예를 들어, diags.log1에서 실행한 모든 테스트 결과를 저장하려면 다음을 사용 합니다.
diags run tests -all > /mnt/log/diags.log1
CD 기반 진단
CD 기반 진단 테스트 결과를 저장하려면 USB 스틱 또는 플로피 드라이브를 마운트하 결과를 저장합니다.
USB 스틱을 마운트하려면 다음 명령을 사용합니다.
mount /usbstorage
참고 – 시스템에 단일 디스크 드라이브가 있을 경우에만 USB 저장 장치의 마운트가
작동합니다.
플로피를 마운트하려면명령을 사용합니다.
mount /floppy
해당 장치를 제거하려면 명령을 사용합니다.
umount /<usbstorage | floppy>
테스트 중지
하나 이상의 개별 테스트를 취소하려면 다음 명령을 실행합니다.
diags cancel tests {-t|--test} TEST HANDLE {-a|--all}
모든 테스트를 중지하려면 테스트를 시작한 쉘에서 Ctrl+C 누릅니다.
모든 진단 테스트와 세션을 종료하려면 diags terminate 명령을 실행합니다.
18 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
3
문제 해결 항목
이 장에는 다양한 문제점에 대한 문제 해결 지침과 참조사항이 포함되어 있습니다.
BIOS
이 절에서는 BIOS 관련 시스템 관리 이벤트의 발생 가능한 원인과 제안된 문제 해결 단 계에 대해 설명합니다.
참고 – BIOS 업데이트 방법에 대한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서
버 관리 설명서 및 SM Console Online Help를 참조하십시오. BIOS 업데이트의 문제를 해결하려면 44페이지의 "업데이트 실패"를 참조하십시오.
BIOS 오류 또는 경고 이벤트
아래 표에는 sp get events 명령에 의해 반환되는 오류가 나열되어 있습니다. 문제 의 원인 및 각 문제를 해결하기 위한 제안된 조치가 아래에 나열되어있습니다(경험 기 반의 확률 순으로 나열됨).
참고 – sp get events 명령에 대한 자세한 사항은 Sun Fire V20z Sun Fire V40z
서버서버 관리 설명서를 참조하십시오.
19
3-1 BIOS 오류 메시지
오류 해결책 또는 참조
[CPU ID Error]
이 오류는 CPU 개정판이 일치하지 않을 경우 발생할 수 있습니다. 각 CPU의 개정판을 판별하십시오. 개정판이 동일하지 않을 경우, 개정판이 일치하는
CPU로 교체하십시오.
[Date and Time Setting Error]
이 오류는 보통 배터리 장애를 나타냅니다. 이 문제를 해결하려면 배터리를 교체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원을 순환하여 전원 이 꺼진 상태에서 5분 후에 전원을 켭니다. 그런 다음 지 확인합니다.
[Diag Failed Memtest]
문제를 해결하려면 보고된 DIMM 교체한 재부팅하십시오. 다른 DIMM 실패할 경우, DIMM 교체하고 테스트를 반복합니다. 동일한 DIMM 실패할 경우, 전체 DIMM 세트를 정상 DIMM으로 교체한 테스 트를 다시 실행합니다. 24페이지의 "DIMM 장애" 참조하십시오.
[Diagnostic Load Failure]
[DMA Test Failed],
SP에서 플랫폼으로 진단을 로드하는 동안 로드 작업이 실패했습니다. 다시
시도하십시오.
매우 낮은 확률로 이 메시지가 표시되지 않을 수 있습니다. 이 메시지가 수신 될 경우, 서버를 재부팅해보십시오.
[Software NMI Failed], [Fail­Safe Timer NMI Failed]
[Fixed Disk Failure]
다중 HDD 시스템에서 모든 HDD가 실패할 경우 전원 공급 장치가 이 문제 의 원인일 수 있습니다. 단일 HDD 시스템에서도 이 문제의 원인은 전원 공 급 장치입니다. 그러나 아래에 나열된 다른 가능성을 점검해보십시오. HDD 데이터 케이블이 제대로 졌을 수 있습니다. 해당 커넥터가 백플레인에 단단히 연결되었는지 확인합 니다. 드라이브가 완전히 삽입되지 않았을 수 있습니다. 드라이브를 꺼내어 살펴본 후 다시 삽입하고 접합이 부드럽고 완전한지 확인합니다. 드라이브 전자 기술 또는 인터페이스에 오류가 있습니다. 가능한 경우, 드라이브를 동 일한 시스템의 다른 슬롯에 삽입하십시오. 해당 드라이브가 다른 시스템에 서 작동할 경우, 초기 문제가 발생한 서버에 해당 드라이브를 삽입합니다. 다 른 시스템에서도 이 드라이브가 실패할 경우, 가능하면 원래 시스템에 다른 드라이브를 삽입해보십시오. 교체한 드라이브가 두 번째 시스템에서 작동하 고 첫번째 시스템에서는 작동하지 않을 경우, 첫번째 시스템으로 돌아갑니 다. 두 번째 시스템에서 작동한 드라이브가 첫번째 시스템에서 작동하지 않 고 첫번째 시스템의 드라이브가 두 라이브 전자 기술 및 백플레인이 불량일 수 있습니다. 시스템을 되돌립니다.
[Flash Image Validation Error]
BIOS Update 명령에서 사용되는 BIOS Image가 손상되었거나 BIOS 이미지
가 아닙니다(파일 이름이 잘못됨). 또는 플랫폼으로의 이미지 전송이 실패했 습니다. 해당 작업을 다시 시도하십시오. 여전히 실패할 경우, 해당 파일이 정말로 유효한 BIOS 이미지 파일인지 확인하십시오.
[Flash Process Failure]
이 오류는 플래시 려면 플래시 칩을 교체하십시오. 문제가 지속될 경우, 해당 문제는 사용자가 해결할 수 있는 문제가 아닐 수 있습니다. 지원 센터에 문의하십시오.
오류가 다시 발생하는
연결되지 않았거나 백플레인 커넥터 접합이 비뚤어
번째 시스템에서 작동하지 않을 경우,
칩에 결함이 있음을 나타낼 있습니다. 문제를 해결하
20 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005 7
3-1 BIOS 오류 메시지 (계속)
오류 해결책 또는 참조
[Incorrect BIOS image file]
[IP Failure]
[Memory Mismatched]
[Operating System not found]
BIOS 업데이트 명령에 제공된 BIOS Image 다른 플랫폼에 대한 BIOS 입니 . 사용중인 플랫폼에 대한 올바른 BIOS 이미지를 획득하십시오.
BIOS SP 사이에 내부 통신 오류가 발생했습니다. 작업을 다시 시도하십시오.
DIMM 쌍이 일치해야 합니다. DIMM 쌍이 일치하는지 판별하고 필요할
경우 재구성합니다. 24페이지의 "DIMM 장애"를 참조하십시오.
이 오류의 가능한 원인은 다음과 같습니다. 드라이브 또는 트 블록이 없음). 사용할 부팅 장치가 BIOS 설정 부팅 설정에 존재하지 않음. 플로피 드라이브에 플로피 디스크가 남아있음. 매체가 손상됨. (하드 드라이브 에서 부팅할 경우, 드라이브 장애가 수정될 때 대개 이 문제가 발견됩니다.)
[Parity Error (Memory)], [Extended
BIOS가 매핑 아웃된 불량 DIMM을 보고할 수 있습니다. 이 오류 중 하나가
주기적으로 발생할 경우 메모리 및 54페이지의 "메모리"를 참조하십시오.
Memory Tr un ca ti on ]
[Real-Time Clock Error]
이 오류는 사우스브리지 장애, BIOS 장애, 불량 수정 또는 불량 발진기를 나 타낼 수 있습니다. BIOS를 다시 플래시하거나 배터리를 교체하면 문제가 해 결될 수 있습니다.
[Shadow RAM Failed], [System RAM Failed], [Extended RAM Failed]
[System Timer Error]
오류는 일반적인 메모리 DIMM 오류를 나타냅니다. 처음 가지 오류는 RAM의 첫번째 MG 아래에서 장애가 발생했음을 나타냅니다.
은 24페이지의 "DIMM 장애"를 참조하십시오. 진단 커널을 부팅할 수 없을 경우, 모든 DIMM을 정상 DIMM으로 교체하십시오. 위의 작업이 성공적으 로 완료되면 진단을 사용하여 불량 DIMM을 식별하십시오.
이것은 레거시 오류입니다. 이는 사우스브리지 장애 또는 BIOS 장애를 나타 낼 수 있습니다. 가장 유력한 원인은 손상된 BIOS입니다. 이를 수정하려면
BIOS를 다시 플래시하십시오.
Received [early] fatal error from BIOS: [Unable to
BIOS는 시스템이 보다 자세한 오류 코드를 보고하기 전에 일부 하드웨어 오
류를 감지할 수 있습니다. 정상으로 알려진 CPU가 설치되었을 경우, 지원 센터에 문의하십시오.
do anything]
매체가 비어있음(부
테스트를 실행하십시오. 7페이지의 "진단"
자세한 사항
3 장문제 해결 항목 21
3-2 BIOS 경고 메시지
경고 해결책 또는 참조
[CMOS Checksum Failure], [CMOS Settings do not match
이 문제를 해결하려면 설정을 다시 실행하고(소프트웨어 설치 및 구 성 설명서의 “BIOS 설정 유틸리티” 참조) 저장 및 종료한 후 전원을 껐다가 켭니다. 해당 오류 중 하나가 다시 발생할 경우, 배터리를 교 체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원을 순환하여 전원이 꺼진 상태에서 5분 후에 전원을 켭니다. 문제가 경우, 지원 센터에 문의하십시오.
hardware configuration], [CMOS Invalid]
다시 발생할
[PCI-X Slot disabled for 8131 Errata 56]
설정 중에(소프트웨어 설치 구성 설명서의 “BIOS 구성참조) Advanced 메뉴에서 카드 인식을 허용하는 옵션을 설정했는지 확인
합니다. 카드로 인해 데이터 손상이 유발되지 않음을 확신하거나 위 험을 감수할 의사가 있을 때에만 이를 수행하십시오. 데이터 손상을 방지하기 위해 카드의 전원이 꺼졌습니다. 자세한 정보는 Sun Fire
릴리스 노트를 참조하십시오.
Received warning from BIOS: [CMOS Battery
V20z Sun Fire V40z 서버
이 오류는 배터리 장애를 나타낼 수 있습니다. 이 문제를 해결하려면 배터리를 교체하고 설정을 실행하여 시간 및 날짜를 설정하고 전원 을 순환하여 전원이 꺼진 상태에서 5분 후에 전원을 켭니다. 문제가 다시 발생할 경우, 지원 센터에 문의하십시오.
Failure]
BIOS POST 코드
하드웨어 또는 구성 오류가 발생하면 BIOS는 비디오 디스플레이에(있을 경우) 경고 또는 오류 메시지를 표시합니다. 그러나 심각한 일부 오류로 인해 BIOS가 비디오를 초기화하지 못하고 즉시 정지할 수 있습니다. 이러한 경우, BIOS가 실행한 마지막 POST(Power On Self Test) 작업을 판별할 수 있습니다. 포트 80에 적힌 값으로 표시 됩니다.
sp get port80 - 이 명령을 사용하여 마지막 포트 80 POST 코드를 검색하는 방법
은 SM Console Online Help 또는 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
마지막 10 POST 코드 - 조작 패널을 사용하여 마지막 10 포트 80 POST 코드를 검색하
는 방법은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
POST 코드 및 정의 - POST 코드 및 요약 정의가 95페이지의 "POST 코드"에 나열되
어 있습니다.
22 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
BIOS 오류 또는 경고 이벤트 - 위의 절에는 자주 보고되는 POST 코드를 생성하는 문
제에 대한 정보와 문제 해결 팁이 포함되어 있습니다.
Sun Fire V20z 및 Sun Fire V40z 서버에서 보고되는 공통 POST 코드와 제안된 문제 해 결 조치가 아래 표에 나열되어 있습니다.
3-3 공통 POST 코드
POST 코드 참조 또는 해결책
00
C0
28
2C
49
BIOS POST 코드를 만큼 충분히 실행되지 않았음을 나타냅니다. 이는
대개 전원 켜기 실패, 치명적 CPU 또는 치명적인 BIOS 플래시 부품 문제로 인해 발생합니다.
운영 체제가 감지되지 않음을 나타냅니다.
DIMM의 SPD를 정확히 읽지 못했음을 나타냅니다. DIMM이 불량임을 나 타낼 수 있습니다. 24페이지의 "DIMM 장애"를 참조하십시오.
주소 또는 불량 DIMM, VRM 또는 CPU에서 유발된 의 "DIMM 장애"를 참조하십시오.
PCI 구성 공간 오류 PCI 보드를 제거하여 거슬리는 보드를 찾아 순서를 바꾸 어 교체하거나, 필요할 경우 다른 상표의 보드를 사용하십시오.
데이터 오류, 24페이지
부팅 문제
플랫폼 OS와 관련된 부팅 문제에 대한 사항은 33페이지의 "플랫폼 OS가 부팅되지 않음" 을 참조하십시오. SP와 관련된 부팅 문제를 보려면 38페이지의 "서비스 프로세서"를 참조 하십시오.
CMOS 클리어 점퍼
일부 문제 해결 절차에서는 CMOS 점퍼를 제거해야 합니다. 이 절차에 대한 지침은 다 음과 같습니다.
Sun Fire V20z 서버에서는 CMOS 점퍼가 J110입니다.
Sun Fire V40z 서버에서는 CMOS 점퍼가 J125입니다.
1. 서버의 전원을 끕니다.
2. AC 전원 코드의 연결을 해제하십시오. 개의 전원 공급 장치가 있는 경우 모든 AC 전 코드를 연결 해제하십시오.
3 장문제 해결 항목 23
3. 사용 설명서의 지침에 따라 시스템 커버를 제거합니다.
4. 적절한 점퍼를 찾습니다. 서버를 전면 패널 쪽으로 배치합니다.
■ Sun Fire V20z 서버에서, J110은 마더보드의 좌측 전면 영역에 위치합니다.
■ Sun Fire V40z 서버에서, J125는 마더보드의 중앙 우측 영역에 위치합니다.
5. 다음 부팅 CMOS 삭제되도록 점퍼를 정지 위치로 이동(점에서 멀리)합니다.
6. 시스템 커버를 교체한 AC 전원을 다시 연결합니다.
7. 서버를 재부팅하고 부팅 중에 F2 눌러 BIOS 설정으로 들어갑니다.
8. F9를 눌러 기본값으로 설정합니다.
9. F10을 눌러 변경 사항을 저장합니다.
10. 서버 전원을 끄고 AC 전원
코드의 연결을 해제한 시스템 커버를 제거합니다.
11. 점퍼를 다시 활성 위치(점에 가까이) 옮겨 CMOS에서 다음 부팅 설정을 유지할 도록 합니다.
12. 시스템 커버를 덮고 AC 전원을 다시 연결한 서버를 재부팅합니다.
DIMM 장애
참고 – DIMM 장애 보고를 활성화하려면 Sun Fire V20z 및 Sun Fire V40z 서버—설치
설명서에 나타난 바와 같이 시스템에 NSV 소프트웨어를 설치해야 합니다. 이 드라이버 는 NSV에서 사용 가능하지만 위의 기능을 활성화하기 위해 NSV를 SP로 마운트할 필 요는 없습니다.
시스템 장애 LED가 깜박이고 임계값을 초과한 복구 불가능한 DIMM 오류 또는 복구 가능한 오류를 식별합니다. 오류는 이벤트 로그, SM Console 및 진단 메모리 테스트에 도 보고됩니다. (DIMM 장애를 보고하는 진단의 출력 예를 보려면 25페이지의 "ECC 오 류"를 참조하십시오.) 시스템은 장애의 유형, 장애 발생 위치 및 플랫폼 운영 체제의 견 고성에 따라 계속 정상적으로 작동할
DIMM ECC 오류(복구 가능한 오류 복구 불가능한 오류) 대한 IPMI SEL(System Event Log) 기록이 생성됩니다. 오류 유형을 판별하려면 Event Data 1의 센서별 오프셋
을 검사합니다. CPU(메모리 뱅크) 및 DIMM 번호는 각각 Event Data 3 필드의 상위 니 블 및 하위 니블에 있습니다.
오류를 복구할없는 경우, 시스템을 종료한 DIMM교체합니다.
수 있습니다.
24 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
오류를 복구할있을 경우, 초기복구 가능 DIMM 오류를 제거한 후, 시스템을
모니터링하여 문제가 다시 발생하는지 판별합니다. 계속해서 복구 가능한 오류를 제 거하고 시스템을 모니터링할 수 있으나 복구 가능한 오류가 반복되면 결국 복구할 수 없는 오류가 발생할 수 있음을 유의하십시오.
참고 – Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서의 조작 패널 서버
뉴 옵션을 참조하십시오. 이 오류는 시스템 이벤트 로그에도 나타납니다. 73페이지의
"시스템 이벤트" 참조하십시오.
ECC 오류
Sun Fire V20z Sun Fire V40z 서버에서는 CPU 개의 DIMM을 지원할 수 있 습니다.
개의 DIMM 슬롯은 CPU 대하여 각각 개의 슬롯을 포함하는 개의
(뱅크 0 뱅크 1) 그룹화됩니다.
DIMM은 한번에 뱅크씩 일치하도록 쌍으로 설치해야 합니다. 주어진 하나의 뱅
크의 두 DIMM은 크기, 유형 및 공급업체가 같아야 합니다.
각 CPU는 두 개의 DIMM 뱅크를 지원할 수 있습니다. 각 뱅크가 일치하는 DIMM 쌍
을 포함해야 하는 반면, 뱅크 0 및 뱅크 1 사이의 DIMM 크기 및 공급업체는 일치하 지 않아도 됩니다.
메모리 DIMM의 문제 또는 ECC 오류가 로그 파일에 보고될 경우, 다음 단계를 수행합 니다.
참고 – 서버에서 사용할있는 요약된 로그 파일을 보려면 28페이지의 "로그 파일"을
참조하십시오.
아래의 예에서, 로그 파일은 CPU0, 뱅크0, 슬롯1의 DIMM 오류를 보고합니다.
1. 서버의 전원을 끄고 덮개를 제거합니다.
2. 로그 파일에 나타난 DIMM 제거하고 레이블을 붙입니다.
3. DIMM 커넥터에 물리적 손상, 먼지 또는 다른 오염이 있는지 육안으로 검사합니다.
4. DIMM 슬롯에 물리적 손상은 없는지 육안으로 검사합니다. 슬롯의 플라스틱이 갈라지 거나 깨졌는지 확인합니다.
5. DIMM의 먼지를 닦아내고 접촉부를 깨끗이
다음 다시 장착합니다. (DIMM 레이
블은 그대로 두어도 좋습니다.)
3 장문제 해결 항목 25
6. 시스템을 재부팅합니다. 문제가 지속되면 7단계로 이동합니다.
7. 서버의 전원을 끄고 덮개를 제거합니다.
8. 로그 파일에서 식별된 DIMM 제거합니다.
9. 주어진 뱅크의 슬롯 사이에 개별 DIMM 교체합니다. 래치가 고정되었고 해당 DIMM이 정확이 삽입되었는지 확인하십시오.
이 단계에서는 문제를 여러 DIMM 중 하나로 격리하거나 해당 문제가 마더보드의
불량 슬롯등의 다른 원인으로 유발된 것임을 확인할 수 있습니다.
이 예제에서는 CPU0의 뱅크0에 있는 두개의 DIMM을 제거하여 슬롯 사이의 DIMM
을 서로 바꿉니다.
10. 서버의 전원을 켜고 DIMM 오류를 유발한 프로세스를 실행합니다.
11. 로그 파일을 검토합니다. (출력 예제는 56페이지의 "ECC 오류" 참조)
12. CPU0, 뱅크 0, 슬롯 0(원래의 오류와 반대) 오류가 나타날 경우, 현재 슬롯0 있는
개별 DIMM과 관련된 문제입니다.
또는
해당 오류가 CPU0, 뱅크 0,
슬롯 1(원래 오류와 같이)에서 여전히 나타날 경우, 개별 DIMM과 관련된 문제가 아닙니다. 대신, CPU0 또는 CPU0에 대한 DDR VRM에 의해 발생한 문제일 수 있습니다.
13. 단일 CPU가 포함된 Sun Fire V20z 서버를 사용하고있는 경우, 더 이상 해당 문제를 독 립적으로 해결할 수 없습니다. 부품 교체가 필요할 수 있습니다.
또는
두개 이상의 CPU를 사용하는 서버의 경우, 14단계로
이동하십시오.
14. 두 CPU 사이의 메모리 VRM에 레이블을 붙인 후 서로 교체합니다.
이 단계에서는 문제를 CPU0에 대한 메모리 VRM으로 격리하거나 해당 문제가 다른
원인으로 유발되었는지를 확인할 수 있습니다.
이 예에서는 CPU0 및 CPU1에 대한 VRM을 제거한 다음 CPU 사이의 DDR VRM을
교체합니다.
15. 서버의 전원을 켜고 DIMM 오류를 유발한 프로세스를 실행합니다.
16. 로그 파일을 검토합니다.
17. 이제 오류가 CPU1(원래 오류와 관계 없는 CPU)에서 발생할 경우, 문제는 원래 CPU0
에 장착되었던 DDR VRM과 관련된 것입니다. 부품 교체가 필요할 수 있습니다.
또는
해당 오류가 CPU0, 뱅크 0, 슬롯 1(원래 오류와 같이)
에서 여전히 나타날 경우, 메모리 VRM과 관련된 문제가 아닙니다. 이는 마더보드의 CPU0으로 인한 문제일 수 있으며 부품 교체가 필요할 수 있습니다.
26 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
인벤토리
교체 가능 하드웨어 구성요소 또는 현재 소프트웨어 구성요소 및 버전을 보려면
inventory get all, inventory get hardware inventory get software 명령을 사용하십시오. 명령에 대한 자세한 사항은 Sun Fire V20z Sun
Fire V40z 서버—서버 관리 설명서를 참조하십시오.
NSV 버전 2.2 이하를 사용하고 동일한 위치에 NSV 버전을 추가한 경우,
inventory get software 명령을 [{-a|--all}] 인수와 함께 사용하면 시간이 초 과할있습니다. 이러한 경우
1. 새 NSV 버전을 2.2 버전의 NSV와 다른 위치로 옮겨 압축을 풉니다.
또는
기존의 NSV를 검토한 후 더 이상 필요하지 않은 운영 체제에 대한 폴더를 삭제합니다.
2. 명령을 다시 시도합니다.
, 다음 지침을 따르십시오.
표시등, LCD, LED
3-4 전면 패널 표시등
문제 해결책 또는 참조
위치 표시등이 깜박임
시스템 장애 LED 가 밝아짐
위치 표시등 뒤의 버튼을 누르면 위치 표시등이 밝아질 수 있습니다(또는 꺼 짐). 시스템 관리자는 위치 표시등을 켜서 특정 서버의 위치를 간단히 알아낼 수 있습니다. 깜박이는 위치 표시등은 문제를 나타내는 것이 아닙니다.
분산이 발생하면 시스템 장애 LED(시스템 점검 오류) 등이 밝아집니다. 문 제 해결 팁을 보려면 한 사항은 44페이지의 "시스템 이벤트" 및 73페이지의 "시스템 이벤트"를 참 조하십시오.
28페이지의 "시스템 점검 오류"를 참조하십시오. 자세
3 장문제 해결 항목 27
3-4 전면 패널 표시등
문제 해결책 또는 참조
플랫폼 전원 상태 표시등이 밝아지 지 않음
조작 패널 LCD가 밝아지지 않음
LCD "SP booting"이 표시 멈춤
AC에 대한 전원 연결을 확인하십시오. Sun Fire V20z 서버의 경우, 후면 널의 AC 전원 스위치와 AC 존재 표시기를 확인하십시오.
AC에 대한 전원 연결을 확인하십시오. Sun Fire V20z 서버의 경우, 후면 널의 AC 전원 스위치와 AC 존재 표시기를 확인하십시오. 또한 38페이지의 "서비스 프로세서" 다양한 SP 부팅 문제 해결책을
SP Reset 버튼을 사용하여 SP를 재부팅합니다. (SP Reset 버튼은 후면 패널 있습니다.)
참조하십시오.
로그 파일
사용중인 기능 및 특징에 따라 서버가 다음과 같은 로그 파일을 생성할 수 있습니다.
IPMI 이벤트 로그 - IPMI 기능에 대한 자세한 사항은 시스템 관리 설명서를 참조하
십시오. IPMI 로그가 가득 차면 새 항목은 거부됩니다.
SP 이벤트 로그 - 자세한 사항은 73페이지의 "시스템 이벤트" 및 90페이지의 "Service
Processor, ResourceAllocation"을 참조하십시오.
진단 로그 파일 - 자세한 사항은 47페이지의 "진단 테스트 결과" 참조하십시오.
TDU 로그 파일 - 자세한 사항은 4페이지의 "문제 해결 덤프 유틸리티" 시스템
리 설명서를 참조하십시오.
시스템 점검 오류
이 절에서는 시스템 점검과 관련된 이벤트 및 원인에 대해 설명하며 제안된 문제 해결 단계를 제공합니다.
시스템 점검 오류가 발생할 경우, 시스템 장애 LED가 밝아집니다. 시스템 점검 오류는
ECC 오류(25페이지의 "ECC 오류" 참조) 또는 VRM Crowbar 이벤트(46페이지의 "VRM 크로우바 검증" 참조) 나타냅니다. 이러한 오류는 시스템 이벤트 로그에 보고 됩니다(73페이지의 "시스템 이벤트" 참조).
28 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005 7
3-5 시스템 점검 오류
오류 해결책 또는 참조
[Bus Unit]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
[Correctable ECC error.]
[Detected on a scrub.]
Error detected in [Data Cache]
[Error IP Valid.]
이 오류는 ECC가 켜져 있을 때 메모리 ECC 오류를 나타냅니다. 25페이지 의 "ECC 오류" 및 24페이지의 "DIMM 장애"를 참조하십시오.
Raw data: <data> 이 오류는 CPU 오류 또는 메모리 오류와 함께 발생해야 합니다. 24페이지의 "DIMM 장애"를 참조하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
[Error not corrected]
[Error occurred at
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
24페이지의 "DIMM 장애" 참조하십시오.
address <address>.]
[Error reporting disabled.]
[InstructionCache]
시스템 점검 기능이 꺼졌습니다. 최대 시스템 안정성을 위해 이 옵션을 켜 두십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 체하십시오.
[Invalid bank reached]
[Load/Store unit]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
Machine Check error detected on
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
cpu <CPU>
[Machine Check in Progress.]
[Misc. register contains more
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
info.]
[North Bridge]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
[Processor state may have been
이 오류 메시지에 포함된 특정 정보(예: 주소)가 정확하지 않을 수 있으며 문제 해결을 위해 신뢰할 수 없습니다.
corrupted]
해결하려면 CPU
문제를 해결하려면 CPU
3 장문제 해결 항목 29
3-5 시스템 점검 오류 (계속)
오류 해결책 또는 참조
[Restart IP Valid.]
[Second error detected.]
[Un-correctable ECC error.]
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
이 오류는 CPU가 불량임을 나타냅니다. 이 문제를 해결하려면 CPU를 교 체하십시오.
이 오류는 메모리 ECC 오류를 나타냅니다. 25페이지의 "ECC 오류" 및 24 페이지의 "DIMM 장애"를 참조하십시오.
네트워크 연결성
참고 – 네트워크 연결성에 대한 자세한 사항은 Sun Fire V20z Sun Fire V40z 서버—설
치 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 검토하십시오.
SP 이더넷 포트를 핑(ping)할 수 없을 경우, 조작 패널을 사용하여 IP 주소를 재설정하
십시오.
DHCP를 사용하고 있을 경우, DHCP 서버가 가동되었는지 확인하십시오.
네트워크 공유 볼륨
참고 – 네트워크 공유 볼륨(NSV) 설치, 업그레이드관리 방법에 대한 자세한 사항
은 Sun Fire V20z 및 Sun Fier V40z 서버설치 설명서, Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서 및 SM Console Online Help를 참조하십시오. 35페이지 의 "기본 설정 복구"도 참조하십시오.
운영 체제
사용중인 서버의 운영 체제 설치 및 업데이트에 대한 사항은 Sun Fire V20z 및 Sun Fire
V40z 서버—Linux 운영 체제 설치 설명서, 사전 설치된 Solaris 10 운영 체제용 Sun Fire V20z Sun Fire V40z 서버 설명서 또는 다른 운영 체제 공급자가 제공한 설명서를 조하십시오.
30 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
ECC 오류에 대한 사항은 25페이지의 "ECC 오류" 참조하십시오.
OS 부팅 중지에 대한 사항은 24페이지의 "DIMM 장애" 참조하십시오.
조작 패널
참고조작 패널 다른 제어 장치의 사용에 대한 자세한 사항은 Sun Fire V20z
Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
이 절에서는 조작 패널 LCD 디스플레이 문제의 해결 방법을 제공합니다.
밝아짐, 판독 가능한 텍스트, 비작동 버튼
LCD가 밝아져 판독 가능한 텍스트가 표시되지만 버튼은 작동하지 않을 수 있으며 DHCP 설정에 문제가 있을 있습니다. SP DHCP 서버를 찾을 없을 있습니다.
1. SM Console 또는 SM 명령을 사용하여 SP 네트워크가 DHCP로 설정되었는지 확인합 니다.
2. SP를 재부팅합니다.
참고 – 이 증상을 유발한 SP 문제에 대한 해결책을 보려면 38페이지의 "서비스 프로세
서"에 설명된 SP 부팅 문제를 참조하십시오.
밝아짐, 판독 불가능한 텍스트
LCD가 밝아졌으나 텍스트를 판독할 수 없는 경우, 케이블을 점검하고 다시 장착합니다. 이 문제가 지속될 경우, 마더보드에 장애가 있을 수 있습니다. 마더보드를 교체하십시오.
밝아짐, 텍스트 없음
LCD가 밝아졌으나 텍스트가 표시되지 않을 경우, 다음 중 하나가 원인일 수 있습니다.
PIC 업데이트를 수행했을 경우, 이 증상은 부팅 모드가 변경되었고 SP가 부팅될 수
있기 전에 기본 값으로 재설정되어야 함을 나타냅니다. 이를 수행하는 방법은 40페 이지의 "부팅 실패" 및 42페이지의 "다운그레이드 후 부팅 실패"를 참조하십시오.
3 장문제 해결 항목 31
PPCBoot를 업데이트했을 경우, 이 증상은 업데이트가 시스템을 손상시켰음을 나타
냅니다. 시스템을 교체해야 합니다.
PRS를 업데이트하려고 시도한 경우, 이 증상은 해당 프로세스가 완료되지 않아 시스
템이 손상되었음을 나타냅니다. 시스템을 교체해야 합니다.
어떤 업데이트도 수행하지 않은 경우, 문제는 조작 패널 어셈블리에 의한 것일 수 있
습니다. 조작 패널 어셈블리를 교체하십시오.
밝아지지 않음
27페이지의 "표시등, LCD, LED"에 나타난 바와 같이, 해당 패널이 밝아지지 않을 경우, 케 이블 연결을 확인하십시오. 모든 케이블이 단단히 장착되어있을 경우, LCD, 조작 패널 어 셈블리 또는 마더보드의 문제가 이 증상의 다른 원인일 수 있습니다.
PCI 또는 PCI-X 핫 플러그
PCI 또는 PCI-X 카드가 오작동할 경우, 아래의 지침을 따르십시오.
PCI 또는 PCI-X 플러그 기능을 위한 드라이버 OS 지원 - PCI 또는 PCI-X 플러 그 기능에 문제가 있을 경우, 서버에 적절한 드라이버 및 운영 체제 지원이 존재하는지 확인하고 서버별 설명서에 나타난 요구 사항을 충족했는지 확인하십시오.
핫 플러그 슬롯 카드의 오류 - 핫 플러그 슬롯의 카드에 오류가 발생할 러그 장치를 추가 또는 제거하기 전에 AMD HotPlug Control Utility를 사용하여 슬롯 의 전원을 제거했는지 확인하십시오.
다운로드설치 - 카드 제조업체의 웹사이트에서 사용중인 운영 체제에 대한 최신 펌 웨어, Option ROM(OPROM, Option BIOS) 및 장치 드라이버를 다운로드하십시오. 카 드 펌웨어를 먼저 설치하고 OPROM을 설치한 후 드라이버를 설치합니다.
OPROM 활성화 - OPROM 기반 구성 유틸리티를 실행하기 위해 Ctrl-A(또는 Ctrl-
또는 Ctrl-S 또는 Ctrl-any ) 누르라는 프롬프트를 표시해야 하는 SCSI 카드
C
를 설치했지만 부팅 시 프롬프트가 나타나지 않을 경우, OPROM이 비활성화되지 않았 는지 확인하십시오. 이 문제는 보드의 점퍼 설정으로 인한 것일 수 있습니다. 부팅 시
F2눌러 BIOS Setup 유틸리티를 실행한 Advanced 메뉴에서 PCI Configuration을 선택합니다. 문제의 카드에 OPROM이 활성화되어 있는지 확인하
십시오.
Expansion ROM not initialized -PCI Mass Storage Controller in slot 3
Bus:3, Device:02, Function:01
32 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
다음과 같은 오류를 수신할 수 있습니다.
경우, PCI 핫 플
이 메시지는 OPROM이 활성화되었으나 OPROM 이미지의 초기 크기가 너무 커서 표 준 OPROM 섀도우 공간에 맞지 않음을 나타냅니다. 이는 해당 카드에서 부팅할 수 없 으며 카드에 부팅 시간 설정 유틸리티가 있을 경우, 해당 기능을 사용할 수 없음을 나타 냅니다. 다른 OPROM을 비활성화하려는 경우(더 많은 OPROM 섀도우 공간의 확보를 위해), 해당 OPROM을 로드할 수 있습니다. Advanced 메뉴에서 PCI Configuration을 선택하십시오.
이를 수행하려면 BIOS Setup 유틸리티의
참고 – BIOS 구성 정보는 Sun Fire V20z 및 Sun Fire V40z 서버—사용 설명서를 참조
하십시오.
각 OPROM 이미지는 처음 로드될 때 초기 크기를 갖지만 이 크기는 나중에 더 작은 나머 지 크기로 줄어듭니다. 처음에 더 큰 초기 크기로 카드를 로드할 경우, 추가 OPROM은 맞 지 않을 수 있습니다. 초기 크기를 판별하려면 제조업체의 설명서를 참조하십시오.
OPROM은 다음 순서로 스캔됩니다.
1. 온보드 장치(비디오, NIC, SCSI)
2. 실제 슬롯 1
3. 실제 슬롯
4. 실제 슬롯 3
5. 실제 슬롯 6
6. 실제 슬롯 7
7. 실제 슬롯 4
8. 실제 슬롯 5
2
참고 – BIOS Setup 유틸리티의 Boot 메뉴에서 부팅 순서를 변경할있으나 OPROM
스캔의 순서는 변경할 수 없습니다.
플랫폼 OS가 부팅되지 않음
이 문제점은 케이블 연결이 느슨하거나 하드웨어가 제대로 장착되지 않은 경우에 발생 합니다. 플랫폼 OS가 부팅되지 않는 경우 다음 단계를 따르십시오.
3 장문제 해결 항목 33
1. AC 전원이 사용 가능하고 해당 AC 전원 코드가 서버의 전원 공급 장치 AC 커넥터에 단단히 연결되어 있는지 확인하십시오. 서버에 두 개의 전원 공급 장치가 있을 경우, 모 두 단단히 연결되어 있는지 확인합니다. 2100 서버를 사용중인 경우, 서버 후면의 AC 스위치가 “on” 위치에 있는지 확인하십시오.
2. 플랫폼이 아닌 SP에 전원이 공급되고 있는 경우, 서버의 전원을 끄고 플러그에서 AC 커넥터를
연결 해제한 후 시스템 커버를 제거하십시오. 시스템 커버 제거 방법에 대한
지침은 하드웨어 구성요소 및 서비스 설명서를 참조하십시오.
a. SCSI 신호 케이블, SCSI 전원 케이블 및 기타 내부 케이블이 단단히 연결되었는지
확인합니다.
b. DIMM, DDR VRM 및 CPU VRM이 각 슬롯에 단단히 장착되어 있는지 확인합니다.
c. 서버에서 모든 PCI 옵션 카드를 제거합니다.
3. 시스템 커버를 덮고 AC 전원을 다시 연결한
플랫폼이 부팅되지 않을 경우, 7단계로 이동하십시오.
서버를 재부팅합니다.
또는
플랫폼이 문제없이 부팅되고 2단계의 지침과 같이 PCI 옵션 카드를 제거한 경우, 4
단계로 이동합니다.
4. 서버 전원을 끄고 AC 전원을 단절한 시스템 커버를 제거합니다.
5. PCI 옵션 카드 하나를 다시 설치합니다.
6. 시스템 커버를 덮고 AC 전원을 다시 연결한 서버를 재부팅합니다.
플랫폼이 문제없이 부팅될 경우, 모든 PCI 옵션 카드가 다시 설치될 때까지 4단계, 5
단계 및 6단계를 반복합니다.
또는
모든 PCI 옵션 카드를 다시 설치한플랫폼이 부팅되지 않을 경우, 해당 문제가
별 PCI 옵션 카드로 격리된 것입니다.
7. 서버의 CMOS 점퍼를 제거하십시오. 23페이지의 "CMOS 클리어 점퍼"에 나타난 절차 를 따르십시오.
8. 서버를 재부팅합니다.
플랫폼이 문제없이 부팅되고 PCI 옵션 카드를 모두 제거한 경우 5, 6단계의 지침을
따라 PCI 옵션 카드를 교체하여 문제를 유발한 옵션 카드를 격리합니다.
또는
플랫폼이 부팅되지 않을 경우, 마더보드를 교체해야 할 수 있습니다.
34 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005 7
참고 – 2.3 버전 이상에서는 CMOS 삭제하도록 IPMI 부팅 옵션 매개변수를 설정할
수 있습니다. 이로 인해 시스템 커버를 제거하지 않아도 되고 점퍼를 활성 위치에서 정 지 위치로 이동하지 않아도 됩니다.
PPCBoot - 불량 CRC 오류
이 오류 메시지는 위험 오류를 나타내지 않습니다. 이 메시지를 트리거하는 상황은 직 렬 포트를 통한 연결, 플래시 업데이트 수행 및 PPCBoot 업데이트가 완료되기 전에 SP 를 단절 또는 재설정할 경우에만 발생합니다.
“Bad CRC Error” 메시지가 표시되자마자 시스템은 필요한 환경 변수를 검색하여 적절 한 파티션에 기록합니다. PPCBoot 업데이트가 완료되기 전에 SP를 다시 설정하지 않는 한, 다음 재부팅 시
오류 메시지는 표시되지 않습니다.
기본 설정 복구
참고 – 관련 내용은 42페이지의 "사용자 계정 설정 유지 실패" 포함되어 있습니다.
SP에 일반적인 문제가 발생할 경우(또는 원래 설정으로 복구하고 싶을 경우), sp reset to default-settings 명령을 사용하여 선택한 설정을 복구할 있습니다.
참고 – 조작 패널의 LCD 버튼을 사용하여 기본 값을 복구할 수도 있습니다. 자세한
항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
SP 구성파일은 /pstore 디렉토리의 영구 파일 시스템에 저장되어 있습니다. SP가 부 팅될 때 이 파일에서 기존의 구성 정보를 확인합니다. 기본적으로, sp reset to default-settings 명령이 실행된 후 60초가 지나면 SP가 재부팅됩니다. --nowait 옵션을 지정하면 바로 SP가 재부팅됩니다. 재부팅이 실행된다는 메시지가 20초마다 표 시됩니다.
sp reset to default-settings {-a|--all}
[{-c|--config}] [{-n|--network}] [{-s|--ssh}]
[{-u|--users}] [{-W|--nowait}]
3 장문제 해결 항목 35
예:
sp reset to default-settings {-a|--all}
--all 옵션을 사용하면 이벤트 IPMI 설정(파일이 즉시 삭제됨) 포함한 모든 SP
설정이 기본 구성으로 재설정됩니다.
참고 – IPMI 설정만 재설정하려면 SP 명령을 사용하지 말고 IPMI 명령인 ipmi
reset을 사용하십시오. IPMI 및 모든 명령에 대한 자세한 사항은 Sun Fire V20z 및
Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SCSI 구성 유틸리티
참고서버에 포함된 SCSI 구성 유틸리티의 사용 방법은 Sun fire V20z Sun Fire
V40z 서버사용 설명서를 참조하십시오.
RAID 등록정보 메뉴 항목이 비활성화됨
문제를 해결하려면 다음 사항을 확인하십시오.
부팅 어댑터 목록에 어댑터가 있습니까?
LSI 어댑터에 통합 미러링 펌웨어가 있습니까?
시스템의 Fusion-MPT 어댑터에 IM 볼륨이 이미 생성되어 있습니까?
■ Global Properties 화면에서 “Disable Integrated RAID”가 Yes로 설정되어 있습니까?
선택된 SCSI 버스에 최소 두개의 디스크가 있습니까?
IM 볼륨이 별도의 SCSI ID를 사용함
이 상황에서, 두 개의 미러된 디스크가 포함된 IM 볼륨은 버스 밖에서 별도의 SCSI ID 를 사용하며(IM 볼륨의 모든 물리적 디스크와 IM 볼륨의 SCSI ID가 다름) 구성 유틸리 티는 볼륨 ID로 최근 정의된 ID의 디스크가 구성되도록 허용하지 않습니다.
IM 볼륨 구성에서, 별도의 SCSI ID를 사용하지 않고 동일한 볼륨 ID를 유지하도록 변경 하려면 다음을 수행하십시오.
36 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
1. RAID Properties 화면으로 이동합니다. 기본 디스크가 어떤 SCSI ID를 사용하고 있는 지, 볼륨이 어떤 SCSI ID를 사용하고 있는지 판별합니다. 또한 IM 볼륨에 있는 남은 디 스크의 SCSI ID를 판별합니다.
2. IM 볼륨 디스크를 “No” 설정하고 구성을 저장한 볼륨을 중지합니다.
3. RAID Properties 화면으로 돌아가 IM 볼륨을 다음과 같이 재구성합니다.
기본 디스크는 이전과 같은 ID
보조 디스크는 이전에 볼륨에서 사용한 ID
핫 스페어는 이전에 보조 디스크에서 사용한 SCSI ID
4. 해당 구성을 저장하려면 Esc를 누르고 화면의 지침을 따릅니다. 이는 IM 볼륨을 생성하 고 자동 재동기화를 트리거합니다.
구성 유틸리티가 디스크 선택을 비활성화함
이 상황에서, 해당 구성 유틸리티는 디스크가 IM 볼륨에 대해 선택되도록 허용하지 않 습니다.
해당 디스크가 선택될 수 없는 이유를 판별하려면 RAID Properties 화면에서 F4를 누 르십시오. 각 디스크용 진단 코드는 Size 열에 표시됩니다. 코드 정의는 아래의 표에 나 열되어 있습니다.
3-6 디스크용 진단 코드
코드 정의
0
1
2
3
4
5
6
7
8
상태가 양호합니다.
디스크에서 일련 번호를 읽을 수 없습니다.
디스크에 SMART 기능이 있는지 확인할 수 없습니다.
최대 디스크가 이미 볼륨에 구성되어 있습니다.
반환된 조회 데이터는 디스크가 와이드, 대기열 태그, 단절을 지원하지 않거 나 섹터 크기가 512 바이트가 아님을 표시합니다.
사용자가 장치 등록정보 화면에서 디스크에 대한 대기열 태그 또는 단절을 비활성화했습니다.
디스크의 수 있는 크기를 초과했습니다.
디스크가 선택된 기본 디스크에 포함된 파티션을 미러할 수 있을 만큼 크지 않습니다.
IM 볼륨이 존재하지 않는 동안 핫 스페어가 감지되었습니다. 핫 스페어를 제 거하고 해당 구성을 저장해야 합니다.
파티션이 이미 선택된 보조 또는 핫 스페어 디스크에 의해 미러될
3 장문제 해결 항목 37
3-6 디스크용 진단 코드 (계속)
코드 정의
9
10
11
12
13
디스크 파티션이 해당 디스크의 모든 마지막 32 섹터의 일부(16KB)를 사용합 니다. 마지막 32 섹터는 IR(Integrated RAID) 내부 프로세스에 필요합니다.
디스크 섹터 크기가 512 바이트가 아닙니다.
장치가 장치 유형과 호환되지 않습니다. 제거 불가능한 디스크여야 합니다.
핫 스페어가 너무 작아서 볼륨을 미러할 수 없습니다.
최대 디스크가 이미 볼륨에 구성되어 있습니다.
서비스 프로세서
이 절에는 SP와 관련된 문제에 대한 정보가 포함되어 있습니다.
참고 – SP 설치, 업데이트 사용 방법에 대한 자세한 사항은 Sun Fire V20z 및 Sun
Fire V40z 서버설치 설명서 Sun Fire V20z Sun Fire V40z 서버서버 관리 명서를 참조하십시오.
‘Booting SP . . . ’가 조작 패널에 표시됨
SP 이미지가 손상된 경우, SP 부팅에 실패하고 Operator Panel LCD 계속 다음
시지를 표시합니다. ‘Booting SP.’ 몇 분동안 남아있을 경우, 오류 표시등이 깜박이 기 시작하고 SP 재설정 버튼 및 전면 버튼이 작동하지 않습니다. 이 문제의 결과로, 조 작 패널을 통해 SP에 액세스하거나 SP를 구성할 수 없으며 SP는 시스템을 모니터링 또 는 관리할 수 없습니다.
복구 작업이
1. 서버 관리 설명서의 절차에 따라 Java Update Server를 설치하십시오. 서버의 IP 주소 및 포트 번호를 기록합니다.
2. 시스템을 AC 전원으로부터 분리합니다.
3. 시스템을 AC 전원에 다시 연결합니다. SP 부팅을 시작하고 다음 메시지가 전면 패널 표시됩니다.
SP Boot: <3..2..1> secAny Key for menu
4. 3초 이내에 조작 패널의 Select(중앙) 버튼을 눌러 SP 부팅 프로세스를 방해합니다. 이 를 수행한 후 Operator Panel LCD에 다음이 표시됩니다.
38 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
필요합니다. 이 작업은 AC 전원 재설정 후 조작 패널을 통해 수행됩니다.
Menu:
Update SP?
5. Select 버튼을 눌러 업데이트 작업을 선택합니다. 조작 패널 LCD에 다음과 같이 표시 됩니다.
SP’s IP addr:
0.0.0.0
6. 시스템 관리 설명서의 절차에 따라 조작 패널의 버튼을 사용하여 SP의 IP 주소, 넷마스 크 및 게이트웨이 주소를 지정 및 입력합니다. SP의 네트워크 정보를 지정한 후 다음이 표시됩니다.
Update from IP:
0.0.0.0
7. 위의 설명과 같이 전면 패널 버튼을 사용하여, 1단계에서 설치한 Java Update Server IP 주소와 포트 번호를 지정합니다.
8. Select(중앙) 버튼으로 업데이트를 확인합니다.
SP 업데이트가 진행됩니다. 조작 패널 뿐만 아니라 해당 업데이트 서버의 업데이트 프 로세서를 모니터링할 수 있습니다.
참고 – 해당 업데이트 서버의 결과를 볼 수 없거나 조작 패널이 ‘Booting SP’ 상태
로 돌아갈 경우, SP는 해당 업데이트 서버에 도달할 수 없습니다. 네트워크 연결과 설정 을 확인한 후 다시 시도하십시오.
업데이트가 완료되면 SP는 완전하게 작동해야 합니다.
SP의 연속 부팅
초기화 실패는 대개 DHCP 주소 지정 또는 NSV 서버 중 하나와 관련된 네트워크 문제 로 인해 유발될 수 있습니다.
DHCP 및 해당 DHCP 서버가 비응답 또는 느리게 응답하도록 구성된 경우, SP 초기
화 및 PRS 칩에 의한 재설정에 많은 시간이 소요될 수 있습니다. 이러한 경우, DHCP 로 문제를 해결하거나 정적 주소 지정으로 전환하십시오.
비응답 또는 느리게 응답하는 NSV 서버 또한 초기화 실패를 유발할있습니다.
러한 경우, NSV 서버의 문제를 해결하거나 sp delete mount 명령을 사용하여 SP로 부터 NSV 마운트를 제거합니다.
대개 네트워크 문제 또는 일반 연결 문제(외부 액세스가 활성화될 경우)가 심박동 손실 을 유발할 수 있습니다. 또한 센서 교착 또는 응용프로그램 장애와 같은 SP의 주기적인 문제로 인해
유발될 수도 있습니다.
3 장문제 해결 항목 39
SP 네트워크 설정이 여전히 유효한지 확인(예: DHCP/정적 IP 주소)하고 만약 사용
되었다면 NSV 마운트 지점이 유효하고 사용 가능한지 확인하십시오.
■ SP를 재부팅하고 문제가 지속되는지 살펴봅니다.
문제가 해결되지 않을 경우, 문제 해결을 위해 시스템 AC 전원 순환이 필요할
습니다.
가능할 경우, 정상 상태의 이미지에서 sp update flash all 명령을 사용하여 SP 소프
트웨어를 다시 로드해보십시오.
참고 – SP 부팅이 중지할 경우, 서버 후면 패널의 SP Reset 버튼을 누르십시오. 38페이
지의 "‘Booting SP . . . ’가 조작 패널에 표시됨"도 참조하십시오.
부팅 실패
부팅 모드가 변경되지 않았을 수 있습니다. 부팅 기본 값으로 재설정합니다. 이를 수행 하려면 우선 다음을 수행하십시오.
관리자 또는 서비스 계정으로 SP에 로그인하십시오.
또는
PC직렬 포트에 부착합니다.
SP를 통해
1. 서버 전원을 끄고 AC 전원 코드의 연결을 해제한 시스템 커버를 제거합니다.
2. 점퍼를 66MHz PCI-X 슬롯의 끝에 위치한 TH84 세트 위에 놓습니다. (필요한 경우, CMOS 점퍼인 J110 또는 J125를 이 용도로 사용하십시오.)
3. SP SSH 세션을 설정하십시오. Sun Fire V20z Sun Fire V40z 서버설치 설명서 절차에 따라 필요한 초기 관리자 계정을 생성합니다.
4. 서비스 레벨의 계정을 생성하려면 다음을 입력하십시오.
access add user -g service -u s -p s3
5. 서비스 계정에 수퍼유저로 로그온하려면 다음을 입력합니다.
su s
6. 루트 계정을 활성화하려면 다음을 입력합니다.
sp set root on
7. 프롬프트에 대해 서비스 계정 암호와 새 루트 계정 암호를 지정합니다. 루트 계정으로 로그온하려면 $ 입력 프롬프트에 다음을 입력하십시오.
40 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
su -
8. 다음 프롬프트에 대해 5단계에서 설정한 루트 계정 암호를 지정합니다. # 입력 프롬프 트에서 다음을 입력합니다.
setenv uboot 0
9. 서버 전원을 끄고 AC 전원을 해제한 시스템 커버를 제거합니다.
10. TH84 점퍼를 제거합니다.
11. 시스템 커버를 덮고 AC 전원을 다시 연결한 서버의 전원을 켭니다.
SP 부팅이 성공하고 LCD에 적절한 텍스트가 표시되어야 합니다.
직렬 포트에 부착된 PC를 통해
1. 서버 전원을 끄고 AC 전원 코드의 연결을 해제한 시스템 커버를 제거합니다.
2. 점퍼를 66MHz PCI-X 슬롯의 끝에 위치한 TH84 세트 위에 놓습니다. (필요한 경우, CMOS 점퍼인 J110 또는 J125를 이 용도로 사용하십시오.)
3. J19의 점퍼를 이동하여 SP 출력을 직렬 포트로 설정합니다.
4. PC를 직렬 포트에 부착합니다.
5. 시스템 커버를 교체한 AC 전원 코드를 다시 연결합니다.
6. 서버의
Hit any Key to Stop Autoboot = 0.
7. 바로 스페이스 바를 누릅니다(부팅 처음 3 이내에).
8. => 프롬프트에서 다음을 입력합니다.
saveenv
9. 서버 전원을 끄고 AC 전원 코드의 연결을 해제한 시스템 커버를 제거합니다.
10. TH84 핀 세트에 놓은 점퍼를 제거합니다.
11. 시스템 커버를 덮고 AC 전원 코드를 다시 연결한 서버의 전원을 켭니다.
SP 부팅이 성공하고 LCD에 적절한 텍스트가 표시되어야 합니다.
전원을 켭니다. Serial Power에 다음과 같은 내용이 표시됩니다.
3 장문제 해결 항목 41
다운그레이드 부팅 실패
SP 부팅이 시작된 문제가 바로 발생할 경우, 조작 패널을 사용하여 플래시를 업데 이트합니다. 자세한 사항은 Sun Fire V20z Sun Fire V40z 서버설치 설명서 Sun Fire V20z Sun Fire V40z 서버—사용 설명서를 참조하십시오.
참고 – sp update flash all 명령은 pstore 데이터를 업데이트하지 않습니다.
sp update flash all 명령은 Sun Fire V20z Sun Fire V40z 서버서버 관리 설 명서에 자세히 설명되어 있습니다.
사용자 계정 및 설정 유지 실패
SP 상태 정보 유지에 사용되는 플래시 파티션의 손상은 사용자 계정 유지 및 SP 재부팅 설정 또는 AC 전원 재설정 유지의 실패를 유발할 수 있습니다. 이 문제의 결과로 각 SP 가 재부팅된 후 원하는 설정을 재설정해야 합니다. SP가 작동하고 액세스 가능하더라도 이 문제가 발생할 수 있습니다.
이 문제점을 확인하려면 SP에 로그인 후 마운트 명령을 입력하십시오. 한 항목은 나타나지 않습니다.
localhost $ mount
/dev/rd/0 on / type ext2 (rw)
none on /dev type devfs (rw)
proc on /proc type proc (rw)
localhost $
이 문제가 발생할 경우, SSH 세션을 통해 다음 복구 작업을 수행하십시오.
1. SP에 SSH 세션을 설정하십시오. 서버 관리 설명서의 절차에 따라 필요한 초기 관리자 계정을 생성합니다.
2. 서비스 레벨의 계정을 생성하려면 다음을 입력합니다.
access add user -g service -u s -p s3
3. 서비스 계정에 수퍼유저로 로그온하려면 다음을 입력합니다.
su s
4. 루트 계정을 활성화하려면 다음을 입력합니다.
sp set root on
5. 서비스 계정 암호와 루트 계정 암호를 지정합니다.
6. 루트 계정에 수퍼유저로 로그온하려면 다음을 입력합니다.
/pstore에 대
42 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
su -
7. 5단계에서 설정한 루트 계정 암호를 지정합니다.
8. SP 상태 정보를 포함하는 플래시 파티션을 제거하려면 다음을 입력합니다.
eraseall /dev/mtd/flashfs
9. SP를 재부팅하려면 다음을 입력합니다.
sp reboot
재부팅 후, SP가 완전히 작동합니다.
네트워크 공유 볼륨에 마운트
SP 마운트를 NSV에 추가하려고 시도할 때 권한 오류가 수신될 경우, 원격 마운트가 읽 기/쓰기 권한을 허용받았는지 확인하십시오.
영구 저장 장치 문제
서버에서 사용 가능한 방법을 통해 시스템 이벤트를 모니터링할 경우, 영구 저장 장치 문제에 대한 오류 메시지를 수신할 수 있습니다. 정상 작동 중에 영구 저장 장치 영역이 가득 차는 것은 드문 경우입니다. 영구 저장 장치가 가득 차있고 루트 액세스가 이 공간 에 다른 파일을 저장하는 데 사용된 경우, 해당 저장 장치를 제거하십시오. 성 파일을 제거합니다. 예를 들어, access delete trust, access delete public key, sensor set -Rsp delete event를 사용하십시오.
그런 다음
시스템 이벤트 및 문제 해결 제안 사항을 보려면 73페이지의 "시스템 이벤트"를 참조하 십시오.
사용 가능한 모든 이벤트 모니터링 방법을 보려면 Sun Fire V20z 및 Sun Fire V40z 서 버—서버 관리 설명서를 참조하십시오.
SSH 스크립트가 중지함
스크립트의 SSH를 사용하여 콘솔 명령을 실행하면, {-W|--nowait} 옵션이 실행하려 는 명령에 대한 옵션이 아닌 SSH에 대한 매개변수로서 SSH에 적용됩니다. 해당 명령이 실행된 후 SSH가 바로 반환되도록 하려면 {-n|--no platform}{-f|-- forced} SSH 옵션을 {-W|--nowait} 옵션과 함께 사용하십시오.
예:
ssh -n -f manager@10.10.20.30 “platform set os state update-bios -i
10.10.100.200 -p 5555 -r LATEST -W”
3 장문제 해결 항목 43
업데이트 실패
SP 업데이트를 시도하였으나 업데이트가 실패한 경우, 업데이트 서버가 로드되었고 확한 IP 포트 번호를 지정하였는지 확인하십시오.
BIOS 업데이트를 시도하였으나 업데이트가 실패한 경우, BIOS 이미지의 버전이 정확 한지 확인하십시오.
참고업데이트 서버의 사용 방법은 Sun Fire V20z Sun Fire V40z 서버서버 관리
설명서를 참조하십시오.
시스템 이벤트
시스템 이벤트를 통해 시스템에서 발생했거나 발생할 가능성이 있는 문제에 대한 중요 정보를 얻을 수 있습니다. 다음 방법 중 하나를 사용하여 시스템 이벤트를 모니터링할 수 있습니다.
sp get events 명령을 사용합니다. 명령 기타 명령에 대한 자세한 사항은 Sun
Fire V20z Sun Fire V40z 서버—서버 관리 설명서 또는 SM Console Online Help 참조하십시오.
SM Console사용합니다. SM Console 표시되는 모든 이벤트는 시스템 이벤트
로그에서도 나타납니다. 기반 SM 콘솔에 대한 사항은 Sun Fire V20z Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
조작 패널을 사용합니다. 조작 패널에 표시되거나 시스템 오류 표시등을 트리거
는 모든 이벤트는 시스템 이벤트 로그에서도 나타납니다. 조작 패널에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
■ SNMP(Simple Network Management Protocol)를 사용합니다. 특정 이벤트가 발생
할 경우 알림을 생성하도록 SNMP를 구성할 수 있습니다. SNMP 통합에 대한 자세 한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
■ IPMI(Intelligent Platform Management Interface)를 사용합니다. IPMI 시스템 이벤
트 로그는 일부 시스템 이벤트 유형을 기록합니다. IPMI 시스템 관리 및 IPMI 시스 템 이벤트 로그에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
시스템에서는 문제 평가 시 사용할 수 있는 정보를 제공합니다. 시스템에서 반환되는 정보의 형식과 유형은 아래에 나열된 4가지의 모니터링 방법에 따라 약간 다릅니다. 이 정보에는
구성요소 이름
구성요소 유형(소프트웨어 업데이트, 하드웨어 시스템 점검 )
이벤트 심각도
44 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
다음 항목이 포함될 수 있습니다.
이벤트 설명 요약 메시지
이벤트 설명 상세 메시지
View events - 시스템 이벤트가 발생하면 전면 패널의 시스템 장애 LED깜박입니다. 고를 유발한 위험 이벤트를 보려면 sp get events 명령을 실행하십시오.
Reset system fault LED - 시스템 장애 LED재설정하려면 SP 이벤트 로그에서 위험 이벤트를 삭제하거나 로그를 완전히 삭제해야 합니다.
Clear - 전체 이벤트 로그를 삭제하려면 sp delete event -a 명령을 실행하십시오.
Delete specific events - 로그에서 선택한 이벤트를 삭제하려면 sp delete event
event-id-number
명령을 실행하십시오.
참고 – 부록 B "시스템 이벤트"에서는 발생 가능한 모든 시스템 이벤트에 대한 추가
벤트 정보 및 특정 문제 해결 단계를 제공합니다.
열 이동 이벤트
CPU에서 열 이동이 발생하면 플랫폼이 종료되었음을 나타내는 이벤트가 생성됩니다. 예:
CPU 0 has thermally tripped and shut down. Powering off System.
이 상황이 발생하면 전면 패널의 시스템 장애 LED가 깜박입니다. 이 상황을 해결하려 면 다음을 수행하십시오.
1. 이동을 유발한 공기 흐름 문제를 해결하십시오( 장애, 고온 환경, 길이가 커버등).
2. 시스템의 열이 식은 , 시스템의 모든 AC 전원을 30초 동안 제거합니다( 전원 공급 장치의 플러그 제거).
3. 시스템의 전원을 다시 연결합니다.
일반적인 방법으로 시스템을 부팅합니다.
4.
3 장문제 해결 항목 45
VRM 크로우바 검증
VRM 크로우바 검증은 CPU 또는 DDR VRM 임계값을 초과하는 전압 상태 또는
도 상태를 감지할 때 발생합니다. 검증이 발생하면, SP 또는 PRS에서 강제로 시스템을 종료합니다. (보통 크로우바 신호로 인해 VRM이 "전원 양호" 신호의 확인을 중지하므 로 대개 PRS가 시스템을 종료합니다).
이 상황이 해결되면 시스템 전원을 다시 켤 수 있습니다. 크로우바가 검증되는 동안, 시 스템 장애 명령 및 platform set os state 명령이 비활성화됩니다.
전원 공급 장치 및 전원 양호 신호 이벤트에 대한 자세한 사항은 73페이지의 "시스템 이 벤트"를 참조하십시오. 모든 시스템 점검 오류에 대한 자세한 사항은 28페이지의 "시스 템 점검 오류"를 참조하십시오.
LED가 깜박이고 전면 패널의 플랫폼 전원 버튼과 platform set power
46 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005 7
부록 A
진단 테스트 결과
이 절에서는 문제의 원인을 판별할 수 있는 진단 테스트에 대한 추가 세부 정보를 제공 합니다. 이 절에는 주석이 포함된 테스트 출력 결과, 테스트 알고리즘 설명, 발생 가능한 테스트 실패 사례 및 추가적인 문제 해결 제안 사항이 포함되어 있습니다.
테스트 설명
이 부록에서는 진단 테스트 수행 단계 및 실패를 트리거할 수 있는 구성요소에 대해 설 명합니다.
–n 인수를 사용하지 않는 , 진단을 시작하기 전에 플랫폼의 전원을 꺼야 합니다.
진단을 시작하면 플랫폼에 전원을 공급하고 대기 팬을 시작하며 플랫폼 진단
스템의 로딩을 시작합니다.
비플랫폼 모드(diags start -n 명령)에서 진단을 시작하면 현재 플랫폼 상태가 "그대
로" 유지되고 SP 진단 모듈의 실행만 허용됩니다. 이 모드에서는 메모리, 저장 장치 및 NIC 테스트를 사용할 수 없습니다.
전압
전압 제한 테스트는 각 전압이 해당 전압에 대해 정의된 최고 및 최저 제한 범위 내에 있 는지 확인합니다.
전압 조정
참고 – 주어진 전압은 조정을 지원하며 조정 기능이 실행됩니다.
47
전압 조정 오류의 기준은 공칭 조정 값에서 +2 또는 -2이며 Bulk 3.3V S5 최소값인 trimHi > trimNom > trimLo는 예외입니다.
제한 테스트는 ADC(아날로그-디지털 변환)에서 전압을 읽기 전에 테스트된 전압과 관 련된 초기 조정 설정을 읽습니다.
전압이 제한 범위 내에 있는 경우, 진단은 조정을 공칭으로 설정하여 다시 전압을 읽고 해당 값을 변수로 저장합니다. 공칭, 최소 및 및 전원 공급 장치에 따라 다릅니다.
최대 설정에 대한 실제 코드는 VRM, CPU
전압 읽기
모니터링된 전압의 각 공칭값이 2.0 볼트보다 높은 경우, ADC 입력에 적용되기 전에 분 리자 네트워크에 의해 2.0 볼트로 정상화됩니다. ADC 입력 범위는 0.0 - 2.5 볼트입니 다. 전압은 다음과 같이 계산됩니다.
Voltage = reading * 2.5 / 4096
결과는 테스트된 네트의 공칭 전압을 기반으로 측정됩니다. 예를 들어, VCC_120_S0(12 볼트) 경우, 전압(V) 6.0배가 됩니다. (공칭 2.0 볼트 입력을 얻기
위해 해당 전압은 분리자 네트워크에서 6으로 나누어집니다.)
전압은 5번 읽으며 결과는 다섯 번 읽은 값의 평균입니다.
테스트 결과
비조정 전압 통과
limits.bulk.v2_5-s0 88 Passed
Test Details:
Actual: 2.485
Nominal: 2.500
Maximum Limit: 2.625
Minimum Limit: 2.375
Sensor: Bulk 2.5V S0 voltage (ID=bulk.v2_5-s0)
Component(s): Motherboard (ID=planar.vpd)
조정 전압 통과
limits.bulk.v3_3-s0 91 Passed
Test Details:
Actual Trim High: 3.400
48 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
Actual Trim Nominal: 3.321
Actual Trim Low:: 3.237
Nominal: 3.300
Maximum Limit: 3.465
Minimum Limit: 3.135
Sensor: Bulk 3.3V S0 voltage (ID=bulk.v3_3-s0)
Component(s): Motherboard (ID=planar.vpd)
전압이 제한값을 초과한 오류
limits.bulk.v1_8-s5 46 FAILED
Failure Details:
Failure: Voltage exceeds maximum limit.
Actual: 1.932
Nominal: 1.800
Maximum Limit: 1.890
Minimum Limit: 1.710
Sensor: Bulk 1.8V S5 voltage (ID=bulk.v1_8-s5)
Component(s): Motherboard (ID=planar.vpd)
하드웨어 오류
limits.bulk.v1_8-s5 46 FAILED
Failure Details:
Failure: Unable to set voltage trim. No such device or address.
Sensor: Bulk 1.8V S5 voltage (ID=bulk.v1_8-s5)
Component(s): Motherboard (ID=planar.vpd)
이 테스트는 팬의 최대 속도가 사양 이내에 있어 해당 팬 속도가 제어될 수 있는지 확인 합니다.
부록 A 진단 테스트 결과 49
테스트 시작 시, 모든 팬은 완전히 켜지도록 설정됩니다. 이는 내부 제어 루프를 우회하 여 해당 팬이 최대한 빠른 속도로 움직이도록 합니다. 팬이 24초 동안 대상 속도에 고정 되면 최대 속도가 기록됩니다. 그런 다음, 팬은 낮은 속도로 돌아가도록 설정됩니다. 팬 이 24초 동안 대상 속도에 고정되면 최저 속도가 기록됩니다. 속도 값은 상위 및 한과 비교되어 테스트가 실패했는지 판별합니다.
때때로 팬은 점근적으로 설정 지점에 도달하며 요구 범위에서 약간 바깥쪽에 맴돕니 다. 직렬식 팬(팬0,1 팬2,3 팬4,5)은 다운윈드 팬(팬1,3,5)의 1000 RPM 순서로 특성에 따 른 속도 증가를 보여줍니다. 각 팬에는 +/-(+ 또는 -) 10%에 온도 및 전압 변동을 더하여 지정되는 내부 클럭이 있습니다.
하위
통과/실패를 결정하는 를 허용하며 최저 한계에 대해서는 -/+15%(-15에서 +15%)를 허용합니다.
허용 한계는 최고 한계에 대해 -10/+35%(-10에서 +35%)의 편차
팬 제어기 프로그래밍
팬 제어기를 조작하기 전에, 테스트는 해당 팬 제어기의 초기 상태를 저장하여 테스트 완료 후 이 초기 상태로 복구합니다.
각 제어기는 두 개의 팬(기본 및 보조)을 제어합니다. 각 팬에는 회전 당 2 펄스를 생성 하는 회전 속도계 출력이 있습니다. 마스터 팬의 회전 속도계 출력(tach0)은 제어기의 내부 제어 루프에 대한 피드백 슬레이브 팬의 속도 읽기에만 사용됩니다. 제어기는 전체 켜기 및 끄기 제어 뿐만 아니 라 Open-Loop 또는 Closed-Loop 조작을 지원합니다.
신호입니다. 슬레이브 팬의 회전 속도계 출력(tach1)은
테스트 결과
모든 테스트 결과는 Sun Fire V40z 서버에 해당됩니다. Sun Fire V20z 서버도 유사한 출 력 결과를 표시하지만 팬 그룹이 더 적습니다.
팬 통과
speed.allFans 2 Passed
Test Details:
fan1.tach Passed
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7920
High Delta: -1.01%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
50 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
Low Actual: 6780
Low Delta: 10.05%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
fan2.tach Passed
Controller: fan-ctrl2
High Rated: 8000
High Actual: 8580
High Delta: +6.76%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6607
Low Actual: 7320
Low Delta: 9.75%
Low Limits: -/+15%
Sensor: Fan 2 measured speed (ID=fan2.tach)
Component(s): Fan 2 (ID=NA)
fan3.tach Passed
Controller: fan-ctrl3
High Rated: 8000
High Actual: 8100
High Delta: +1.23%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6237
Low Actual: 6900
Low Delta: 9.61%
Low Limits: -/+15%
Sensor: Fan 3 measured speed (ID=fan3.tach)
Component(s): Fan 3 (ID=NA)
fan4.tach Passed
Controller: fan-ctrl3
High Rated: 8000
High Actual: 8760
High Delta: +8.68%
부록 A 진단 테스트 결과 51
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6745
Low Actual: 7320
Low Delta: 7.85%
Low Limits: -/+15%
Sensor: Fan 4 measured speed (ID=fan4.tach)
Component(s): Fan 4 (ID=NA)
고속 오류
speed.allFans 1 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is excessively fast at high speed setting; inlet air path may be obstructed.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 10900
High Delta: +36.25%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6329
Low Actual: 6900
Low Delta: 8.27%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
speed.allFans 2 FAILED
Test Details:
fan1.tach FAILED
Failure: fan1 is too fast at low setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7920
High Delta: -1.01%
52 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
Low Actual: 7200
Low Delta: 16.88%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
저속 오류
speed.allFans 1 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is too slow at low setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 8760
High Delta: +8.68%
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6329
Low Actual: 5200
Low Delta: -18.46%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
speed.allFans 2 FAILED
Failure Details:
fan1.tach FAILED
Failure: fan1 is too slow at high setting.
Controller: fan-ctrl2
High Rated: 8000
High Actual: 7000
High Delta: -14.28%
부록 A 진단 테스트 결과 53
High Limits: -10/+35%
Low Setpoint: 6160
Low Expected: 6098
Low Actual: 6780
Low Delta: 10.05%
Low Limits: -/+15%
Sensor: Fan 1 measured speed (ID=fan1.tach)
Component(s): Fan 1 (ID=NA)
메모리
메모리 테스트는 로드 가능한 커널 모듈 및 사용자 공간 구성요소로써 구현됩니다. 커 널 모듈은 대부분의 테스트를 실제로 수행하는 ioct1 기능을 구현합니다.
참고 – 2.x.x.x 이전 버전의 경우, 메모리 테스트를 실행하기 전에 BIOS 설정에서 인터
리빙이 비활성화되어 있는지 확인하십시오. 2.x.x.x 이상 버전의 경우, BIOS에서 인터리 빙을 비활성화하지 마십시오.
March 테스트
데이터는 아래에서 위로 메모리에 기록됩니다. 먼저 모든 0x0을 기록합니다. 그 다음, 0x0 을 읽고 확인하면서 0x5를 기록합니다. 0x5를 읽고 확인하면서 0x0을 기록합니다. 그 다음, 위에서 아래로 이동하며 읽기를 시작합니다. 0x0을 읽고 확인하면서 0x5를 기록합니다. 0x5를 읽고 확인하면서 0x0을 기록합니다. 그런 다음, 0x0을 읽고 확인합니다. 이 전체 프로 세스는 반복되지만 0x5는 0xa로 대체됩니다
.
RandAddr 테스트
데이터는 아래에서 시작하여 위를 향해 이동하면서 메모리에 기록됩니다. 메모리 데이 터의 위치는 주소 공간에 기록됩니다. 그런 다음, 테스트가 주소 공간에서 임의 확인을 수행합니다. 해당 공간에 주소와 동일한 데이터가 없으면 테스트는 실패합니다.
Retention 테스트
데이터는 아래에서 시작하여 위쪽으로 이동하면서 메모리에 기록됩니다. 테스트는 메 모리의 0x5와 0xa를 교대로 채워 메모리의 체커보드 레이아웃을 완료합니다. 테스트는 100ms 동안 정지한 다음 0x5 및 0xa에 대한 메모리를 읽고 확인합니다.
54 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
테스트 결과
메모리 테스트 통과
march.allDimms PF3 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
randaddr.allDimms PF4 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
retention.allDimms PF5 Passed
Test Details:
Memory Configuration: Total: 3072Mb
CPU0-1024Mb CPU1-2048Mb
CPU0: Width[128] Addr 0 - 3fffffff
DIMM 0 256Mb Addr 0000000000 - 001fffffff Even Quad Word
DIMM 1 256Mb Addr 0000000000 - 001fffffff Odd Quad Word
DIMM 2 256Mb Addr 0020000000 - 003fffffff Even Quad Word
DIMM 3 256Mb Addr 0020000000 - 003fffffff Odd Quad Word
부록 A 진단 테스트 결과 55
서비스 오류
retention.allDimms PF1 FAILED
Failure Details:
Failure: Unable to load services.
ECC 오류
march.allDimms 1 FAILED
Test Details:
Failure: ECC ERROR @ Address:0x01a000e700:CPU1, DIMM - 2
CPU 1 DIMM 2 (ID=cpu1.mem2.vpd)
Correctable, Syndrome 0x18, Multiple Errors Occurred
CPU1 Function 3 ECC Registers:
00 MCA NB STAT LOW: 85080a13 MCA NB STAT HIGH: 85080a13
Memory Configuration: Total: 7680Mb
CPU0-2560Mb CPU1-5120Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 0256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1dfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
*DIMM 2 512Mb Addr 01a0000000 - 01dfffffff Even Quad Word
DIMM 3 512Mb Addr 01a0000000 - 01dfffffff Odd Quad Word
BIOS 설정 오류
march.allDimms 1 FAILED
Test Details:
Failure: Need to disable interleaving in BIOS setup before running memory tests.
Data Comparison Failure
march.allDimms 1 FAILED
Test Details:
Failure: Data Miscompare @ Addr 0x1a0000008, CPU 1 DIMM 3
56 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
Expected : [5555555555555555]
Observed : [5555555555505555]
Difference : [50000]
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
*DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
randaddr.allDimms 2 Passed
Test Details:
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
retention.allDimms 3 FAILED
Test Details:
Failure: Data Miscompare @ Addr 0x1a0000008, CPU 1 DIMM 3
Expected : [5555555555555555]
부록 A 진단 테스트 결과 57
Observed : [5555555555505555]
Difference : [50000]
Memory Configuration: Total: 7168Mb
CPU0-2560Mb CPU1-4608Mb
CPU0: Width[128] Addr 0 - 9fffffff
DIMM 0 256Mb Addr 0080000000 - 009fffffff Even Quad Word
DIMM 1 256Mb Addr 0080000000 - 009fffffff Odd Quad Word
DIMM 2 1024Mb Addr 0000000000 - 007fffffff Even Quad Word
DIMM 3 1024Mb Addr 0000000000 - 007fffffff Odd Quad Word
CPU1: Width[128] Addr a0000000 - 1bfffffff
DIMM 0 2048Mb Addr 00a0000000 - 019fffffff Even Quad Word
DIMM 1 2048Mb Addr 00a0000000 - 019fffffff Odd Quad Word
DIMM 2 256Mb Addr 01a0000000 - 01bfffffff Even Quad Word
*DIMM 3 256Mb Addr 01a0000000 - 01bfffffff Odd Quad Word
NIC
NIC phyLoop 테스트는 PHY에 루프백 테스트를 수행합니다. 이를 수행하기 위해 해당 테스트는 NIC 장치 드라이버에 PHY 루프백 모드를 설정하고 증가 바이트 패턴 [0x00,0x01,0x02…0xff]으로 1500 바이트의 데이터 버퍼를 초기화하여 NIC 데이터를 기록합니다. 그런 다음, 테스트는 고정된 0xe5 패턴으로 번째 버퍼를 초기화하고 NIC으로부터 1500 바이트를 읽습니다. 테스트는 해당 값으로부터 기록된 데이터를
교합니다. 마지막으로, 테스트는 루프백 모드를 끕니다.
테스트 결과
NIC 통과
phyLoop.Nic.0 PF1 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
phyLoop.Nic.1 PF2 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
58 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
서비스 오류
Unable to load the driver bcm5700.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Unable to load service.
Component(s): Motherboard (ID=planar.vpd)
링크 다운 오류
The link status of the device is down.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link is down.
Component(s): Motherboard (ID=planar.vpd)
링크 설정 불일치 오류
The link status of the device is mismatched.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link setting mismatch.
Component(s): Motherboard (ID=planar.vpd)
알 수 없는 링크 상태 오류
The link status of the device is unknown.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Link status unknown.
Component(s): Motherboard (ID=planar.vpd)
루프백 오류
The loopback is off.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Loopback is off.
부록 A 진단 테스트 결과 59
Component(s): Motherboard (ID=planar.vpd)
쓰기 오류
Unable to write to loopback device.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Write error. Tried to write <X> bytes, only wrote <Y>.
Component(s): Motherboard (ID=planar.vpd)
읽기 오류
Unable to read the loopback device.
phyLoop.Nic.0 PF1 FAILED
Failure Details:
Failure: Read error. Tried to read <X> bytes, only read <Y>.
Component(s): Motherboard (ID=planar.vpd)
비교 오류
해당 장치의 값이 방금 기록된 것과 다릅니다. 해당 오류의 오프셋은 데이터 버퍼 앞 부 분의 16진수 오프셋입니다. 예상 및 실제 오프셋은 일치하지 않는 첫 번째 16진수 바이 트입니다.
phyLoop.Nic.1 PF2 FAILED
Failure Details:
Failure: Compare error. At offset 343 expected 43, got bc.
Component(s): Motherboard (ID=planar.vpd)
저장 장치
저장 장치 테스트는 SCSI 장치에 대해 자가 테스트 명령을 실행합니다. 자가 테스트 명 령에는 긴 형식과 짧은 형식이 있습니다. 해당 테스트의 실행 시간은 해당 장치 자체의 기능입니다.
해당 장치가 존재할 경우, 짧거나 긴 형식의 Send Diagnostic 명령이 포함된 SCSI 하위 시스템 제어 블록은 실행을 위해 SCSI 드라이버로 전달됩니다.
60 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
테스트 결과
저장 장치 통과
long.SCSI_0 PF1 Passed
Test Details:
Device: SEAGATE ST336607LC
Version: 0004
Serial number: 3JA0KJF6000073248EGM
Device type: disk
Component(s): Hard disk drive 0 (ID=NA)
장치가 자가 테스트 명령을 인식할 수 없는 오류
The device does not recognize the self-test command.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Error starting DST background short test: Illegal Request
Component(s): Hard disk drive 1 (ID=NA)
장치가 자가 테스트 명령을 처리할 수 없는 오류
The device is unable to accept and process self-test commands. The output includes the SCSI sense key.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: SCSI command failed: Sense Key[3]: Not Ready
Component(s): Hard disk drive 1 (ID=NA)
The following is the list of sense keys.
No Sense
Recovery Data
Not Ready
Medium Error
Hardware Error
Illegal Request
Unit Attention
부록 A 진단 테스트 결과 61
Data Protect
Blank Check
Vendor Specific
Copy Aborted
Volume Overflow
Miscompare
Reserved
자가 테스트 오류
자가 테스트 명령이 실패합니다. "첫 번째 오류 주소"는 공급자의 테스트에서 어떤 세그 먼트가 실패했는지 나타냅니다.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Test failed (Failing segment) Address of first failure{0x0).
Component(s): Hard disk drive 1 (ID=NA)
자가 테스트 손상 오류
이 자가 테스트 명령은 불필요한 정보를 반환합니다.
short.SCSI_1 PF2 FAILED
Failure Details:
Failure: Invalid Self-Test Results Page Returned by System.
Component(s): Hard disk drive 1 (ID=NA)
플래시 메모리
플래시 메모리 진단은 SP 플래시 메모리에 쓸 수 있는지를 검증합니다. 진단을 반복하 면 초기에 삭제된 상태(1)의 두 비트(각 칩의 한 비트씩)가 0으로 뒤집어집니다. 결국, 플 래시의 진단 영역의 "1" 비트가 모두 "사용"되어 플래시의 진단 섹터는 두 비트에 기록 하기 전에 테스트가 진행 중일 때 삭제됩니다.
62 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
테스트 결과
발생 가능한 장애의 대부분은 MTD 드라이버를 통해 쉽게 플래시 부품에 액세스하지 못하는 것과 관련이 있습니다. 이는 자주 발생하지 않으며 소프트웨어에 문제가 있을 가능성이 높습니다. 이 문제가 지속될 경우, 재조정을 위해 우선 서비스 프로세서의 전 체 플래시를 삭제한 후 다시 프로그래밍 해보십시오. 서비스 프로세서 업데이트 방법에 대한 사항은 시스템 관리 설명서를 참조하십시오.
플래시 메모리 통과
write.flash 2 Passed
Test Details:
Component(s): Motherboard (ID=planar.vpd)
시스템 열기 오류
읽기/쓰기 액세스를 위한 플래시 섹터를 열 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to open flash driver: <errno string>
Component(s): Motherboard (ID=planar.vpd)
시스템 읽기 오류
플래시 섹터를 읽을 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to read flash memory: <errno string>
Component(s): Motherboard (ID=planar.vpd)
장치 액세스 오류
플래시 섹터의 크기를 판별할 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Canít determine erase size of device: <errno string>
Component(s): Motherboard (ID=planar.vpd)
부록 A 진단 테스트 결과 63
시스템 쓰기 오류
플래시 섹터에 쓸 수 없습니다.
write.flash 1 FAILED
Failure Details:
Failure: Unable to open flash driver: <errno string>
Component(s): Motherboard (ID=planar.vpd)
지우기 오류
플래시 섹터를 지울 수 없습니다. 이 오류는 결함이 있는 부품이나 기타 하드웨어 오류 를 나타낼 수 있습니다.
write.flash 1 FAILED
Failure Details:
Failure: Erase operation failure: <errno string>
Component(s): Motherboard (ID=planar.vpd)
매직 번호 오류
플래시 예약된 파티션의 0x0 오프셋 매직 번호가 정확하지 않습니다. 예상되는 값은 0x44494147 또는 0xffffffff(지워짐)입니다. 이는 일부 프로세스가 우연히 진단 영역에 쓰 여졌음을 나타낼 수 있습니다. 서비스 프로세서를 다시 플래시하고 테스트하십시오. 서 비스 프로세서 업데이트 방법에 대한 사항은 시스템 관리 설명서를 참조하십시오.
write.flash 1 FAILED
Failure Details:
Failure: Magic number of diagnostics area incorrect, Expected [0x44494147], Actual [0xNNNNNNNN].
Component(s): Motherboard (ID=planar.vpd)
데이터 비교 오류
플래시 섹터의 값이 방금 기록된 것과 다릅니다. 이것은 하드웨어 장애일 수 있습니다. 서비스 프로세서를 다시 플래시하고 테스트하십시오. 서비스 프로세서 업데이트 방법 에 대한 사항은 시스템 관리 설명서를 참조하십시오.
write.flash 1 FAILED
Failure Details:
Failure: Data Miscompare: Expected [0xNNNNNNNN], Actual [0xNNNNNNNN].
64 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
Component(s): Motherboard (ID=planar.vpd)
LED
해당 테스트 그룹은 LED 드라이버의 기능을 확인합니다. 테스트는 I2C로 연결된 LED 드라이버 칩의 인터레스트 비트 값을 포함하며 해당 비트 값을 반대로 하여 칩에 기록 하고 새 값을 읽습니다. 또한, 실제로 토글되었는지 확인한 후 초기 값을 다시 기록하고 해당 값이 정확한지 확인합니다. LED는 이 동작을 나타내도록 변경되지 않습니다.
테스트 결과
다음 예는 4300 서버에 적용됩니다. 2100 서버의 경우 LED 구성요소가 다르고 수가 적 지만 테스트 결과는 동일합니다. 이 예는 축약된 버전의 보고서로 구성됩니다.
LED 통과
toggleLED.allLeds 3 Passed
Test Details:
cd Passed
Sensor: CDROM Light path location LED (ID=cd.lp)
Component(s): CD ROM drive (ID=NA)
cpu0 Passed
Sensor: CPU 0 Light path location LED (ID=cpu0.lp)
Component(s): CPU 0 (ID=cpu0.vpd)
cpu0.mem0 Passed
Sensor: CPU 0 Dimm 0 Light path location LED (ID= cpu0.mem0.lp)
Component(s): CPU 0 DIMM 0 (ID=cpu0.mem0.vpd)
cpu0.mem1 Passed
Sensor: CPU 0 Dimm 1 Light path location LED (ID= cpu0.mem1.lp)
Component(s): CPU 0 DIMM 1 (ID=cpu0.mem1.vpd)
cpu0.mem2 Passed
Sensor: CPU 0 Dimm 2 Light path location LED (ID= cpu0.mem2.lp)
Component(s): CPU 0 DIMM 2 (ID=cpu0.mem2.vpd)
cpu0.mem3 Passed
부록 A 진단 테스트 결과 65
Sensor: CPU 0 Dimm 3 Light path location LED (ID= cpu0.mem3.lp)
Component(s): CPU 0 DIMM 3 (ID=cpu0.mem3.vpd)
cpu0.memvrm Passed
Sensor: CPU 0 Memory VRM Light path location LED (ID=cpu0.memvrm.lp)
Component(s): CPU 0 memory VRM (ID=cpu0.memvrm.vpd)
cpu0.vrm Passed
Sensor: CPU 0 VRM Light path location LED (ID= cpu0.vrm.lp)
Component(s): CPU 0 VRM (ID=cpu0.vrm.vpd)
cpuplanar Passed
Sensor: Daughtercard Light path location LED (ID= cpuplanar.lp)
Component(s): CPU Daughter Card (ID=cpuplanar.vpd)
fault Passed
Sensor: System Fault Indication (ID=faultswitch)
Component(s): Fault light (ID=NA)
floppy Passed
Sensor: Floppy Light path location LED (ID=floppy.lp)
Component(s): Floppy disk drive (ID=NA)
oppanel Passed
Sensor: LCD Light path location LED (ID=frontpanel.lp)
Component(s): Front panel (ID=pic.vpd)
identify Passed
Sensor: Identify switch (ID=identifyswitch)
Component(s): Identify light (ID=NA)
front-fans Passed
Sensor: Fan Board Light path location LED (ID=pcifan.lp)
Component(s): Front Fan backplane (ID=NA)
planar Passed
Sensor: Motherboard Light path location LED (ID= planar.lp)
Component(s): Motherboard (ID=planar.vpd)
disk-backplane Passed
Sensor: SCSI Backplane Light path location LED (ID= scsibp.lp)
Component(s): SCSI backplane (ID=scsibp.vpd)
66 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
장치 없음 경고
toggleLED.allLeds 3 Warning
Test Details:
cd Not Present
Sensor: CDROM Light path location LED (ID=cd.lp)
Component(s): CD ROM drive (ID=NA)
읽기 오류
Unable to read the device.
toggleLED.allLeds 3 FAILED
Test Details:
planar FAILED
Failure: Unable to read LED. <errno string>
Sensor: Motherboard Light path location LED (ID= planar.lp)
Component(s): Motherboard (ID=planar.vpd)
쓰기 오류
Unable to write to the device.
toggleLED.allLeds 3 FAILED
Test Details:
planar FAILED
Failure: Unable to write to LED. <errno string>
Sensor: Motherboard Light path location LED (ID= planar.lp)
Component(s): Motherboard (ID=planar.vpd)
온도
각 온도 센서가 초기화되고 현재 온도가 해당 장치에서 읽히면 온도가 위험 및 경고 임 계값과 비교됩니다. 온도가 임계값을 초과할 경우, 오류가 표시됩니다.
주어진 온도에 대한 현재 임계값 설정을 보려면 SP 명령 sensor get을 사용하십시오.
localhost # sensor get -i cpu0.temp -cwWC
Identifier Crit Low Warn Low Warn High Crit High
부록 A 진단 테스트 결과 67
cpu0.memtemp NA NA 68.00 70.00
테스트 결과
온도가 허용 가능한 범위에 있을 경우, 해당 값이 섭씨로 표시됩니다.
온도 통과
read.cpu0.memtemp 1 Passed
Test Details:
Temperature: 67.3
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
판독 값이 통과된 경고 임계값을 초과함
온도 값은 경고 임계값 이상 또는 이하입니다.
read.ambient.temp 2 Passed
Test Details:
Temperature: 26.8
Warning: Temperature exceeds the warning threshold of
22.0, but is still safe.
Sensor: Ambient air temp (ID=ambienttemp)
Component(s): Box (enclosure) (ID=NA)
장치 없음 경고
장치가 없습니다.
Read.cpu0.memtemp 1 Warning
Failure Details:
Failure: Device not present.
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
읽기 오류
장치를 읽을 수 없습니다.
68 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
read.cpu0.memtemp 1 FAILED
Failure Details:
Failure: Unable to read device temperature.
Sensor: CPU 0 Memory temperature (ID=cpu0.memtemp)
Component(s): Motherboard (ID=planar.vpd)
판독 값이 위험 임계값을 초과한 오류
온도 값은 위험 임계값 이상 또는 이하입니다.
read.cpu0.temp 2 FAILED
Test Details:
Failure: Sensor is below critical threshold: 29.2 < 30.0
Sensor: CPU 0 temperature (ID=cpu0.dietemp)
Component(s): CPU 0 (ID=cpu0.vpd)
read.cpu1.temp 23 FAILED
Test Details:
Failure: Sensor exceeds critical threshold: 30.0 > 29.2
Sensor: CPU 0 temperature (ID=cpu1.dietemp)
Component(s): CPU 0 (ID=cpu1.vpd)
조작 패널
조작 패널 테스트 모듈은 현재의 디스플레이 버퍼 내용을 읽어 저장합니다. 그런 다음, 디스플레이 버퍼에 대해 5가지의 다른 데이터 패턴(0xFF 0xAA 0x55 0x66 0x99)의 쓰 기/읽기/비교를 수행합니다. 테스트가 완료된 후, 해당 디스플레이의 초기 내용이 복 원됩니다.
테스트 결과
OpPanel 통과
write.opPanel 1 Passed
Test Details:
Sensor: Operator Panel virtual device (ID=oppanel)
Component(s): Front panel
부록 A 진단 테스트 결과 69
읽기 오류
디스플레이 버퍼를 읽을 수 없습니다.
write.opPanel 2 FAILED
Failure Details:
Failure: Unable to read OpPanel. <errno string>
Sensor: Operator Panel virtual device (ID=oppanel)
Component(s): Front panel
쓰기 오류
디스플레이 버퍼에 쓸 수 없습니다.
write.opPanel 2 FAILED
Failure Details:
Failure: Unable to write to OpPanel. <errno string>
Sensor: Operator Panel virtual device (ID=oppanel)
Component(s): Front panel
데이터 비교 오류
디스플레이 버퍼의 데이터가 방금 쓰여진 데이터와 다릅니다.
write.opPanel 2 FAILED
Failure Details:
Failure: Compare failed at line 2, char 12. Expected AA and got 23.
Sensor: Operator Panel virtual device (ID=oppanel)
Component(s): Front panel
전원 공급 장치
전원 테스트 모듈은 이중 전원 공급 장치가 있는 Sun Fire V40z 서버에서만 사용 가능 합니다.
해당 전원 공급 장치는 각 전원 공급 장치의 존재를 확인하고 전원 백플레인의 상태 레 지스터를 읽습니다. 공급 장치가 있을 경우, PRS의 활성화된 전원 양호 상태 비트를 읽 습니다. 해당 공급 장치에 대한 VPD를 읽으면 검사값이 확인됩니다. 각 공급 장치에 대
, 통과 상태는 다음과 같은 기준에 따라 판별됩니다.
공급 장치가 있습니다.
70 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
활성 비트가 PRS에 설정되어 있습니다.
전원 양호 상태가 true입니다.
■ VPD를 읽을 수 있습니다(검사값 오류가 치명적이지 않음).
공급 장치가 있는 경우, 경고 상태가 없거나 전원 양호 상태가 있으면 오류로 간주됩니 다. 누락된 전원 공급 장치에서 오류가 아닌 경고만 발생합니다. 각 전원 공급 장치에 대 한 전원 공급 장치 상태는 "Passed", "FAILED" 또는 "Warning" 중 하나입니다. 전원 공 급 장치 마더보드의 NPUI(Net Power Usage Indicator)를 읽어 각 공급
장치의 현재 전 원 소비를 판별합니다. 각 공급 장치는 출력 신호를 생성합니다. 이 신호의 전압은 해당 공급 장치의 전원 소비에 비례합니다. 이 전압은 전원 공급 장치 마더보드의 PCF8591 이중 ADC에 대한 입력입니다. 변환된 값은 여기서 읽혀지며 전원 소비를 계산할 때 사 용됩니다.
테스트 결과
전원 통과
read.allPowerSupplies 9 Passed
Test Details:
Power Supply 1 Status: Passed
Presence Detect: Present
Enabled: True
Power Good: True
Part Number: S00440
ECN: A01
Serial Number: PM16768
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 1 (ID=ps1.vpd)
Power Supply 2 Status: Not Present
전원 양호 오류
read.allPowerSupplies 9 FAILED
Failure Details:
Power Supply 1 Status: Power good indicator is false.
Presence Detect: Present
Enabled: True
부록 A 진단 테스트 결과 71
Power Good: False
Part Number: S00440
ECN: A01
Serial Number: PM16768
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 1 (ID=ps1.vpd)
Power Supply 2 Status: Passed
Presence Detect: Present
Enabled: True
Power Good: True
Part Number: S00440
ECN: A01
Serial Number: PM16769
Manufacturer: CHEROKEE
Date of Manufacture: 12-24-03
Component(s): Power supply 2 (ID=ps2.vpd)
읽기 오류
read.allPowerSupplies 9 FAILED
Failure Details:
Failure: Unable to read device. (Power supply 2)
72 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
부록 B
시스템 이벤트
이벤트 세부 정보
이 부록에는 시스템 이벤트의 세부 정보 및 문제 해결을 위한 제안 사항이 나열된 표가 포함되어 있습니다. 해당 표는 구성요소 및 하부 유형의 알파벳 순서로 구성됩니다.
참고 – sp get events 명령을 사용하거나 SM 콘솔의 시스템 이벤트 테이블을 열면 시스
템 이벤트를 볼 수 있습니다. IPMI 이벤트는 대개 시스템의 센서에 대한 정보를 제공합 니다. 자세한 사항은 시스템 관리 명령 설명서를 참조하십시오.
B-1 <comp id>, Voltage, Temp 또는 Fan:Sensor
필드 값설
구성요소 <comp id>, Voltage, Temp 또는 Fan
하부 유형 Sensor:Voltage, Temp 또는 Fan
심각도 Critical, Warning 또는 Informational
요약 설명 센서 임계값이 교차되었습니다.
73
B-1 <comp id>, Voltage, Temp 또는 Fan:Sensor (계속)
필드 값설
메시지
Sensor <sensor> reports <value> <type> [ [but should be [between A and B] | [greater than B] | [less than A] ] | [and has returned to normal]
상세 설명 시스템 관리 소프트웨어는 전압, 온도, 팬 속도 등의 다양한 센서를 모
니터링합니다. 센서에는 공칭, 경고 및 위험 범위를 정의하는 임계값이 있습니다. 센서 값이 이 범위에서 움직이면 시스템 이벤트가 생성되어 지속됩니다.
단계 센서 임계값을 수정하지 마십시오. 센서 임계값이 수정되었을 경우 기
본 설정으로 재설정하십시오. 온도 센서는 사이트 공기 조절이 제대로 작동하고
시스템에 대한 공기 흐름이 적절한지 확인합니다. 시스템 구성요소에 먼지가 쌓여있지는 않은지 확인합니다(특히 팬, 방열판 및 통풍구). CPU 방열판이 제대로 부착되었는지 확인합니다(나사가 규격에 맞고 레버가 올바른 위치에 고정되어 있는지). CPU와 방열판 사이에 충분한 열 그리스(Thermal Grease)가 있는지 확인합니다.
팬 센서는 팬에 먼지가 쌓여있지는 않은지 확인합니다. 외부 요인이 팬 날개에 방해가
되지 않는지 확인합니다. 팬이 작동하고 있는지 확인하 고, 작동하지 않을 경우 팬을 교체하십시오. 문제가 지속될 경우, 상태 가 양호한 팬으로 교체하십시오.
전압 문제의 경우, A/C 전압이 정확한지 확인하십시오. 최근에 A/C 불안정 현상(약화, 급전압, 절전)이 있었는지 판별합니다. VRM 모듈이 제대로 장착되었는지 확인합니다. 전압이 플러그 가능한 VRM 모듈에 서 나올 경우, 해당 모듈을 정상 모듈로 교체하여
문제가 지속되는지
확인합니다. 문제가 저절로 해결되거나 핫 플러그 가능한 구성요소(팬 또는 전원 공
급 장치)를 핫 스왑할 경우, 정상으로 돌아올 수 있습니다. SP를 재부팅 할 경우, 문제가 다시 발생하지 않으면 오류 상태는 정보로 재설정됩니 다.
B-2 CPU Planar, Configuration
필드 값설
구성요소
하부 유형
심각도
CPU planar
Configuration
War ni ng
요약 설명 호환되지 않는 Planar CPU Planar 감지되었습니다.
74 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-2 CPU Planar, Configuration (계속)
필드 값설
메시지
CPU Planar card is a different revision from main Planar card. This configuration may not operate properly and is unsupported.
상세 설명 CPU 카드에는 두 개정판이 있으며 서로 물리적 및 전자적으로 호환됩
니다. 시스템은 버전 1 카드와 버전 1 플래너, 버전 2 카드와 버전 2 플 래너의 연결만을 지원합니다. 이 경고는 혼합 버전을 사용중임을 나타 냅니다. 시스템이 작동하지만 특정 기능이 제대로 작동하지 않을 수 있 습니다(개정판 E CPU, DDR 400 메모리).
단계 CPU 카드를 적절한 버전으로 교체합니다.
B-3 CPU <X>, Configuration
필드 값설
구성요소
하부 유형
심각도
CPU <X>
Configuration
War ni ng
요약 설명 알 수 없는 CPU 모델이 시스템에 설치되었습니다.
메시지
CPU Family <x>, Model <y>, Stepping <z> is unknown, Thermal offset may lead to erroneous shutdowns.
상세 설명 SP가 시스템에 설치된 CPU의 특정 개정을 지원하지 않습니다.
단계 설치한 CPU가 이 시스템 유형에 맞는지, 엔지니어링 샘플은 아닌지 확
인합니다. SP 소프트웨어(필요한 경우, BIOS 소프트웨어 포함)를 최신 개정판으로 업데이트한 후 다시 시도합니다. 해당 문제가 지속될 경우, 추가
지원을 위해 판매 담당자에게 문의하십시오.
B-4 CPU <X>, Heartbeat
필드 값설
구성요소
하부 유형
심각도
CPU <X>
Heartbeat
Critical, Information
요약 설명 심박동이 중지 또는 재개되었습니다. 플랫폼 OS 실행이 중지되었거나
플랫폼 POCI 드라이버가 중지되었습니다.
부록 B 시스템 이벤트 75
B-4 CPU <X>, Heartbeat (계속)
필드 값설
메시지
CPU<x> [has not sent a heartbeat in the last minute] | [has resumed sending heartbeats] | [Platform no longer running OS]
상세 설명 플랫폼 측 드라이버가 SP에 대한 심박동 신호 전송을 중지했거나 재개
했습니다. 또는 심박동이 손실되는 동안 플랫폼 OS가 종료되었습니다. 적절한 플랫폼 드라이버가 설치되어 정상으로 작동할 때, 플랫폼은 주 기적인 신호를 SP로 전송하여 플랫폼이 활동 중임을 나타냅니다. 심박 동 신호가 1분 이상 손실될 경우, SP는 경고 메시지를 생성합니다. 심박 동 신호가 다시
시작되거나 시스템이 재부팅되면 해당 메시지가 전송
됩니다.
단계 SP가 이 이벤트를 감지하지 못하면 플랫폼 측에서 플랫폼 OS 종료가 초
기화되며 이로 인해 이 문제가 발생합니다. (플랫폼 OS가 종료되면 SP에 서 이 이벤트를 인식하기 전에 플랫폼 드라이버가 중지될 수 있습니다.) 이는 플랫폼 드라이버 재설치 또는 업그레이드로 인해 유발될 수도 있습 니다. 또한, 플랫폼 OS의 충돌
또는 중지로 인해 발생할 수 있습니다. 이
러한 경우, 시스템을 재부팅하면 문제를 해결할 수 있습니다.
B-5 CPU <X>, MachineCheck
필드 값설
구성요소
하부 유형
심각도
CPU<X>
MachineCheck
Critical, Warning, Information
요약 설명 호환되지 않는 Planar 및 CPU Planar가 감지되었습니다.
메시지
상세 설명
A platform CPU has issued a machine check.
Machine Check error detected on cpu <CPU>. [Machine Check in Progress.] [Error IP Valid.] [Restart IP Valid.] Error detected in [Data Cache] | [InstructionCache] | [Bus Unit] | [Load/Store unit] | [North Bridge] | [Invalid bank reached]. [Second error detected.] [Error not corrected] [Error reporting disabled.] [Misc. register contains more info.] [Error occurred at address <address>.] [Processor state may have been corrupted] [Correctable ECC error.] [Un-correctable ECC error.] [Detected on a scrub.] Raw data: <data>
단계 28페이지의 "시스템 점검 오류" 참조하십시오.
76 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-6 CPU <X>, TempSensor
필드 값설
구성요소
하부 유형
심각도
CPU<X>
Te mp Se ns or
Critical
요약 설명 CPU 열 이동이 발생했습니다.
메시지
CPU thermal trip has occurred.
상세 설명 CPU가 열 이동 이벤트를 나타내고 결과적으로 시스템이 종료되었습
니다.
단계 이는 CPU 온도가 약 120C에 도달했을 때 발생하며 프로세서가 손상을
받지 않도록 안전을 보장해주는 조작입니다. 이 조작이 발생할 경우, 유일한 도움은 시스템에 대해 A/C 전원을 순환하는 것입니다. 45페이 지의 "열 이동 이벤트"를
B-7 CPU <X>DIMM<X>, MachineCheck
필드 값설
구성요소
하부 유형
심각도
CPU<X>DIMM<X>
MachineCheck
Critical, Warning, Information
참조하십시오.
요약 설명 DIMM 오류가 발생했습니다.
메시지
[A [fatal | recoverable] machine check error occurred on cpu <cpu>: dimm <dimm>] | [Correctable error rate exceeded, consider replacing the dimm.]
상세 설명 복구 가능한 오류의 경우, DIMM 모듈에서는 높은 비율의 수정 가능한
오류가 발생합니다. 이는 시스템 성능과 안정성에 영향을 미칩니다. 치 명적인 오류의 경우, DIMM 모듈에 복구 불가능한 오류가 발생하고 데 이터가 손상됩니다.
단계 두 가지 경우, DIMM을 정상 DIMM으로 교체하고 문제가 지속되는지
살펴봅니다. 문제가 해결되지
않았을 경우, DIMM 커넥터 부분에 잔해 (먼지, 금속 가루등) 있는지 확인하고 외부 요인을 모두 제거하기 위해 압축 공기로 커넥터를 청소합니다. 동일한 메모리 제어기에 연결된 다른 DIMM과 커넥터를 연결 해제하여 점검합니다. DIMM 에지 커넥터가
끗하고 부식되지 않았는지 확인합니다. 시스템에 적합한 메모리만 사용 하십시오. 커넥터 부분을 깨끗이 한 후, DIMM을 교체합니다.
부록 B 시스템 이벤트 77
B-8 Planar, Crowbar
필드 값설
구성요소
하부 유형
심각도
Planar
Crowbar
Critical, Information
요약 설명 Crowbar, 전원 공급 장치 또는 VRM 모듈에 치명적인 오류가 발생했
습니다.
메시지
Sensor <sensor> reports that [crowbar failure has been detected ­attempting to power system off] | [crowbar failure has been cleared].
상세 설명 VRM 모듈 중 하나가 과열 상황 및 과전류 상황이거나 전압을 제대로
조정할 수 없거나 해당 상황이 제거되었음을 나타냅니다. 이는 보통 장 애가 감지되었을 때의 과열 오류입니다.
단계 45페이지의 "열 이동 이벤트"를 참조하십시오.
B-9 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Critical
요약 설명 전원 공급 장치 팬이 실패했습니다.
메시지
Sensor <sensor> reports that the [fans have failed].
상세 설명 전원 공급 장치 내부 팬이 실패했습니다.
단계 전원 공급 장치를 교체합니다.
B-10 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
War ni ng
요약 설명 전원 공급 장치 AC 연결이 해제되었습니다.
78 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-10 Planar, Power (계속)
필드 값설
메시지
<power supply> does not appear to be connected to AC power
상세 설명 전원 공급 장치가 시스템에 연결되었지만 전원을 공급하지 않습니다.
단계 AC 라인 코드가 연결되어 있는지 확인하고 연결되지 않은 콘센트에
AC 전원이 있는지 확인하십시오. 상태가 양호한 전원 공급 장치로 교 체하십시오.
B-11 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명 전원 공급 장치가 복구되었습니다.
메시지
<power supply> has resumed normal operation
상세 설명 이전에 실패했거나 연결이 해제된 전원 공급 장치가 현재 사용 가능하
며 정상적으로 작동합니다.
단계 해당 없음
B-12 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명 전원 공급 장치가 설치되었습니다.
메시지
<power supply> installed
상세 설명 새 전원 공급 장치가 시스템에 연결 및 인식되었습니다.
단계 해당 없음
부록 B 시스템 이벤트 79
B-13 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명 전원 공급 장치가 제거되었습니다.
메시지
<power supply> removed
상세 설명 전원 공급 장치 중 하나에 더 이상 액세스할 수 없습니다. 해당 전원 공
급 장치가 제거되었을 수 있습니다.
단계 해당 없음
B-14 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Information
요약 설명 전원 공급 장치 팬이 장애로부터 복구되었습니다.
메시지
Sensor <sensor> reports that the fans have resumed normal operation.
상세 설명 전원 공급 장치 안의 내부 팬이 장애로부터 복구되어 현재 정상적으로
작동합니다.
단계 해당 없음
B-15 Planar, Power
필드 값설
구성요소
하부 유형
심각도
Planar
Power
Critical
요약 설명 전원 공급 장치에 장애가 발생했습니다.
80 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-15 Planar, Power (계속)
필드 값설
메시지
<power supply> has failed (or is not plugged in), now running in degraded condition
상세 설명 전원 공급 장치가 실패했거나 연결되지 않았습니다.
단계 AC 라인 코드가 연결되어 있는지 확인하고 연결되지 않은 플러그에
AC 전원이 있는지 확인하십시오. 상태가 양호한 전원 공급 장치로 교 체하십시오.
B-16 Planar, PowerGood
필드 값설
구성요소
하부 유형
심각도
Planar
PowerGood
War ni ng
요약 설명 전원 양호 장애가 발생했습니다.
메시지
Power good failure detected - latched values are DDR: <x>, CPU, <X>, LTD: <x>, S0: <x>.
상세 설명 PRS 칩이 전원 양호 신호 중 하나에서 오류를 감지했으며 결과적으로
시스템을 종료했습니다. 이는 대개 불량 전압 조절 모듈, 불량 전원 공 급 장치 또는 A/C 약화 또는 장기간의 급전압으로 인해 발생합니다. DDR 값은 어떤 DDR VRM이 문제를 유발했는지 나타냅니다(각 니블 에 3210
의 고 비트부터 저 비트로 번호를 매기며 두 니블은 각 VRM과 관련됩니다). CPU 값은 어떤 CPU VRM이 문제를 유발했는지 나타냅 니다(상위 니블은 VRM 모듈을 나타냄). LDT 값은 어떤 LDT 조정자가 문제를 유발했는지 나타냅니다. S0 값은 어떤 기타 조정자가 문제를 유 발했는지 나타냅니다(0x40 = A/C, 0x20 = 전원 공급 장치). LDT 값의 일부인 CPU 값의 하위 니블 또는 S0 값의 2-4 비트에 나타난 장애는 온 보드
조정자를 나타내며 교체할 수 없습니다.
단계 장애가 플러그 가능한 모듈을 나타내고 일관적일 경우, 해당 모듈을 교체
가능한 예비 모듈로 교체하십시오. 해당 오류가 플래너의 조정자를 나타 내고 일관적일 경우, 플래너를 수리해야 할 수 있습니다. 장애가 전원 공 급 장치를 나타내거나 일관적이지 않을 경우(조정자에서 조정자로 이동), 시스템의 A/C 전원이 정상이고 적절한 전압인지 확인하십시오. 문제가 해결되지
않을 경우, 두 개의 전원 공급 장치가 모두 설치되고 제대로 장 착, 연결되어 작동하고 있는지 확인하십시오(플랫폼 전원이 켜지면 녹색 LED가 밝아짐). 문제가 지속될 경우, 전원 공급 장치를 한번에 하나씩 교 체하십시오.
부록 B 시스템 이벤트 81
B-17 Planar, TempSensor
필드 값설
구성요소
하부 유형
심각도
Planar
Te mp Se ns or
Critical, Information
요약 설명 전원 공급 장치 온도가 너무 높거나 정상으로 돌아왔습니다.
메시지
Sensor <sensor> reports that the [temperature has exceeded specification] | [temperature has returned to normal].
상세 설명 해당 전원 공급 장치 온도가 너무 높거나 정상으로 돌아왔습니다.
단계 45페이지의 "열 이동 이벤트"를 참조하십시오.
B-18 Platform BIOS, BIOS
필드 값설
구성요소
하부 유형
심각도
Platform BIOS
BIOS
Critical
요약 설명 BIOS 오류가 발생했습니다.
메시지
Received [early] fatal error from BIOS: [Unable to do anything] | [Fixed Disk Failure] | [Shadow RAM Failed] | [System RAM Failed] | [Extended RAM Failed] | [System Timer Error] | [Real-Time Clock Error] | [Date and Time Setting Error] | [CPU ID Error] | [DMA Test Failed] | [Software NMI Failed] | [Fail-Safe Timer NMI Failed] | [Operating System not found] | [Parity Error (Memory)] | [Extended Memory Truncation] | [Memory Mismatched] | [Flash Image Validation Error] | [Flash Process Failure] | [Diagnostic Load Failure] | [IP Failure] | [Diag Failed Memtest] | [Incorrect BIOS image file (wrong platform type?)], Post Code: <code>
상세 설명
단계 19페이지의 "BIOS 오류 또는 경고 이벤트"를 참조하십시오.
82 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-19 Platform BIOS, BIOS
필드 값설
구성요소
하부 유형
심각도
Platform BIOS
BIOS
War ni ng
요약 설명 BIOS가 DIMM 장애를 보고합니다.
메시지
Dimm Fault: CPU <cpu>, Dimm <dimm>, [Fault Detected] | [Paired with faulty Dimm] | [Unknown]
상세 설명 메모리 구성 및 초기화 중에 플랫폼 BIOS가 DIMM에서 오류를 발견했
습니다. 해당 오류는 특정 DIMM으로 격리될 수 있거나 격리될 수 없 습니다. (메모리의 특정 구성은 단일 메모리 채널의 DIMM 쌍 간의 오 류 격리를 허용하지 않습니다.)
단계 메모리 진단 테스트를 실행하고 24페이지의 "DIMM 장애
"를 참조하십
시오.
B-20 Platform BIOS, BIOS
필드 값설
구성요소
하부 유형
심각도
Platform BIOS
BIOS
War ni ng
요약 설명 BIOS 경고가 발생했습니다.
메시지
Received warning from BIOS: [CMOS Battery Failure] | [CMOS Invalid] | [I20 Block Storage Device excluded from Boot Menu] | [CMOS Checksum Failure] | [CMOS Settings do not match hardware configuration] | [Memory truncated to valid functional memory] | [PCI-X Slot disabled for Golem Errata 56] | [Last Good Config Checksum Invalid] | [Last Good Config Invalid], Post Code: <code>
상세 설명
단계 19페이지의 "BIOS 오류 또는 경고 이벤트"를 참조하십시오.
부록 B 시스템 이벤트 83
B-21 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 사용자 키 디렉토리 생성 오류가 발생했습니다.
메시지
Error creating users' authorized_keys directories. It is likely that the persistent filesystem is full.
상세 설명 사용자 키 디렉토리를 SP의 영구 저장 장치에 저장하는 중 오류가 발생
했습니다.
단계 43페이지의 "영구 저장 장치 문제"를 참조하십시오.
B-22 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 Add Trusted Host 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent filesystem is full.
상세 설명 인증된 호스트 구성을 SP의 영구 저장 장치에 저장하는 중 오류가 발생
했습니다.
단계 43페이지의 "영구 저장 장치 문제"를 참조하십시오.
B-23 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 ADS keytab 오류가 발생했습니다.
84 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 진단 안내서 • 2005년 7
B-23 Service Processor, Configuration (계속)
필드 값설
메시지
Error persisting user configuration. It is likely that the persistent filesystem is full.
상세 설명 NIS 구성을 SP의 영구 저장 장치에 저장하는 중 오류가 발생했습니다.
단계 43페이지의 "영구 저장 장치 문제"를 참조하십시오.
B-24 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 Delete Trusted Host 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent filesystem is full.
상세 설명 인증된 호스트 구성을 서비스 프로세서의 영구 저장 장치에 저장하는
중 오류가 발생했습니다.
단계 43페이지의 "영구 저장 장치 문제"를 참조하십시오.
B-25 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 NIS 구성 오류가 발생했습니다.
메시지
Error persisting user configuration. It is likely that the persistent filesystem is full.
상세 설명 NIS 구성을 서비스 프로세서의 영구 저장 장치에 저장하는 중 오류가
발생했습니다.
단계 43페이지의 "영구 저장 장치 문제"를 참조하십시오.
부록 B 시스템 이벤트 85
B-26 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 NIS Domain 연결 오류가 발생했습니다.
메시지
Unable to bind to NIS Domain <domain>, Server(s):<server(s)>
상세 설명 NIS 구성 요청이 오류로 인해 완료될 수 없습니다. 서버 목록이 잘못되
어 NIS 서버가 응답하지 않거나 도메인이 잘못되었습니다.
단계 모든 구성 매개변수가 정확한지 확인하고 NIS 서버가 제대로 작동하고
있는지 확인하십시오.
B-27 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
Service Processor
Configuration
War ni ng
요약 설명 ADS Kerberos 티켓 캐시 생성 오류가 발생했습니다.
메시지
Unable to generate Kerberos ticket cache with Active Directory Account:<account>, Domain:<domain>, Server(s):<server(s)>
상세 설명 오류로 인해 특정 사용자, 도메인 및 서버에 대한 티켓 캐시가 생성되
지 않았습니다. 사용자 계정, 도메인 또는 서버 목록이 정확하지 않거 나 서버가 응답하지 않습니다.
단계 모든 구성 매개변수가 올바르고 Active Directory 서버가 제대로 작동
하고 있는지 확인합니다.
B-28 Service Processor, Configuration
필드 값설
구성요소
하부 유형
심각도
86 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
Service Processor
Configuration
War ni ng
Loading...