Sun Microsystems Sun Fire V20z, Sun Fire V40z User’s Manual [ko]

Sun Fire™ V20z Sun Fire V40z
서버
문제 해결 기술
Sun Microsystems, Inc. www.sun.com
부품 번호: 819-2927-12 2005 7, 개정판 01
다음 사이트로 설명서에 대한 귀하의 의견을 보내주십시오. http://www.sun.com/hwdocs/feedback
Copyright 2005 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, California 95054, U.S.A. 모든 권리는 저작권자의 소유입니다. Sun Microsystems, Inc.는 본 설명서에서 사용하는 기술과 관련한 지적 재산권을 보유합니다. 특히 이러한 지적 재산권에는
http://www.sun.com나열된 하나 이상의 미국 특허 및 추가 특허 또는 미국 및 기타 국가에서 특허 출원중인 응용프로그램이 포함될 수 있습
니다. 본 제품 또는 설명서는 사용, 복사, 배포 및 역컴파일을 제한하는 라이센스 하에서 배포됩니다. 본 제품 또는 설명서의 어떠한 부분도 Sun 및 해당
사용권자의 사전 서면 승인 없이는 형식이나 수단에 상관없이 재생이 불가능합니다. 글꼴 기술을 포함한 타사 소프트웨어는 저작권이 등록되어 있으며 Sun 공급업체로부터 라이센스를 취득한 것입니다. 본 제품의 일부는 Berkeley BSD 시스템일 수 있으며 University of California로부터 라이센스를 취득했습니다. UNIX는 X/Open Company, Ltd.
를 통해 독점 라이센스를 취득한 미국 및 기타 국가의 등록 상표입니다. Sun, Sun Microsystems, Sun 로고, Java, AnswerBook2, docs.sun.com 및 Solaris는 미국 및 기타 국가에서 Sun Microsystems, Inc.의 상표 또는 등
록 상표입니다. 모든 SPARC 상표는 라이센스 하에 사용되며 미국 및 기타 국가에서 SPARC International, Inc.의 상표 또는 등록 상표입니다. SPARC 상표가 부착
된 제품은 Sun Microsystems, Inc.가 개발한 아키텍처를 기반으로 합니다. OPEN LOOK 및 Sun™ Graphical User Interface는 Sun Microsystems, Inc.가 해당 사용자 및 라이센스 소유자를 위해 개발했습니다. Sun은 컴퓨
터 업계에서 시각적 또는 그래픽 사용자 인터페이스 개념을 연구하고 개발하는 데 있어 Xerox의 선구자적 업적을 인정합니다. Sun은 Xerox Graphical User Interface에 대한 Xerox의 비독점 라이센스를 보유하고 있으며 이 라이센스는 OPEN LOOK GUI를 구현하거나 그 외의 경우 Sun 의 서면 라이센스 계약을 준수하는 Sun의 라이센스 소유자에게도 적용됩니다.
U.S. 정부 권한—상용. 정부 사용자는 Sun Microsystems, Inc. 표준 사용권 계약과 FAR의 해당 규정 및 추가 사항의 적용을 받습니다. 본 설명서는 "있는 그대로" 제공되며 상업성, 특정 목적에 대한 적합성 또는 비침해성에 대한 모든 묵시적 보증을 포함하여 모든 명시적 또는 묵
시적 조건, 표현 및 보증에 대해 어떠한 책임도 지지 않습니다. 이러한 보증 부인은 법적으로 허용된 범위 내에서만 적용됩니다.
재활용
가능
목차
머리말 xi
본 설명서를 읽기 전에 xi
UNIX 명령어 사용 xi
표기 규약 xii
관련 문서 xii
문서, 지원교육 xiii
타사사이트 xiii
사용자 의견 환영 xiv
1. 사전 유지보수 1
성공을 위한 지침 1
변경 관리 2
시스템 육안 검사 2
외부 육안 검사 3
내부 육안 검사 3
문제 해결 덤프 유틸리티 4
2. 진단 7
SP 기반 진단 7
SP 기반 진단 시작 방법 8
iii
메뉴 옵션 10
CD 기반 진단 9
CD 기반 진단 설치 실행 9
BIOS 버전 2.2.0.0 이상 9
이전 BIOS 버전 9
CD 기반 진단 설치 10
옵션 메뉴에서 CD 기반 진단 실행 10
CD 기반 진단 원격 액세스 11
사용 가능한 진단 테스트 및 모듈 13
진단 테스트 실행 14
테스트 결과 15
출력 예제 15
테스트 결과 저장 18
SP 기반 진단 18
CD 기반 진단 18
테스트 중지 18
3. 문제 해결 항목 19
BIOS 19
BIOS 오류 또는 경고 이벤트 19
BIOS POST 코드 22
부팅 문제 23
CMOS 클리어 점퍼 23
DIMM 장애 24
ECC 오류 25
인벤토리 27
표시등, LCD, LED 27
로그 파일 28
시스템 점검 오류 28
iv Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7
네트워크 연결성 30
네트워크 공유 볼륨 30
운영 체제 30
조작 패널 31
밝아짐, 판독 가능한 텍스트, 비작동 버튼 31
밝아짐, 판독 불가능한 텍스트 31
밝아짐, 텍스트 없음 31
밝아지지 않음 32
PCI 또는 PCI-X 플러그 32
플랫폼 OS가 부팅되지 않음 33
PPCBoot - 불량 CRC 오류 35
기본 설정 복구 35
SCSI 구성 유틸리티 36
RAID 등록정보 메뉴 항목이 비활성화됨 36
IM 볼륨이 별도의 SCSI ID 사용함 36
구성 유틸리티가
디스크 선택을 비활성화함 37
서비스 프로세서 38
‘Booting SP . . . ’가 조작 패널에 표시됨 38
SP의 연속 부팅 39
부팅 실패 40
SP를 통해 40
직렬 포트에 부착된 PC를 통해 41
다운그레이드부팅 실패 42
사용자 계정 및 설정 유지 실패 42
네트워크 공유 볼륨에 마운트 43
영구 저장 장치 문제 43
SSH 스크립트가 중지함 43
업데이트 실패 44
목차 v
시스템 이벤트 44
열 이동 이벤트 45
VRM 크로우바 검증 46
A. 진단 테스트 결과 47
테스트 설명 47
전압 47
전압 조정 47
전압 읽기 48
테스트 결과 48
비조정 전압 통과 48
조정 전압 통과 48
전압이 제한값을 초과한 오류 49
하드웨어 오류 49
49
팬 제어기 프로그래밍 50
테스트 결과 50
팬 통과 50
고속 오류 52
저속 오류 53
메모리 54
March 테스트 54
RandAddr 테스트 54
Retention 테스트 54
테스트
결과 55
메모리 테스트 통과 55
서비스 오류 56
ECC 오류 56
BIOS 설정 오류 56
vi Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005 7
NIC 58
테스트 결과 58
NIC 통과 58
서비스 오류 59
링크 다운 오류 59
링크 설정 불일치 오류 59
알 수 없는 링크 상태 오류 59
루프백 오류 59
쓰기 오류 60
읽기 오류 60
비교 오류 60
저장 장치 60
테스트 결과 61
저장 장치 통과 61
장치가 자가 테스트 명령을 인식할 수 없는 오류 61
장치가 자가 테스트 명령을 처리할 수 없는 오류 61
자가
테스트 오류 62
자가 테스트 손상 오류 62
플래시 메모리 62
테스트 결과 63
플래시 메모리 통과 63
시스템 열기 오류 63
시스템 읽기 오류 63
장치 액세스 오류 63
시스템 쓰기 오류 64
지우기 오류 64
매직 번호 오류 64
데이터 비교 오류 64
목차 vii
LED 65
테스트 결과 65
LED 통과 65
장치 없음 경고 67
읽기 오류 67
쓰기 오류 67
온도 67
테스트 결과 68
온도 통과 68
판독 값이 통과된 경고 임계값을 초과함 68
장치 없음 경고 68
읽기 오류 68
판독 값이 위험 임계값을 초과한 오류 69
조작 패널 69
테스트 결과 69
OpPanel 통과 69
읽기 오류 70
쓰기 오류 70
데이터 비교 오류 70
전원 공급 장치 70
테스트 결과 71
전원 통과 71
전원 양호 오류 71
읽기 오류 72
B. 시스템 이벤트 73
이벤트 세부 정보 73
C. POST 코드 95
목차 viii
Phoenix BIOS POST 코드 95
Flash ROM의 부팅 블록 코드용 POST 코드 100
D. 용어집 103
목차 ix
x Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
머리말
Sun Fire V20z 및 Sun Fire V40z 서버문제 해결 기술 및 진단 안내서는 고객에게 발 생할 수 있는 시스템 문제에 대한 정보 및 해결책을 제공합니다. 또한 진단 테스트의 사 용 지침과 모든 시스템 이벤트에 대한 상세 설명을 포함합니다. 본 설명서는 고급 문제 해결 및 하드웨어 교체 경험을 보유한 기술자, 시스템 관리자, 인증된 서비스 제공자 (ASP) 및 사용자를
본 설명서를 읽기 전에
일부 문제 해결 절차에서는 시스템 구성요소의 제거 및 교체가 필요합니다. 따라서 다음 설명서의 안전 지침과 구성요소 제거 및 교체 절차를 검토해야 합니다.
Sun Fire V20z and Sun Fire V40z Servers Safety and Compliance Guide
■ Sun Fire V20z 및 Sun Fire V40z 서버 사용 설명서
대상으로 합니다.
UNIX 명령어 사용
이 설명서에는 시스템 종료, 시스템 부팅 및 장치 구성과 같은 기본적인 UNIX® 명령어 및 절차에 대한 정보는 포함되어 있지 않을 수 있습니다. 이러한 정보에 대해서는 다음 을 참조하여 주십시오.
시스템에 포함되어 있는 소프트웨어 설명서
Solaris™ 운영 체제 설명서는 다음 URL 참조하여 주시기 바랍니다.
http://docs.sun.com
xi
표기 규약
서체 또는 기호
AaBbCc123
AaBbCc123
AaBbCc123
AaBbCc123
* 사용자가 사용하는 브라우저의 설정과 설정이 다를 있습니다.
*
의미
명령어 및 파일, 디렉토리 이름; 컴 퓨터 화면에 출력되는 내용입니다.
사용자가 입력하는 내용으로 컴퓨 터 화면의 출력 내용과 반대입니다.
새로 나오는 용어, 강조 표시할 용 어입니다.
명령줄 변수를 실제 이름이나 값으 로 바꾸십시오.
책 제목, 장, 절 Solaris 사용자 설명서
관련 문서
온라인 문서는 다음 URL에서 사용 가능합니다.
.login 파일을 편집하십시오. 모든 파일 목록을 보려면 ls -a 명령어
를 사용하십시오.
% You have mail.
%
su
Password:
이는 class 옵션입니다. 이를 실행하기 위해서는 반드시 수퍼
유저여야 합니다. 파일 삭제 명령어는 rm filename 입니다.
6장 데이터 관리를 참조하시기 바랍니 다.
http://www.sun.com/products-n-solutions /hardware/docs/Servers/Workgroup_Servers/Sun_Fire_V20z/ index.html
적용 제목 부품 번호
안전 정보
안전 통지 및 국제 준수 증명서
하드웨어 및 시스템 소프 트웨어 설치
xii Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 •2005년 7월
Important Safety Information for Sun Hardware Systems
Sun Fire V20z and Sun Fire V40z ServersSafety and Compliance Guide
Sun Fire V20z Sun Fire V40z 서버설치
설명서
816-7190-xx
817-5251-xx
817-6145-15
적용 제목 부품 번호
유지보수 절차 및 기타 정보
운영 체제 설치 Sun Fire V20z 및 Sun Fire V40z 서버—Linux
문제 해결 및 진단 Sun Fire V20z 및 Sun Fire V40z 서버문제
최신 정보 Sun Fire V20z 및 Sun Fire V40z 서버 릴리스
서버 모델 비교 Sun Fire V20z Sun Fire V40z 서버 버전간의
Sun Fire V20z Sun Fire V40z 서버사용 설명서
운영 체제 설치 설명서
해결 기술 및 진단 안내서
노트
차이점
819-2917-15
817-6155-15
819-2927-11
819-2912-15
819-4305-11
문서, 지원 교육
Sun 기능
문서
지원교육
URL
http://www.sun.com/documentation/
http://www.sun.com/supportraining/
설명
PDF 및 HTML 문서 다운로드, 인쇄 문서 주문
기술 지원, 패치 다운로드, Sun 강의 정보
타사사이트
Sun은 본 설명서에서 언급된 타사 웹 사이트의 가용성에 대해 책임을 지지 않습니다. 또한 해당 사이트나 리소스를 통해 제공되는 내용, 광고, 제품 및 기타 자료에 대해 어떠 한 보증도 하지 않으며 그에 대한 책임도 지지 않습니다. 따라서 타사 웹사이트의 내용, 제품 또는 리소스의 사용으로 인해 발생한 실제 또는 주장된 손상이나 피해에 대해서도 책임을 지지 않습니다.
머리말 xiii
사용자 의견 환영
Sun은 설명서의 내용 개선에 노력을 기울이고 있으며, 여러분의 의견과 제안을 환영합 니다. 다음 사이트에 여러분의 의견을 제출하여 주십시오.
http://www.sun.com/hwdocs/feedback
아래와 같이 설명서의 제목과 문서 번호를 함께 적어 보내주시기 바랍니다.
Sun Fire V20z Sun Fire V40z 서버 문제 해결 기술 진단 안내서, 문서 번호 819-2927-12
xiv Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
1
사전 유지보수
주의하여 시스템을 설정하고 총괄적으로 변경 사항을 관리하며 설정된 반복되는 절차 를 고수하여 많은 문제를 방지할 수 있습니다.
성공을 위한 지침
문제를 방지하고 간단히 해결하기 위한 일부 지침이 아래에 나열되어 있습니다.
사용중인 서버에 서버 위치를 나타내는 이름과 같은 일관된 명명 규칙을 사용합니다.
사용중인 장치의 고유 ID 또는 이름을 사용하여 동일한 자원에 대한 경쟁의 위험을
줄입니다. 서버 설정 유틸리티를 사용하여 충돌이 발생하지 않을지 확인합니다.
백업 계획을 만듭니다.
데이터가 자주 변경될 경우, 백업을 자주 수행하도록 일정을 작성합니다.
정보 복원 필요성에 따라 백업 라이브러리를 유지합니다.
주기적으로 백업을 테스트하여 데이터가 올바르게 저장되는지 확인합니다.
기업시스템 관리 도구를 사용하여 특정 프로세스를 자동화하거나 다음 정보를 수동
으로 추적합니다.
하드 디스크 공간을 주기적으로 검사합니다. 각 하드 드라이브에 최소 15%의 여
유 공간이 있는지 확인합니다.
기록 데이터를 유지합니다. 예를 들어, 초기 CPU 사용 레벨의 베이스라인 기록을
통해 중요 증가 사항을 인지할 수 있습니다. 문제가 발생할 경우, 베이스라인과 현 재 데이터를 비교할 수 있습니다. 사용자, 버스 및 전원 사용 비율 또한 추적 가능 합니다.
예측 가능한 변화를 설명할있도록 동향 분석을 유지합니다. 예를 들어, 마지막
아침에 CPU 사용 비율이 항상 50% 증가했다면 이는 해당 서버에 대해 정상임을 가정할 수 있습니다.
1
문제해결 노트를 만듭니다. 문제가 발생할 경우, 문제 해결을 위해 취한 조치를
록합니다. 기록한 정보를 사용하여 차후에 동일한 문제를 더욱 빠르게 해결할 수 있습니다. 이 정보를 통해 부품 교체 문제의 정확성을 보장할 수도 있습니다.
최신 네트워크 토폴로지 맵을 액세스 가능한 위치에 보관하십시오. 이 맵을 통해
네트워크 문제를 위한 문제 해결 노력을 줄일 수 있습니다.
변경 관리
대부분의 서버 문제는 서버의 일부가 변경된 후에 발생합니다. 서버를 변경할 경우 다 음 지침을 참조하십시오.
변경하기 전에 시스템 설정을 적어둡니다.
발생 가능한 문제를 방지하기 위해 가능하면 한번에 한가지만 변경하십시오. 위와
같은 방법으로 제어 환경을 유지하고 문제 해결 범위를 줄일 수 있습니다.
각 변경의 결과를 적어둡니다. 모든 오류 또는 정보 메시지를 포함시킵니다.
새 장치를 추가하기 전에 장치 충돌이 발생하지 않을지 확인합니다.
특히 타사 소프트웨어를 추가할 경우에는 버전간의 종속성이 있는지 확인합니다.
서버 문제의 원인을 찾아 수정하려면 다음 정보를 수집합니다.
장애 전에 발생한 이벤트
하드웨어 또는 소프트웨어가 변경되거나 새로 설치되었는지 여부
서버가 최근에 설치되었거나 이동되었는지 여부
서버의 증상이 나타난 기간
문제의 지속 기간 발생 빈도
문제의 상태를 파악하고 현재 사용중인 구성과 환경을 기록해둔 다음을 수행하십
시오.
시스템을 육안으로 검사합니다(아래 참조).
진단 테스트를 실행합니다(7페이지의 "진단" 참조).
시스템 육안 검사
잘못 설정된 제어 장치 및 느슨하거나 잘못 연결된 케이블은 하드웨어 구성요소 문제의 일반적인 원인입니다. 시스템 문제를 조사할 때에는 모든 외부 스위치, 제어 장치 및 케이 블 연결을 가장 먼저 확인합니다. 문제가 해결되지 않는 경우 시스템 내부 하드웨어의 카 드나 케이블 커넥터 또는 장착 나사 등이 빠지지 않았는지 육안으로 검사합니다.
2 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
하드웨어 구성요소 제거 및 교체 방법은 Sun Fire V20z 및 Sun Fire V40z 서버 사용 설 명서를 참조하십시오.
외부 육안 검사
외부 시스템의 육안 검사를 수행하려면,
1. 구성요소 오작동을 표시하는 상태 표시기를 검사합니다. 27페이지의 "표시등, LCD, LED"를 참조하십시오.
2. 모든 전원 케이블이 시스템, 모니터 해당 주변 장치에 올바르게 연결되어 있는지, 원이 제대로 공급되는지 확인합니다.
3. 직렬 포트에 연결된 장치와 모든 연결 장치(네트워크 케이블, 키보드, 모니터, 마우스)
가 제대로 연결되었는지 점검합니다.
내부 육안 검사
참고계속 진행하기 전에, 시스템과 함께 제공된 Important Safety Information
About Sun Hardware Systems의 안전 지침을 읽어보십시오. 또한, Sun Fire V20z Sun Fire V40z 서버 사용 설명서의 구성요소 제거 교체에 대한 지침을 검토하십시 .
SM Console System Status 화면을 사용하여 모든 시스템 하드웨어 구성요소 센서
의 상태 정보를 알아볼 수 있습니다. 이 System Status 화면은 문제가 있거나 장애 발생 으로 인해 교체되어야 할 구성요소의 검색을 단순화합니다. System Status 화면에 표시 되는 구성요소 이미지는 실제 하드웨어 구성요소 및 해당 구성요소의 대략적인 위치와 크기를 나타냅니다. 자세한 사항은 서버 관리 설명서를 참조하십시오.
1. 내부
2. 모든 전원 케이블을 전기 콘센트에서 연결 해제합니다. (일부 서버에는 개의 전원
시스템의 육안 검사를 수행하려면 시스템의 전원을 끕니다.
급 장치와 두 개의 전원 케이블이 존재합니다. 모든 전원 공급 장치가 전원 콘센트에서 연결 해제되었는지 확인하십시오.)
주의 – 전원 공급 장치에서 AC 전원 코드를 뽑으면 시스템 접지도 함께 제거됩니다. 시스
템이 정전기 방출 손상을 받지않도록 시스템에 동일한 전압 전위를 유지해야 합니다. 시 스템 구성요소를 만지는 모든 절차와 제거 및 교체 절차 중에는 ESD 손목 띠와 같은 ESD 보호 장비를 착용하십시오.
3. 서버 덮개를 제거합니다(사용중인 서버의 사용 설명서 절차를 따르십시오).
1 장사전 유지보수 3
주의 – 시스템 작업 중에 일부 구성요소가 뜨거워질 있습니다. 이러한 구성요소를
만지기 전에 열이 식을 때까지 기다리십시오.
4. 필요한 경우 구성요소를 제거하고 소켓이 깨끗한지 확인합니다.
5. 구성요소를 교체한 해당 구성요소가 소켓 또는 커넥터에 단단히 장착되었는지 확인 합니다.
6. 시스템 내부의 모든 케이블 커넥터를 확인하여 적절한 커넥터에 제대로 단단히 부착되 있는지 확인합니다.
7. 서버 덮개를 다시 덮습니다.
8. 시스템과 부착된 주변 장치를 전원 소스에
다시 연결합니다.
9. 서버 부착된 주변 장치의 전원을 켭니다.
문제 해결 덤프 유틸리티
참고 – 문제 해결 덤프 유틸리티는 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리
설명서에서도 논의됩니다(명령 구문, 인수 및 반환 값 포함).
문제 해결 덤프 유틸리티(TDU)는 중요 플랫폼 OS 및 서비스 프로세서(SP) 디버그 데이 터를 캡처합니다. 본 명령을 실행하면 이 데이터가 집결되어 선택한 명령 옵션에 따라 stdout으로 전송되거나 지정된 파일과 함께, TDU는 요약 로그 파일을 생성합니다. 해당 요약 로그 파일에는 TDU가 요 청된 각 정보 단위를 성공적으로 집결했는지 여부에 대한 설명이 포함되어 있습니다. 요약 로그 파일은 tar 파일에 포함되어 있습니다.
키 TDU 정의는 다음과 같습니다.
GPR - 범용 레지스터
■ MCR - 시스템 점검 레지스터
■ MSR - 시스템 상태 레지스터(MCR 포함)
SPR - 전용 레지스터
■ CSR - PCI 구성 공간 레지스터
■ TCB - K-8에서의 추적 버퍼
■ TMB - DRAM에서의 추적 버퍼(TCB)
nfs 디렉토리에 tar 형식으로 저장됩니다. 해당 로그
다음 데이터가 기본으로 캡처됩니다.
4 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
SST 데이터(5KB)
지워지지 않은 현재 이벤트(120KB)
소프트웨어 인벤토리( 25KB)
하드웨어 인벤토리( 25KB)
pstore 데이터:
그룹 파일( 0.5KB)
이벤트 구성 파일(evcfg, 4KB)
보안 구성 파일(seccfg, 5KB)
이더넷 구성 파일(netifcfg2-eth0, 0.2KB)
서비스 프로세서의 현재 프로세스(10KB)
선택적으로 TDU는 다음 데이터를 캡처할 수 있습니다.
K-8 레지스터(-c|--cpuregs) - GPR, SPR, MSR, MCR TCB(19KB) 포함
모든 PCI 구성 레지스터(-p|--pciregs) (25KB)
DRAM에서의 TCB(--tmb, 기본 128KB 또는 최대 1GB 사용자 정의 크기)
참고텍스트 모드에서 TMB 1KB 저장량은 디스크의 4K 차지합니다. 기본
TMB 32KB 저장량은 128KB를 차지하고 TMB 128MB 저장량은 디스크 공간의 1GB를 차지합니다.
문제 해결 덤프 유틸리티를 실행하려면 다음 명령을 사용합니다.
sp get tdulog
-f 옵션을 사용하면 캡처 데이터가 집결되어 압축된 tar 파일로 SP 저장됩니다. 문제
해결 덤프 유틸리티를 실행하는 데 최대 15분이 소요될 수 있습니다. 실행이 완료되면 시스템이 메시지를 표시합니다.
모든 서버 관리 명령은 완료 시 코드를 반환합니다. 다음은 두개의 리턴 코드(ID, 요약 설명)입니다.
반환
NWSE_Success
NWSE_InvalidUsage 1
ID
정의
0
명령이 성공적으로 완료되었습니다.
잘못된 사용: 잘못된 매개변수 사용, 지정된 옵션이 충돌 합니다.
참고 – 리턴 코드 ID가 10진수입니다.
1 장사전 유지보수 5
6 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7 월
2
진단
진단은 Sun Fire V20z 서버 또는 Sun Fire V40z 서버의 하드웨어 상태를 판별하는 테스 트의 세트입니다. 서버에 포함된 진단 테스트는 플랫폼 및 SP를 검사합니다.
진단 테스트:
하드웨어의 기능을 테스트 확인합니다. 예: "팬이 목표 속도에 도달하지 못했습니다."
장치 장애를 표시 격리합니다. 예: "장치가 없습니다."
전압 레벨 또는 SP의 읽기 기록 플래시 파일과 같이 다양한 하드웨어 또는 소프트
웨어 문제를 격리합니다.
교체 가능한 부품을 판별합니다. (부품 제거교체에 대한 지침은 하드웨어 구성요
소 및 서비스 설명서에 포함됩니다.)
다음 방법 중 하나로 해당 진단 테스트를 실행할 수 있습니다.
SP 기반 진단, 아래에 설명, SP 통해 실행
CD 기반 진단, 9페이지에서 설명, 진단 CD 통해 실행
참고 – 서버에서 진단을 실행하는 동안에는 IPMI의 명령줄 인터페이스를 통해 SP와 상
호 작용하지 않습니다. 이 경우, 센서 명령으로 반환된 값은 신뢰할 수 없습니다. 진단이 로드되는 동안 실행되는 센서 명령은 이벤트 로그에 위험 이벤트로 잘못 기록될 수 있 습니다.
일부 테스트는 SP에서 실행되도록 설계되며, 기타 테스트는 플랫폼 OS에서 실행되도록 설계됩니다. 자세한 정보는 13페이지의 "진단 모듈"을 참조하십시오.
SP 기반 진단
SP로부터 진단 테스트를 실행할 있습니다. 진단 파일은 네트워크 공유 볼륨(NSV) 렉토리에 포함됩니다. SP 기반 진단 테스트를 실행하려는 경우:
7
SP 또는 플랫폼에서 테스트를 실행할 수 있습니다. (자세한 사항은 13페이지의 "진단
모듈"에 있는 표 2-1을 참조하십시오.)
SP에만 테스트를 실행할 있습니다.
원격으로 테스트를 실행할 있습니다.
■ NSV가 마운트된 경우, 테스트 결과를 외부(NSV) 장소에 저장할 있습니다.
SP 설정, NSV 소프트웨어 설치 구성, SSH 스크립트 사용 방법에 대한 자세한 사항은 Sun Fire V20z Sun Fire V40z 서버설치 설명서를 참조하십시오. 진단 테스트의
데이트 방법에 대한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
참고 – NSV진단 버전은 SP설치된 진단 버전과 동일해야 합니다.
SP 기반 진단 시작 방법
1. SP와 플랫폼 진단 테스트를 모두 활성화하려면 diags start 명령을 실행합니다. 이 명령은 플랫폼을 진단 모드로 재부팅합니다. 테스트를 실행하기 전에 최소 2-3분 정도 기다립니다.
또는
플랫폼을 재부팅하지 않고 SP 진단 테스트만 활성화하려면 diags start –n 명령을 실행 하십시오.
참고 – CD 기반 진단의 경우, -n 인수는 다음을 지정합니다. 진단과 함께 SP를 로드하
지 않습니다.
2. 해당 진단 테스트를 실행할 수 있는지 판별하려면 diags get state 명령을 실행합 니다. 해당 명령은 다음 중 하나의 상태를 반환합니다.
성공 메시지
The SP and the platform diagnostics systems are available to receive test requests.
또는
오류 메시지
The platform diagnostics system is not available.
진단 모듈 및 해당 모듈에 포함된 테스트 유형의 표를 보려면 13페이지의 "진단 모듈"을 참조하십시오. 해당 표는 각 테스트 모듈이 SP에서 실행되는지 플랫폼에서 실행되는지 의 여부를 표시합니다.
8 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 20 05 년 7월
CD 기반 진단
참고 – 이전 릴리스의 NSV(2.x.x.x 이전)에서 플랫폼 전용 테스트를 실행할있습니
다. 그러나 메모리 테스트를 실행하기 위해서는 인터리빙을 비활성화해야 합니다. 이러 한 이전 릴리스의 NSV로는 CD에서 SP 테스트를 실행할 수 없습니다.
CD에서 진단 테스트를 실행할 있습니다.
SP 또는 플랫폼에서 테스트를 실행할 있습니다.
플랫폼에서만 테스트를 실행할 있습니다.
■ CD를 부팅한 후, 원격으로 테스트를 실행할 있습니다. SSH 사용하여 해당 진단
테스트에 로그인하십시오.
USB 스틱 또는 플로피 디스크에 테스트 결과를 저장할 수 있습니다.
CD 기반 진단 설치 및 실행
기본적으로, BIOS는 진단 모드로 부팅하지 않습니다. 부팅 순서에서 CD 드라이브가 가장 처음인 경우, 시스템 부팅 시 서버에 CD가 설치되어 있으면 BIOS가 해당 CD를 감지하여 진단 모드로 재부팅합니다. 위와 같이 하려면, 아래의 지침을 참조하십시오.
BIOS 버전 2.2.0.0 이상
BIOS 버전 2.2.0.0 이상에서는 진단 모드로 부팅하도록 BIOS 설정할 있습니다.
러면 부팅 시 CD가 BIOS 설정을 감지하고 필요할 경우 시스템을 진단 모드로 재부팅합 니다. 이것은 BIOS Advanced Menu의 옵션입니다. 재부팅을 방지하는 방법에 대한 자 세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버사용 설명서의 BIOS 구성 정보를 참조하십시오.
이전 BIOS 버전
사용중인 BIOS 버전이 진단 모드로 부팅할 수 없는 경우(이 정보는 부팅 시 감지됨), 시 스템은 사용자가 BIOS 설정을 구성하고 메모리 테스트를 성공적으로 실행하는 데 필요 한 몇 가지 단계를 표시합니다. (해당 설정이 잘못된 경우, 메모리 테스트가 경고를 출력 합니다.)
2 장진단 9
CD 기반 진단 설치
CD가 자동으로 부팅되는지 확인하려면 서버 부팅 순서 중에서 가장 먼저 CD 기반
단을 설치해야 합니다. 부팅 순서는 BIOS Boot 메뉴에서 설정할 수 있습니다. 해당 순서 를 아래에 나타난 것과 같이 변경하십시오.
BIOS Boot 메뉴에서, 더하기(+) 또는 빼기(-) 기호를 사용하여 CD-ROM 드라이브를
목록의 상단으로 이동시킵니다. (자세한 정보는 Sun Fire V20z 및 Sun Fire V40z 서 버 설치 설명서를 참조하십시오.)
서버가 하드 디스크 드라이브에서 부팅하는 경우, HDD를 제거하십시오.
서버가 PXE 서버에서 부팅하는 경우, 이더넷 케이블을 분리하십시오.
1. 다음 ISO 이미지의 위치는 시스템 공급자에게 문의하십시오.
cd_diags.iso
2. 해당 ISO 이미지를 CD로 굽습니다.
3. 해당 CD 드라이브에 삽입한 플랫폼을 부팅합니다. (CD 드라이브가 부팅 목록 처음에 있으면 자동으로 수행됩니다. 이를 확인하려면 위의 항목을 참조하십시오.)
CD가 부팅될 때, 다음 플랫폼 IP 주소가 표시됩니다.
Welcome to CD Diagnostics <version displayed>.
Platform eth0 connected for SSH sessions at <ipaddr>
Platform eth1 connected for SSH sessions at <ipaddr>
원격으로 SSH를 사용하려는 경우 이 IP 주소를 사용할 수 있습니다. 11페이지의 "CD 기반 진단 원격 액세스"를 참조하십시오.
CD 부팅 절차가 완료되면 바로 로그인되고 CD 진단 메뉴가 화면에 표시됩니다. 테스 트 실행 및 시스템 정보 캡처 메뉴 옵션을 사용하거나 명령줄을 사용할 수 있습니다.
옵션 메뉴에서 CD 기반 진단 실행
옵션 메뉴는 전체 진단 테스트 실행 과정 및 플로피 또는 USB 저장 장치에 시스템 정보 를 캡처하는 과정을 단순화합니다.
메뉴 옵션
1. View Documentation - 이 옵션을 사용하여 설명서를 엽니다. 온라인 설명서에는
다음 내용이 설명되어 있습니다.
모든 메뉴 옵션
유용한
알려진 문제점
명령줄에서 실행할 있는 명령
10 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
원격 장치에서 SSH를 사용하는 지침
기타 중요 정보
2. Create script run_commans.sh - 이 옵션을 사용하여 테스트를 실행하고 로그 파일 에 시스템 정보를 저장합니다. 이 옵션은 세 가지 프롬프트를 엽니다. 이 프롬프트를 선택할 경우, 스크립트가 작성되어 저장된 로그 파일과 동일한 위치에 저장됩니다. 해당 스크립트를 사용하여 여러 시스템에서 작업을 실행할 수 있습니다.
3. Run script run_commands.sh - 이 옵션을 사용하여 플로피 디스크에 저장한 스크립 트를 실행합니다.
4. Go to Command Line Interface -
옵션을 사용하여 명령줄 인터페이스로 이동합
니다. 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참 조하십시오.
5. Shutdown System - 이 옵션을 사용하여 진단 테스트를 종료한 후 OS를 종료합니다.
참고자세한 정보를 보려면 View Documentation 선택하십시오.
CD 기반 진단 원격 액세스
원격 액세스를 위해서는 플랫폼에 관리자 수준의 사용자를 미리 생성해야 합니다. 지침 을 보려면 Sun Fire V20z 및 Sun Fire V40z 서버—서버 관리 설명서를 참조하십시오.
SSH 네트워크 액세스를 통해 CD 기반 진단 테스트를 위한 원격 명령줄 인터페이스를 사용하려면 다음을 수행하십시오.
1. 사용자로서 플랫폼 IP 주소에 SSH를 실행합니다: setup
이미 SP에 관리자 수준 사용자를 생성한 경우, 새 계정을 생성하기 위한 사용자 이름과 암호를 묻는 프롬프트가 표시됩니다. 다음을 제외한 모든 사용자 이름을 사용할 수 있 습니다.
diagUser
setup
root
새 사용자 이름과 암호가 검증되면 로그오프됩니다.
2. 이제 사용자 이름과 암호를 사용하여 플랫폼에 SSH 실행합니다.
3. SP 테스트를 로드하지 않고 플랫폼 진단 테스트만 활성화하려면 diags start –n 명령을 실행하십시오.
2 장진단 11
SP 기반 진단의 경우, -n 인수는 "진단과 함께 플랫폼을 재부팅하지 않음"을 지정합니 다.
또는
SP와 플랫폼 진단 테스트를 모두 활성화하려면 diags start 명령을 실행합니다. 이 명령 은 플랫폼을 진단 모드로 재부팅합니다.
테스트를 실행하기 전에 최소 2-3분 정도 기다립니다.
또는
쉘 또는 Perl에서 다음 중 하나를 구현합니다.
diags start
sleep 240
rc = diags get state
if (rc ==0)
then
# run desired tests using diags run tests command
else
echo "Diagnostics not loaded in expected time. rc = $rc"
fi
또는
rc = diags get state
timer = 0
while (rc == 25 (device error)) and (timer < MAX_WAIT)
do
sleep SLEEP_TIME
timer=time+SLEEP_TIME
rc = diags get state
done
if (timer < MAX_WAIT)
then
# run desired tests using diags run tests command
else
echo "Error loading platform diagnostics. rc = $rc"
fi
4. diags get state 명령을 실행하여 해당 진단 테스트를 실행할 수 있는지 판별할 수 있습 니다.
12 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
해당 명령은 다음 중 하나의 상태를 반환합니다.
성공 메시지
The SP and the platform diagnostics systems are available to receive test requests.
또는
오류 메시지
The platform diagnostics system is not available.
end
if re == 0
diags run tests -a
참고 – 명령줄 인수에 대해서는 아래의 "진단 테스트 실행"을 참조하십시오. 시스템
리에 필요한 명령 및 스크립트 사용에 대한 자세한 내용은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
사용 가능한 진단 테스트 및 모듈
사용 가능한 모듈 및 해당 모듈에 포함된 테스트의 목록을 보려면 다음 명령을 실행하 십시오.
diags get tests
아래 표는 사용 가능한 진단 모듈을 나열하고 해당 모듈이 플랫폼 OS에서 실행되는지 SP에서 실행되는지의 여부를 표시합니다. 모듈은 하나 이상의 개별 테스트를 포함합 니다.
2-1 진단 모듈
모듈 이름 (명령)
메모리
(memory)
네트워크 제어기 (nic)
저장 장치 (storage)
(fan)
실행 위치 테스트 설명
플랫폼 메모리 오류, 주소 디코딩 오류 및 데이터라인 장애를 판별
합니다.
플랫폼 내부 루프백 테스트를 사용하여 플랫폼 NIC 인터페이스를
테스트합니다.
플랫폼 SCSI 드라이브에서 자가 테스트를 호출합니다.
SP
모든 팬이 회전 중이고 RPM이 지정 범위 내에 있는지 확인 합니다.
2 장진단 13
2-1 진단 모듈
모듈 이름 (명령)
플래시
실행 위치 테스트 설명
SP
플래시 파일을 읽고 씁니다.
(flash)
LED (led)
조작 패널 (oppanel)
전원
(power)
온도
(temp)
전압 (voltage)
SP
SP
SP
SP
SP
LED 드라이브 회로가 올바르게 작동하는지 확인합니다. (비대화식 테스트)
조작 패널의 메모리를 확인합니다. 모든 오류의 위치 및 값 을 나타냅니다.
전원 백플레인 및 전원 공급 장치가 올바르게 작동하는지 확인합니다. (모든 시스템에 대해 사용할 수 없음)
모든 온도 센서가 제대로 작동하고
온도가 지정 범위 내에
있는지 확인합니다.
파생된(시스템의 여러 VRM에서 생성) 전압 및 대량 전압 을 확인합니다.
진단 테스트 실행
참고 – 플랫폼 OS에서 진단을 실행하면, 시스템이 플로피 드라이브의 마운트를 시도하
다음 오류를 반환합니다. mount : Mounting /dev/fd0 on /mnt/floppy failed. No such device. 오류 메시지는 무시해도 좋습니다.
명령줄 인터페이스에서 테스트를 실행할 경우, 모든 테스트를 실행하거나 특정 모듈(팬, 메모리, 전압, 온도등)에 여러 테스트를 실행할 수 있으며 하나의 모듈에 실행할 테스트를 지정하거나 이 모든 옵션을 조합할 수 있습니다. diags run tests 명령을 실행할 때 이 옵션을 지정합니다.
테스트를 개별적 또는 일괄적으로 실행합니다.
모든 테스트를 실행하려면 -a 옵션을 사용합니다.
하나 이상의 테스트 모듈을 실행하려면 -m 모듈 옵션을 사용합니다.
하나 이상의 개별 테스트를 실행하려면 -n test_name 옵션을 사용합니다.
-m module -n test_name 옵션을 모두 사용하여 하나 이상의 테스트 모듈
및 개별 테스트를 실행합니다.
예를 들어, 조작 패널 진단 모듈을 실행하려면 다음 명령을 실행합니다.
diags run tests –m oppanel
테스트 모듈은 항상 이름 순서대로 실행됩니다.
개별 테스트는 사용자가 명령줄에 지정한 순서대로 실행됩니다.
14 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
테스트 통과여부에 대한 상태 메시지를 봅니다.
참고 – 테스트 시간 조절에 관한 스크립트를 작성하여 추가적인 제어가 가능합니다. 예
를 들어, 테스트를 지정된 수만큼 반복하는 쉘 스크립트를 작성할 수 있습니다. 자세한 내용은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명서를 참조하십시오.
테스트 결과
테스트가 완료되면 상태가 반환됩니다. 테스트에서 오류를 감지하면, 소프트웨어가 오 류에 대한 세부 정보를 보고하고 제출된 나머지 테스트를 계속 실행합니다.
참고 – -v|--verbose 옵션을 지정하여 모든 테스트에 대한 세부 정보(통과 여부 포함)를
표시합니다. 예를 들어, 세부 정보에는 최대값, 공칭값 및 최소값이 포함될 수 있습니다.
모든 진단 테스트에 대해 다음 데이터가 생성됩니다.
제출된 테스트 이름
테스트 핸들(다른 창에서 테스트를 취소할 사용되는 고유 ID)
테스트 결과(Passed, Failed)
세부 정보(실패 세부 정보, 테스트 세부 정보등)
참고 – 모든 진단 테스트의 출력 예를 보려면 47페이지의 "진단 테스트 결과"를 참조하
십시오.
진단 테스트에서 식별된 구성요소를 찾으려면 SM Console의 System Status 창을 참조 하십시오. 이 창에는 대표적인 시스템 구성요소 및 관련된 센서가 표시됩니다. SM Console에 대한 자세한 사항은 Sun Fire V20z 및 Sun Fire V40z 서버서버 관리 설명 서를 참조하십시오. 시스템구성요소 레이블의 그림을 보려면 Sun Fire V20z 및 Sun Fire V40z 서버사용 설명서 및 Sun Fire V20z 및 Sun Fire V40z 서버설치 설명서를 참조하십시오.
2 장진단 15
출력 예제
이 절에는 전원이 켜졌을 때 --verbose 인수를 사용하여 비플랫폼 모드에서 진단을 시작할 경우 반환될 수 있는 출력 결과가 포함되어 있습니다. 예:
diags start -n
platform set power state on -f
diags run tests -a -v
Submitted Test Name Test Handle
일반 출력 결과 포함:
speed.allFans 1
Results Submitted Test Name Test Handle Test Result speed.allFans 1 Passed Test Details: fan1.tach Passed Controller: fan-ctrl High Rated: 13000 High Actual: 13740 High Delta: +5.39% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10580 Low Actual: 11100 Low Delta: 4.69% Low Limits: -/+15% Sensor: Fan 1 measured speed (ID=fan1.tach) Component(s): Fan 1 (ID=NA) fan2.tach Passed Controller: fan-ctrl High Rated: 13000 High Actual: 13920 High Delta: +6.61% High Limits: -10/+35% Low Setpoint: 10010 Low Expected: 10718 Low Actual: 11100 Low Delta: 3.44% Low Limits: -/+15% Sensor: Fan 2 measured speed (ID=fan2.tach) Component(s): Fan 2 (ID=NA) fan3.tach Passed Controller: fan-ctrl1
16 Sun Fire V20z 및 Sun Fire V40z 서버 문제 해결 기술 및 진단 안내서 • 2005년 7월
Loading...
+ 96 hidden pages