VMWARE vRealize Operations Manager - 6.1 User Manual [fr]

Guide de l'utilisateur de vRealize
Operations Manager
vRealize Operations Manager 6.1
Ce document prend en charge la version de chacun des produits répertoriés, ainsi que toutes les versions publiées par la suite jusqu'au remplacement dudit document par une nouvelle édition. Pour rechercher des éditions plus récentes de ce document, rendez-vous sur :
FR-001858-00
Guide de l'utilisateur de vRealize Operations Manager
Vous trouverez la documentation technique la plus récente sur le site Web de VMware à l'adresse :
http://www.vmware.com/fr/support/
Le site Web de VMware propose également les dernières mises à jour des produits.
N’hésitez pas à nous transmettre tous vos commentaires concernant cette documentation à l’adresse suivante :
docfeedback@vmware.com
Copyright © 2015 VMware, Inc. Tous droits réservés. Copyright et informations sur les marques.
VMware, Inc.
3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com
2 VMware, Inc.
VMware, Inc.
100-101 Quartier Boieldieu 92042 Paris La Défense France www.vmware.com/fr

Table des matières

À propos de ce Guide de l'utilisateur 5
Surveillance des objets dans votre environnement géré avec
1
vRealize Operations Manager 7
Que faire si... 7 Surveillance et résolution des alertes 34 Surveillance et résolution des problèmes 39 Exécution d'actions dans vRealize Operations Manager 70 Affichage de l'inventaire 85
Planification des ressources de votre environnement géré à l'aide de
2
vRealize Operations Manager 87
Scénario utilisateur : Vérifier l'impact des besoins en capacité future 88 Création de projets matériels 91 Création de projets de machines virtuelles 92
Index 95
VMware, Inc. 3
Guide de l'utilisateur de vRealize Operations Manager
4 VMware, Inc.

À propos de ce Guide de l'utilisateur

Le VMware® Guide de l'utilisateur de vRealize Operations Manager décrit ce qu'il faut faire lorsque des utilisateurs rencontrent des problèmes de performance dans votre environnement géré.
En tant qu'administrateur système, vous pouvez détecter la présence d'un problème sur un objet de votre environnement lorsque vRealize Operations Manager génère une alerte ou lorsqu'un utilisateur vous contacte. Pour contribuer à garantir des performances optimales, ces informations vous indiquent comment utiliser vRealize Operations Manager pour surveiller, dépanner et prendre des mesures afin d'éliminer les problèmes. Il fournit également des informations sur les procédures permettant d'évaluer si les problèmes sont dus à une demande excessive ou à un manque de capacité imposant une modification ou une mise à niveau du système.
Public visé
Ces informations sont destinées aux administrateurs de vRealize Operations Manager, aux administrateurs de l'infrastructure virtuelle et aux techniciens d'opérations qui suivent et maintiennent la performance des objets de votre environnement géré.
Glossaire VMware Technical Publications
VMware Technical Publications fournit un glossaire des termes qui peuvent éventuellement ne pas vous être familiers. Pour consulter la définition des termes utilisés dans la documentation technique VMware, visitez le site Web http://www.vmware.com/support/pubs.
VMware, Inc.
5
Guide de l'utilisateur de vRealize Operations Manager
6 VMware, Inc.
Surveillance des objets dans votre environnement géré avec
vRealize Operations Manager 1
Vous pouvez utiliser vRealize Operations Manager pour résoudre les problèmes soulevés par vos clients, traiter les alertes détectant des problèmes avant que vos clients ne les signalent et rechercher plus généralement des problèmes dans votre environnement.
Lorsque vos clients rencontrent des problèmes de performance et vous appellent pour les résoudre, les données que vRealize Operations Manager collecte et analyse se présentent sous des formes graphiques, si bien que vous pouvez comparer et opposer des objets, comprendre leurs relations et déterminer la cause principale des problèmes.
Pour gérer votre environnement de façon proactive plutôt que réactive, il vous faut surveiller les alertes et agir en conséquence. Une alerte générée vous avertit lorsque des objets de votre environnement connaissent des problèmes. En résolvant le problème signalé par l'alerte avant que vos clients ne le remarquent, vous évitez toute interruption de service.
Vous pouvez étudier les problèmes qui génèrent des alertes ou pour lesquels vous recevez des appels grâce aux onglets Analyse, Dépannage, Détails et Environnement.
En déterminant la cause principale du problème, vous pourrez certainement le résoudre à l'aide de l'action adaptée. Les actions apportent des modifications aux objets dans le système cible, par exemple vCenter Server, à partir de vRealize Operations Manager.
Ce chapitre aborde les rubriques suivantes :
« Que faire si... », page 7
n
« Surveillance et résolution des alertes », page 34
n
« Surveillance et résolution des problèmes », page 39
n
« Exécution d'actions dans vRealize Operations Manager », page 70
n
« Affichage de l'inventaire », page 85
n

Que faire si...

En tant qu'administrateur d'infrastructure virtuelle, ingénieur des opérations réseau, ou autre professionnel de l'informatique, vous utilisez vRealize Operations Manager pour surveiller des objets dans votre environnement afin d'assurer les services fournis à vos clients et de résoudre les problèmes rencontrés.
Votre administrateur vRealize Operations Manager a configuré vRealize Operations Manager de manière à gérer deux instances de vCenter Server gérant plusieurs hôtes et machines virtuelles. C'est la première fois que vous utilisez vRealize Operations Manager pour gérer votre environnement.
VMware, Inc.
7
Guide de l'utilisateur de vRealize Operations Manager
Scénario utilisateur : un utilisateur appelle pour faire part d'un problème page 8
n
La vice-présidente du service des ventes appelle le service d'assistance pour signaler que sa machine virtuelle, VPSALES4632, fonctionne lentement. Elle travaille sur des rapports de ventes pour une réunion à venir et est en retard en raison des faibles performances de sa machine virtuelle.
Scénario utilisateur : une alerte arrive dans votre boîte de réception page 12
n
À votre retour de la pause déjeuner, vous trouvez une notification d'alerte dans votre boîte de réception. Vous pouvez utiliser vRealize Operations Manager pour examiner et résoudre l'alerte.
Scénario utilisateur : Vous détectez des problèmes en surveillant l'état de vos objets page 20
n
Lorsque vous analysez vos objets dans le cadre de ce scénario, vRealize Operations Manager fournit des détails pour vous aider à résoudre les problèmes. Vous analysez l'état de votre environnement, examinez les problèmes actuels, cherchez des solutions et prenez les mesures appropriées pour résoudre les problèmes.

Scénario utilisateur : un utilisateur appelle pour faire part d'un problème

La vice-présidente du service des ventes appelle le service d'assistance pour signaler que sa machine virtuelle, VPSALES4632, fonctionne lentement. Elle travaille sur des rapports de ventes pour une réunion à venir et est en retard en raison des faibles performances de sa machine virtuelle.
En tant qu'ingénieur des opérations réseau, vous venez de passer en revue les alertes du matin et n'avez pas constaté de problèmes avec sa machine virtuelle ; vous commencez donc le dépannage du problème.
Procédure
1 Scénario utilisateur : Rechercher un objet spécifique page 8
En tant qu'ingénieur des opérations réseau, vous devez trouver la machine virtuelle du client dans vRealize Operations Manager afin de pouvoir commencer à résoudre le problème signalé.
2 Scénario utilisateur : vérifier les alertes liées aux problèmes signalés page 9
Pour déterminer si la machine virtuelle à propos de laquelle la vice-présidente des ventes a signalé des problèmes présente des alertes indiquant la cause du problème, passez en revue les alertes dans vRealize Operations Manager pour l'objet.
3 Scénario utilisateur : utiliser les options de l'onglet Dépannage pour examiner un problème signalé
page 10 Pour résoudre des problèmes sur la machine virtuelle VPSALES4632, évaluez les symptômes,
examinez les informations chronologiques, prenez en considération les événements et créez des graphiques de mesures pour trouver la cause racine du problème.
Scénario utilisateur : Rechercher un objet spécifique
En tant qu'ingénieur des opérations réseau, vous devez trouver la machine virtuelle du client dans vRealize Operations Manager afin de pouvoir commencer à résoudre le problème signalé.
Utilisez vRealize Operations Manager pour surveiller trois instances de vCenter Server avec un total de 360 hôtes et 18 000 machines virtuelles. La façon la plus simple de trouver une machine virtuelle spécifique est de la rechercher.
Procédure
1 Dans la zone de texte Recherche, dans la barre de titre de vRealize Operations Manager, tapez le nom
de la machine virtuelle.
La zone de texte Recherche affiche tous les objets contenant la chaîne tapée dans la zone de texte. Si votre client sait que le nom de sa machine virtuelle contient SALES, vous pouvez taper la chaîne pour inclure la machine virtuelle dans la liste.
2 Sélectionnez l'objet dans la liste.
8 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
Le volet de gauche affiche le nom de l'objet et les objets associés, y compris le système hôte et l'instance de vCenter Server. Le volet principal affiche l'onglet Résumé.
Suivant
Recherchez des alertes correspondant au problème signalé pour l'objet. Reportez-vous à « Scénario
utilisateur : vérifier les alertes liées aux problèmes signalés », page 9.
Scénario utilisateur : vérifier les alertes liées aux problèmes signalés
Pour déterminer si la machine virtuelle à propos de laquelle la vice-présidente des ventes a signalé des problèmes présente des alertes indiquant la cause du problème, passez en revue les alertes dans vRealize Operations Manager pour l'objet.
Les alertes sur un objet fournissent des informations sur les problèmes autres que celui pour lequel l'utilisateur signale un problème.
Prérequis
Identifiez la machine virtuelle du client pour pouvoir passer en revue les alertes la concernant. Reportez­vous à « Scénario utilisateur : Rechercher un objet spécifique », page 8.
Procédure
1 Cliquez sur l'onglet Résumé pour l'objet problématique.
L'onglet Résumé affiche les alertes actives pour l'objet et tout objet descendant classé dans les alertes les plus fréquentes.
2 Passez en revue les alertes les plus fréquentes pour la santé, le risque et l'efficacité.
Les alertes les plus fréquentes sont considérées comme les principaux contributeurs de l'état actuel des badges d'alerte. Certaines d'entre elles semblent-elles être à la source du problème de lenteur ? Par exemple, toute alerte de gonflage ou d'échange, qui indique que vous devez ajouter de la mémoire à la machine virtuelle ? Une alerte liée à la contention de mémoire, qui indique que vous devez ajouter de la mémoire à l'hôte.
3 Si l'onglet Résumé n'inclut aucun des problèmes fréquents semblant expliquer les problèmes signalés,
cliquez sur l'onglet Alertes.
L'onglet Alertes affiche toutes les alertes actives pour l'objet actif.
4 Passez en revue les alertes pour les problèmes similaires ou contribuant au problème signalé.
a Pour afficher les alertes actives et annulées, cliquez sur État : Actif pour effacer le filtre et afficher
les alertes actives et inactives.
Les alertes annulées peuvent fournir des informations sur le problème.
b Cliquez sur la colonne Créé le pour trier les alertes afin de pouvoir trouver les alertes générées
avant ou au moment où le client a signalé le problème.
c Pour afficher les alertes pour les objets ancêtres dans la même liste que celle contenant l'alerte pour
la machine virtuelle, cliquez sur la flèche vers la haut et sélectionnez Système hôte et Ressource de calcul du cluster, si ces options sont configurées dans votre environnement.
Ajoutez ces types d'objets à la liste afin de pouvoir déterminer si les alertes des objets parents contribuent au problème signalé.
5 Si vous trouvez une alerte qui semble expliquer le problème signalé, cliquez sur le nom de l'alerte dans
la liste des alertes.
6 Dans l'onglet Résumé des détails de l'alerte, passez en revue les symptômes déclenchés et les
recommandations pour déterminer si l'alerte indique la cause racine du problème signalé.
VMware, Inc. 9
Guide de l'utilisateur de vRealize Operations Manager
Suivant
Si l'alerte semble indiquer la source du problème, suivez les recommandations et vérifiez la résolution
n
avec votre client. Pour obtenir un exemple, voir « Scénario utilisateur : Exécuter une recommandation
sur une banque de données pour résoudre une alerte », page 19.
Si vous ne trouvez pas la cause du problème signalé dans les alertes, commencez un dépannage plus
n
approfondi. Reportez-vous à « Scénario utilisateur : utiliser les options de l'onglet Dépannage pour
examiner un problème signalé », page 10.
Scénario utilisateur : utiliser les options de l'onglet Dépannage pour examiner un problème signalé
Pour résoudre des problèmes sur la machine virtuelle VPSALES4632, évaluez les symptômes, examinez les informations chronologiques, prenez en considération les événements et créez des graphiques de mesures pour trouver la cause racine du problème.
Si l'observation des alertes n'a pas permis d'identifier la cause du problème signalé pour la machine virtuelle, utilisez les onglets Dépannage, Symptômes, Chronologie, Événements et Toutes les mesures, pour dépanner l'historique et l'état actuel de la machine virtuelle.
Prérequis
Trouvez l'objet pour lequel le problème a été signalé. Reportez-vous à « Scénario utilisateur :
n
Rechercher un objet spécifique », page 8.
Passez en revue les alertes pour la machine virtuelle afin de déterminer si le problème a déjà été
n
identifié et des recommandations effectuées. Reportez-vous à « Scénario utilisateur : vérifier les alertes
liées aux problèmes signalés », page 9.
Procédure
1 Dans les onglets Détails de l'alerte, cliquez sur Machine virtuelle dans le volet de gauche et
sélectionnez VPSALES4632 dans la liste inférieure.
Le volet principal met à jour l'affichage de l'onglet Résumé de l'objet.
2 Cliquez sur l'onglet Dépannage, puis sur l'onglet Symptômes et passez en revue les symptômes pour
déterminer si l'un des symptômes est lié au problème signalé.
En fonction de la configuration des alertes, certains symptômes peuvent être déclenchés, mais pas suffisants pour générer une alerte.
a Passez en revue les noms des symptômes pour déterminer si un ou plusieurs symptômes sont liés
au problème signalé.
La colonne Informations indique la condition du déclenchement, la tendance et la valeur actuelle. Quels sont les symptômes les plus courants qui affectent le temps de réponse ? Voyez-vous des symptômes liés à l'utilisation du CPU ou de la mémoire ?
b Triez les symptômes par date de création (Créé le) afin de tenir uniquement compte de la période
pour laquelle le client a signalé le problème.
c Cliquez sur le bouton de filtre État : Actif pour désactiver le filtre et pouvoir observer les
symptômes actifs et inactifs.
En raison des symptômes, vous pensez que le problème est lié à l'utilisation du CPU ou de la mémoire. En revanche, vous ne savez pas si le problème provient de la machine virtuelle ou de l'hôte.
10 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
3 Cliquez sur l'onglet Chronologie et passez en revue les alertes, les symptômes et les événements de
modification dans le temps qui pourraient vous aider à identifier des tendances communes participant au problème signalé.
a Pour déterminer si des symptômes ont été déclenchés et des alertes générées sur d'autres machines
virtuelles en même temps que le problème signalé, cliquez sur Afficher les événements homologues.
Les alertes d'autres machines virtuelles sont ajoutées à la chronologie. Si vous voyez que plusieurs machines virtuelles ont déclenché des symptômes pendant la même période, vous pouvez alors examiner les objets ancêtres.
b Cliquez sur Afficher les événements des ancêtres et sélectionnez Système hôte.
Les alertes et symptômes associés à l'hôte sur lequel la machine virtuelle est déployée sont ajoutés à la chronologie. Utilisez les informations pour déterminer si une corrélation existe entre le problème signalé et les alertes sur l'hôte.
4 Cliquez sur l'onglet Événement pour afficher les modifications des mesures collectées pour la machine
virtuelle rencontrant le problème et qui pourraient vous indiquer la cause du problème signalé.
a Utilisez l'événement de vue de l'option Contrôles de date pour l'heure approximative du problème
signalé par le client.
b Cliquez sur les badges Charge de travail, Capacité et Contrainte pour déterminer si des
événements sont associés au problème.
c Cliquez sur Zoomer la vue et zoomez sur les événements et les clusters d'événements s'étant
produits avant ou au moment où le problème a été signalé.
d Cliquez sur Afficher les valeurs des données et placez le curseur sur un événement pour afficher
les détails relatifs à l'événement.
Les événements pour la période sélectionnée s'affichent également dans la grille de données en dessous du graphique des événements.
e Dans le volet de gauche, cliquez sur Système hôte, cliquez sur le nom de l'hôte dans la liste du
volet de gauche inférieur, puis répétez l'analyse de l'hôte dans les badges Charge de travail, Capacité et Contrainte.
La comparaison des événements sur la machine virtuelle et sur l'hôte et l'évaluation de ces résultats indiquent que des problèmes de CPU ou de mémoire sont probablement la cause du problème.
5 Si vous pouvez identifier que le problème est lié, par exemple, à l'utilisation du CPU ou de la mémoire,
cliquez sur l'onglet Toutes les mesures pour créer vos propres graphiques de mesures, afin de déterminer s'il s'agit de l'un ou de l'autre, ou des deux.
a Si l'hôte est encore sélectionné, commencez par travailler sur les mesures de l'hôte.
b Dans la liste des mesures, double-cliquez sur les mesures Utilisation du CPU (%) et Utilisation de
la mémoire (%) pour les ajouter à l'espace de travail de droite.
c Dans la carte, cliquez sur l'objet VPSALES4632.
La liste de mesures affiche à présent les mesures des machines virtuelles.
d Dans la liste des mesures, double-cliquez sur les mesures Utilisation du CPU (%) et Utilisation de
la mémoire (%) pour les ajouter à l'espace de travail de droite.
e Passez en revue les graphiques de l'hôte et de la machine virtuelle pour voir si vous pouvez
identifier une tendance indiquant la cause du problème signalé.
VMware, Inc. 11
Guide de l'utilisateur de vRealize Operations Manager
Dans ce scénario, la comparaison des quatre graphiques révèle que l'utilisation du CPU est normale tant sur l'hôte que sur la machine virtuelle, et que l'utilisation de la mémoire est normale sur la machine virtuelle. Cependant, l'utilisation de la mémoire sur l'hôte a commencé à augmenter de manière constante trois jours avant que le problème signalé sur la machine virtuelle VPSALES4632.
La mémoire de l'hôte s'exécute constamment à un niveau élevé, ce qui affecte le temps de réponse pour les machines virtuelles. Le nombre de machines virtuelles qu'il exécute correspond aux quantités prises en charge. Le problème peut être dû à un nombre trop élevé d'applications de processus élevé sur les machines virtuelles. Vous pouvez déplacer certaines machines virtuelles vers d'autres hôtes, distribuer la charge de travail ou mettre hors tension des machines virtuelles inactives.
Suivant
Dans cet exemple, vous pouvez utiliser vRealize Operations Manager pour mettre hors tension des
n
machines virtuelles sur l'hôte afin d'améliorer les performances des machines virtuelles utilisées. Reportez-vous à « Exécuter des actions dans les barres d'outils de vRealize Operations Manager », page 75.
Si vous êtes susceptible de réutiliser la combinaison de graphiques que vous avez créés sur l'onglet
n
Toutes les mesures, cliquez sur Générer un tableau de bord.
Si vous n'avez pas résolu le problème, poursuivez votre investigation.
n

Scénario utilisateur : une alerte arrive dans votre boîte de réception

À votre retour de la pause déjeuner, vous trouvez une notification d'alerte dans votre boîte de réception. Vous pouvez utiliser vRealize Operations Manager pour examiner et résoudre l'alerte.
En tant que technicien d'opérations réseau, vous êtes responsable de plusieurs hôtes et de leurs banques de données et machines virtuelles, et vous recevez des e-mails lorsqu'une alerte est générée pour vos objets surveillés. Les alertes vous signalent non seulement les problèmes de votre environnement, mais elles fournissent aussi des recommandations utiles pour résoudre ces problèmes. Lors de l'examen de cette alerte, vous évaluez les données pour déterminer si une ou plusieurs des recommandations peuvent résoudre le problème.
Ce scénario part du principe que vous avez configuré des alertes sortantes de manière à envoyer un e-mail standard à l'aide du protocole SMTP et que vous avez configuré des notifications pour vous envoyer des notifications d'alerte à l'aide du plug-in d'e-mail standard. Lorsque des alertes et des notifications sortantes sont configurées, vRealize Operations Manager vous envoie des messages lorsqu'une alerte est générée afin que vous puissiez répondre aux problèmes le plus rapidement possible.
Prérequis
Vérifiez que les alertes sortantes sont configurées sous forme d'alertes par e-mail standard. Reportez-
n
vous à Guide d'administration et de personnalisation de vRealize Operations Manager.
Vérifiez que les alertes sortantes sont configurées sous forme d'alertes par e-mail standard. Reportez-
n
vous à Guide d'administration et de personnalisation de vRealize Operations Manager.
Procédure
1 Scénario utilisateur : répondre à une alerte dans votre messagerie électronique page 13
En tant que technicien d'opérations réseau, vous recevez un e-mail de vRealize Operations Manager fournissant des informations sur l'une des banques de données dont vous êtes responsable. La notification par e-mail vous informe du problème même lorsque vous ne travaillez pas à ce moment précis dans vRealize Operations Manager.
12 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
2 Scénario utilisateur : évaluer d'autres symptômes déclenchés pour la banque de données affectée
page 14 Vous avez déterminé que vous avez besoin d'informations complémentaires sur la banque de données
avant de choisir la meilleure réponse. En tant que technicien d'opérations réseau, vous examinez l'onglet Symptômes des objets affectés pour voir les autres symptômes déclenchés pour la banque de données.
3 Scénario utilisateur : comparer des alertes et des événements dans le temps en réponse à une alerte de
banque de données page 15
Pour évaluer une alerte dans le temps, comparez l'alerte et les symptômes actuels pour la banque de données à d'autres alertes et symptômes, d'autres événements, d'autres objets, dans le temps.
4 Scénario utilisateur : Afficher la banque de données affectée en relation à d'autres objets page 16
Pour voir l'objet pour lequel l'alerte a été générée en relation à d'autres objets, utilisez la carte topologique dans l'onglet Relations de vRealize Operations Manager pour visualiser l'environnement.
5 Scénario utilisateur : Créer des graphiques de mesures pour rechercher la cause de l'alerte de banque
de données page 17
Pour analyser les mesures de capacité associée à l'alerte générée, vous créez des graphiques dans vRealize Operations Manager qui comparent différentes mesures. Ces comparaisons vous aident à identifier à quel moment une modification est survenue dans votre environnement et quel effet elle a eu sur la banque de données.
6 Scénario utilisateur : Exécuter une recommandation sur une banque de données pour résoudre une
alerte page 19
En tant que technicien d'opérations réseau, vous avez examiné l'alerte concernant l'espace disque de la banque de données et déterminé que les recommandations fournies résoudront le problème, particulièrement la recommandation de supprimer les snapshots inutilisés. Vous utilisez vRealize Operations Manager pour supprimer les snapshots.
Scénario utilisateur : répondre à une alerte dans votre messagerie électronique
En tant que technicien d'opérations réseau, vous recevez un e-mail de vRealize Operations Manager fournissant des informations sur l'une des banques de données dont vous êtes responsable. La notification par e-mail vous informe du problème même lorsque vous ne travaillez pas à ce moment précis dans vRealize Operations Manager.
Dans votre client de messagerie, vous recevez une alerte similaire au message suivant.
L'alerte a été mise à jour le mardi 1er juillet 16:34:04 MDT : Info:datastore1 La banque de données se comporte anormalement depuis Lun 30 Jun 10:21:07 MDT et a été mise à jour le Mar 01 Jui 16:34:04 MDT Nom de définition d'alerte : La banque de données n'a presque plus d'espace disque Description de la définition d'alerte : La banque de données n'a presque plus d'espace disque Nom de l'objet : datastore1 Type d'objet : Alerte de banque de données Impact : risque État de l'alerte : critique Type d'alerte : Stockage Sous-type d'alerte : Capacité État de santé de l'objet : info État de risque de l'objet : critique État d'efficacité de l'objet : info Symptômes : JEU DE SYMPTÔMES - auto Nom de symptôme | ID d'objet | Mesure | Message Info Utilisation de l'espace de banque de données atteignant la limite critique datastore1 | b0885859­e0c5-4126-8eba-6a21c895fe1b | Capacité|Espace utilisé | HT au-dessus 99.20800922575977 > 95 Recommandations : - Avec Storage VMotion déplacer des machines virtuelles vers une autre banque de données - Supprimer des snapshots inutilisés de machines virtuelles - Ajouter de la capacité à la banque de données Notification Nom de la règle : Toutes les alertes -- Banque de données Notification Description de la règle : ID De l'alerte : a9d6cf35-a332-4028-90f0-d1876459032b Operations Manager Server - 192.0.2.0 Détails de l'alerte
VMware, Inc. 13
Guide de l'utilisateur de vRealize Operations Manager
Prérequis
Vérifiez que les alertes sortantes sont configurées sous forme d'alertes par e-mail standard. Reportez-
n
vous à Guide d'administration et de personnalisation de vRealize Operations Manager.
Vérifiez que les notifications sont configurées pour envoyer des messages à vos utilisateurs pour la
n
définition d'alerte. Pour un exemple de création de notification d'alerte, reportez-vous à Guide d'administration et de personnalisation de vRealize Operations Manager.
Procédure
1 Dans votre client de messagerie, examinez le message pour bien comprendre l'état des objets affectés et
déterminez si vous devez commencer l'investigation immédiatement.
Recherchez le nom de l'alerte, l'état de l'alerte pour déterminer le niveau actuel de criticité et les objets affectés.
2 Dans l'e-mail, cliquez sur Détails de l'alerte.
vRealize Operations Manager s'ouvre dans l'onglet Résumé dans les détails de l'alerte générée et de l'objet affecté.
3 Examinez les informations de l'onglet Résumé.
Option Processus d'évaluation
Nom et description de l'alerte
Recommandations Vérifiez la première recommandation et, le cas échéant, les autres recommandations
Quelle est la cause du problème ?
Vérifiez le nom et la description et assurez-vous que vous évaluez bien l'alerte pour laquelle vous avez reçu un e-mail.
pour comprendre les mesures à prendre pour résoudre le problème. Si elles sont mises en œuvre, les recommandations prioritaires résoudront-elles le problème ?
Quels symptômes ont été déclenchés ? Quels sont ceux qui n'ont pas été déclenchés ? Quel sera l'effet de cette évaluation dans votre investigation ? Dans cet exemple, l'alerte indiquant que la banque de données n'a presque plus d'espace est configurée de manière à baser la criticité sur des symptômes. Si vous recevez une alerte critique, il est probable que les symptômes sont déjà à un niveau critique, relevé à partir d'Avertissement et Urgent. Examinez le graphique Sparkline ou le graphique de mesures pour chaque symptôme pour déterminer à quel moment le problème a atteint l'objet de banques de données.
Suivant
Si vous déterminez que les recommandations résoudront le problème, mettez-les en œuvre. Reportez-
n
vous à « Scénario utilisateur : Exécuter une recommandation sur une banque de données pour résoudre
une alerte », page 19.
S'il vous faut plus d'informations sur les objets affectés, poursuivez votre investigation. Commencez par
n
examiner d'autres symptômes déclenchés pour la banque de données. Reportez-vous à « Scénario
utilisateur : évaluer d'autres symptômes déclenchés pour la banque de données affectée », page 14.
Scénario utilisateur : évaluer d'autres symptômes déclenchés pour la banque de données affectée
Vous avez déterminé que vous avez besoin d'informations complémentaires sur la banque de données avant de choisir la meilleure réponse. En tant que technicien d'opérations réseau, vous examinez l'onglet Symptômes des objets affectés pour voir les autres symptômes déclenchés pour la banque de données.
Si d'autres symptômes sont déclenchés pour l'objet, en plus du symptôme inclus dans l'alerte, vous pouvez les évaluer pour déterminer quel effet ces symptômes peuvent avoir sur l'alerte à laquelle vous répondez, et si les recommandations peuvent résoudre le problème.
14 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
Prérequis
Vérifiez que vous résolvez l'alerte pour laquelle vous avez reçu un message d'alerte dans votre messagerie. Reportez-vous à « Scénario utilisateur : répondre à une alerte dans votre messagerie électronique », page 13.
Procédure
1 Dans le volet gauche de vRealize Operations Manager, cliquez sur l'icône Alertes.
2 Dans l'une des listes d'alertes, cliquez sur le nom de l'alerte.
Le volet du centre change pour afficher les onglets de détails de l'alerte.
3 Cliquez sur l'onglet Symptôme des objets affectés et examinez les symptômes actifs.
Option Processus d'évaluation
Criticité D'autres symptômes de criticité similaires affectent-ils l'objet ?
Symptôme Des symptômes déclenchés sont-ils associés aux symptômes ayant déclenché l'alerte courante ? Des
symptômes liés au temps restant, à la capacité ou à la contrainte peuvent-ils indiquer des problèmes de stockage ?
Créé le Les horodatages des symptômes indiquent-ils qu'ils ont été déclenchés avant l'alerte que vous
examinez, indiquant qu'il pourrait s'agir d'un symptôme associé ? Les symptômes ont-ils été déclenchés après la génération de l'alerte, indiquant que les symptômes de l'alerte ont contribué à ces autres symptômes ?
Informations Pouvez-vous identifier une corrélation entre les symptômes de l'alerte et les autres symptômes sur la
base des valeurs de mesure de déclenchement ?
Suivant
Si votre examen des symptômes et des informations fournies indiquent clairement que les
n
recommandations résoudront le problème, mettez en œuvre une ou plusieurs des recommandations. Pour un exemple de mise en œuvre des recommandations, reportez-vous à « Scénario utilisateur :
Exécuter une recommandation sur une banque de données pour résoudre une alerte », page 19.
Si votre examen des symptômes ne démontre pas que les recommandations résoudront le problème ou
n
vous fourniront suffisamment d'informations pour identifier la cause première, poursuivez vos investigations en utilisant l'onglet Chronologie. Reportez-vous à « Scénario utilisateur : comparer des
alertes et des événements dans le temps en réponse à une alerte de banque de données », page 15.
Scénario utilisateur : comparer des alertes et des événements dans le temps en réponse à une alerte de banque de données
Pour évaluer une alerte dans le temps, comparez l'alerte et les symptômes actuels pour la banque de données à d'autres alertes et symptômes, d'autres événements, d'autres objets, dans le temps.
En tant technicien des opérations réseau, vous utilisez l'onglet Chronologie pour comparer cette alerte à d'autres alertes et événements dans votre environnement afin de déterminer si vous pouvez résoudre le problème de manque d'espace disque de la banque de données en appliquant une ou plusieurs recommandations d'alerte.
Prérequis
Vérifiez que vous résolvez l'alerte pour laquelle vous avez reçu un message d'alerte dans votre messagerie. Reportez-vous à « Scénario utilisateur : répondre à une alerte dans votre messagerie électronique », page 13.
Procédure
1 Dans le volet gauche de vRealize Operations Manager, cliquez sur l'icône Alertes.
2 Cliquez sur le lien du nom de l'alerte.
Le volet du centre change pour afficher les onglets de détails de l'alerte.
VMware, Inc. 15
Guide de l'utilisateur de vRealize Operations Manager
3 Cliquez sur l'onglet Chronologie.
L'onglet Chronologie affiche l'alerte générée et les symptômes déclenchés pour l'objet affecté dans un format de chronologie déroulant, qui commence au moment où l'alerte a été générée.
4 Pour déterminer si d'autres alertes sont générées pour l'objet, cliquez sur les autres boutons d'alerte.
Dans cet exemple, l'alerte de banque de données a généré une alerte Risque, de telle sorte que les autres alertes à ajouter à la chronologie sont Santé et Efficacité. Faites défiler la chronologie à l'aide de la chronologie de semaine en bas de l'écran.
5 Pour afficher les événements pouvant contribuer à l'alerte, cliquez sur Sélectionner le type
d'événement et cliquez sur la coche de chaque type d'événement.
Les événements associés à l'objet sont ajoutés à la chronologie. Vous ajoutez les événements à votre évaluation de l'état actuel de l'objet et indiquez si les recommandations peuvent résoudre le problème.
6 Cliquez sur Afficher les événements des ancêtres, puis sélectionnez Hôte.
Comme l'alerte est associée à l'espace disque, l'ajout de l'hôte à la chronologie vous permet de voir les alertes et symptômes générés pour l'hôte. Lors du défilement de la chronologie, à quel moment certaines des alertes associées ont-elles commencé ? À quel moment sont-elles disparues de la chronologie ? Quelle a été l'effet sur l'état de l'objet de banque de données ?
7 Cliquez sur Afficher les événements homologues.
Si d'autres banques de données présentent des alertes associées à l'alerte que vous examinez actuellement, la détermination du moment de génération des alertes concernant d'autres banques de données peut vous aider à identifier les problèmes de ressources que vous rencontrez dans votre environnement.
8 Pour supprimer des alertes annulées de votre chronologie, cliquez sur Sélectionner l'état, puis
décochez la case Annulé.
La suppression des alertes et des symptômes annulés de la chronologie efface la vue et vous permet de vous concentrer sur les alertes actuelles.
Suivant
Si votre évaluation de l'alerte dans la chronologie a fourni suffisamment d'informations pour indiquer
n
si une ou plusieurs des recommandations de résolution de l'alerte sont valides, mettez en œuvre ces recommandations. Reportez-vous à « Scénario utilisateur : Exécuter une recommandation sur une
banque de données pour résoudre une alerte », page 19.
Pour obtenir plus d'informations sur l'objet concerné, poursuivez votre investigation. Reportez-vous à
n
« Scénario utilisateur : Afficher la banque de données affectée en relation à d'autres objets », page 16.
Scénario utilisateur : Afficher la banque de données affectée en relation à d'autres objets
Pour voir l'objet pour lequel l'alerte a été générée en relation à d'autres objets, utilisez la carte topologique dans l'onglet Relations de vRealize Operations Manager pour visualiser l'environnement.
En tant que technicien d'opérations réseau, vous affichez une banque de données et les objets associés dans une carte pour mieux comprendre le problème, et pour déterminer si la mise en œuvre des recommandations d'alerte résoudra le problème identifié par l'alerte.
Prérequis
Évaluez l'alerte dans le temps en comparaison à d'autres objets. Reportez-vous à « Scénario utilisateur :
comparer des alertes et des événements dans le temps en réponse à une alerte de banque de données »,
page 15.
16 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
Procédure
1 Dans le volet gauche de vRealize Operations Manager, cliquez sur l'icône Alertes.
2 Cliquez sur le lien du nom de l'alerte.
Le volet du centre change pour afficher les onglets de détails de l'alerte.
3 Cliquez sur l'onglet Relations.
L'onglet Relations affiche la banque de données dans une carte avec les objets associés. Par défaut, le badge affecté par cette alerte est sélectionné sur la barre d'outils et les objets dans l'arborescence comportent un carré de couleur indiquant l'état actuel du badge.
4 Pour voir l'état d'alerte des objets pour les autres badges, cliquez sur le bouton Santé, puis sur le bouton
Efficacité.
Lorsque vous cliquez sur chaque bouton de badge, les carrés sur chaque objet indiquent si une alerte est générée et la criticité de l'alerte.
5 Pour afficher les alertes d'un objet, sélectionnez l'objet et cliquez sur Afficher les alertes.
La boîte de dialogue Liste des alertes s'affiche, vous permettant de rechercher et de trier les alertes de l'objet.
6 Pour afficher la liste des objets enfants d'un objet dans la carte, cliquez sur l'objet.
Une liste indiquant le nombre d'enfants par type d'objet s'affiche en bas du volet central.
7 Utilisez les options pour évaluer la banque de données.
Par exemple, quelles indications la carte vous fournit-t-elle quant au nombre de machines virtuelles associées à la banque de données ? Si plusieurs machines virtuelles sont associées à une banque de données, leur déplacement peut libérer de l'espace disque de banque de données.
Suivant
Si votre examen de la carte vous a fourni suffisamment d'informations pour indiquer qu'une ou
n
plusieurs des recommandations de résolution de l'alerte sont valides, mettez en œuvre les recommandations. Reportez-vous à « Scénario utilisateur : Exécuter une recommandation sur une
banque de données pour résoudre une alerte », page 19.
Pour obtenir plus d'informations sur l'objet concerné, poursuivez votre investigation. Reportez-vous à
n
« Scénario utilisateur : Créer des graphiques de mesures pour rechercher la cause de l'alerte de banque de données », page 17.
Scénario utilisateur : Créer des graphiques de mesures pour rechercher la cause de l'alerte de banque de données
Pour analyser les mesures de capacité associée à l'alerte générée, vous créez des graphiques dans vRealize Operations Manager qui comparent différentes mesures. Ces comparaisons vous aident à identifier à quel moment une modification est survenue dans votre environnement et quel effet elle a eu sur la banque de données.
En tant que technicien des opérations réseau, vous créez des graphiques personnalisés vous permettant d'analyser le problème et de déterminer si la mise en œuvre des recommandations d'alerte résoudra le problème que l'alerte identifie.
Prérequis
Affichez la carte topologique de la banque de données pour déterminer si des objets associés contribuent à l'alerte ou si des symptômes déclencheurs indiquent que la banque de données est responsable d'autres problèmes dans votre environnement. Reportez-vous à « Scénario utilisateur : Afficher la banque de
données affectée en relation à d'autres objets », page 16.
VMware, Inc. 17
Guide de l'utilisateur de vRealize Operations Manager
Procédure
1 Dans le volet gauche de vRealize Operations Manager, cliquez sur l'icône Alertes.
2 Cliquez sur le lien du nom de l'alerte.
Le volet du centre change pour afficher les onglets de détails de l'alerte.
3 Cliquez sur l'onglet Graphiques de mesures.
L'onglet Graphiques de mesures n'inclut pas de graphiques. Vous devez ajouter les graphiques à comparer.
4 Pour analyser la première recommandation, Ajouter de la capacité au stockage de banques de données,
ajoutez les graphiques associés à l'espace de travail.
a Entrez capacité dans la zone de texte de recherche de la liste de mesures.
La liste affiche les mesures contenant le terme recherché.
b Double-cliquez sur les mesures suivantes pour ajouter les graphiques suivants à l'espace de
travail :
Capacité | Espace utilisé (Go)
n
Espace disque | Capacité (Go)
n
Résumé | Nombre de consommateurs de capacité
n
c Comparez les graphiques.
Par exemple, si le graphique Capacité | Espace utilisé (%) montre une augmentation de l'espace utilisé, alors que Espace disque | Capacité (Go) n'a pas augmenté et que Résumé | Nombre de consommateurs de capacités n'a pas augmenté, l'ajout de capacité est une solution, mais ne résout pas la cause première.
5 Pour analyser la seconde recommandation, Déplacer avec vMotion certaines machines virtuelles
vers une autre banque de données, ajoutez des graphiques associés à l'espace de travail.
a Entrez vm dans la zone de texte de recherche de la liste de mesures.
b Double-cliquez sur la mesure Résumé | Nombre total de VM pour l'ajouter à l'espace de travail
c Comparez les 4 graphiques.
Par exemple, si le graphique Résumé | Nombre total de VM indique que le nombre de machines virtuelles n'a pas suffisamment augmenté pour affecter négativement la banque de données, le déplacement de certaines machines virtuelles constitue une solution, mais ne résout pas la cause première.
6 Pour analyser la troisième recommandation, Supprimer les snapshots inutilisés de machines virtuelles,
ajoutez des graphiques associés à l'espace de travail.
a Entrez snapshot dans la zone de texte de recherche de la liste de mesures.
b Double-cliquez sur les mesures suivantes pour ajouter les graphiques à l'espace de travail :
Espace disque | Espace de snapshot (Go)
n
Espace disque récupérable | Espace de snapshot | Valeur gaspillée (Go)
n
c Comparez les graphiques.
Par exemple, si la quantité de la mesure Espace disque | Espace de snapshot (Go) a augmenté et si la mesure Espace disque récupérable | Espace de snapshot | Valeur gaspillée (Go) indique une zone dans laquelle de l'espace peut être récupéré, la suppression des snapshots inutilisés affectera positivement le problème d'espace disque de la banque de données et résoudra l'alerte.
18 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
7 S'il s'agit d'une banque de données problématique que vous devez continuer à surveiller, vous pouvez
créer un tableau de bord.
a Cliquez sur le bouton Générer un tableau de bord sur la barre d'outils de l'espace de travail.
b Entrez un nom pour le tableau de bord, puis cliquez sur OK.
Dans cet exemple, utilisez un nom tel que Espace disque de banque de données.
Le tableau de bord est ajouté à vos tableaux de bord disponibles.
Vous avez comparé les graphiques de mesure pour déterminer si les recommandations sont valides et quelle recommandation mettre en œuvre en premier. Dans cet exemple, la recommandation Supprimer les snapshots non utilisés des machines virtuelles semble constituer l'option la plus efficace pour résoudre l'alerte.
Suivant
Mettez en œuvre les recommandations de l'alerte. Reportez-vous à « Scénario utilisateur : Exécuter une
recommandation sur une banque de données pour résoudre une alerte », page 19.
Scénario utilisateur : Exécuter une recommandation sur une banque de données pour résoudre une alerte
En tant que technicien d'opérations réseau, vous avez examiné l'alerte concernant l'espace disque de la banque de données et déterminé que les recommandations fournies résoudront le problème, particulièrement la recommandation de supprimer les snapshots inutilisés. Vous utilisez vRealize Operations Manager pour supprimer les snapshots.
Si vous n'utilisez pas l'adaptateur d'action, vous pouvez manuellement supprimer les snapshots sur votre instance de vCenter Server.
Prérequis
Comparez les graphiques de mesures pour identifier la cause première probable de l'alerte. Reportez-
n
vous à « Scénario utilisateur : comparer des alertes et des événements dans le temps en réponse à une
alerte de banque de données », page 15.
Vérifiez que l'adaptateur vCenter Python Actions est installé et configuré pour s'exécuter sur la même
n
instance de vCenter Server que celle qui inclut la banque de données pour laquelle l'alerte a été générée. Reportez-vous à Guide d'administration et de personnalisation de vRealize Operations Manager.
Procédure
1 Dans le volet gauche de vRealize Operations Manager, cliquez sur l'icône Alertes.
2 Cliquez sur le lien du nom de l'alerte.
3 Cliquez sur l'onglet Résumé.
4 Cliquez sur la flèche Autres recommandations pour développer la liste.
Les autres recommandations incluent la recommandation Déplacer avec Storage vMotion des
machines virtuelles vers une autre banque de données et la recommandation Supprimer des snapshots inutilisés pour les machines virtuelles. La recommandation de suppression de
snapshots inutilisés inclut un bouton d'action.
5 Cliquez sur Supprimer les snapshots inutilisés pour la banque de données.
6 Dans la zone de texte Jours d'ancienneté, sélectionnez ou entrez le nombre de jours d'ancienneté que
doit avoir le snapshot pour être récupéré pour suppression et cliquez sur OK.
Par exemple, entrez 30 pour récupérer tous les snapshots sur la banque de données remontant à au moins 30 jours.
VMware, Inc. 19
Guide de l'utilisateur de vRealize Operations Manager
7 Dans la boîte de dialogue Supprimer les snapshots inutilisés pour la banque de données, examinez
Espace de snapshot, Heure de création du snapshot et Nom de VM pour déterminer quels snapshots il convient de supprimer et cochez la case en regard de chacun des snapshots à supprimer.
8 Cliquez sur OK.
La boîte de dialogue qui s'affiche fournit un lien vers les tâches récentes et un lien vers la tâche.
9 Pour vérifier que la tâche a abouti, cliquez sur Tâches récentes.
La page Tâches récentes s'affiche. L'action Supprimer les snapshots inutilisés inclut deux tâches, une première pour récupérer les snapshots et une autre pour supprimer les snapshots.
10 Sélectionnez la tâche Supprimer les snapshots inutilisés présentant la date d'achèvement la plus récente.
Il s'agit de la tâche de suppression. L'état doit être Terminé.
Dans cet exemple, vous exécutez une action sur la banque de données dans vCenter Server. Les autres recommandations peuvent également être valides.
Suivant
Vérifiez que les recommandations résolvent l'alerte. Laissez quelques cycles de collecte s'exécuter après
n
l'exécution de l'action, puis vérifiez que l'alerte est annulée. Les alertes sont annulées lorsque les conditions les ayant générées n'ont plus la valeur true.
Mettez en œuvre les autres recommandations. Les autres recommandations pour cette alerte nécessitent
n
l'utilisation d'autres applications. Vous ne pouvez pas mettre en œuvre les recommandations à partir de vRealize Operations Manager.
Utilisez d'autres options pour rechercher la cause première. Voir « Scénario utilisateur : Recherche de la
n
cause principale d'un problème à l'aide des options de l'onglet Dépannage », page 58 pour un autre
exemple de recherche de la cause première d'un problème.

Scénario utilisateur : Vous détectez des problèmes en surveillant l'état de vos objets

Lorsque vous analysez vos objets dans le cadre de ce scénario, vRealize Operations Manager fournit des détails pour vous aider à résoudre les problèmes. Vous analysez l'état de votre environnement, examinez les problèmes actuels, cherchez des solutions et prenez les mesures appropriées pour résoudre les problèmes.
En tant qu'administrateur de l'infrastructure virtuelle, vous parcourez régulièrement vRealize Operations Manager à différents niveaux afin de connaître l'état général des objets de votre environnement géré. Bien que vous n'ayez reçu aucun appel ni aucune plainte et que vous ne voyez aucune nouvelle alerte, vous commencez à constater que votre cluster est à court de capacité.
Ce scénario se réfère à des objets associés à la solution VMware vSphere, qui relie vRealize Operations Manager à une ou plusieurs instances de vCenter Server. Les objets de votre environnement comprennent plusieurs instances de vCenter Server, des centres de données, des clusters (ressources de calcul en cluster), des systèmes hôtes, des pools de ressources et des machines virtuelles.
À mesure que vous suivrez les étapes de ce scénario et avancerez dans la procédure de dépannage, vous apprendrez à utiliser vRealize Operations Manager pour résoudre les problèmes. Vous analyserez l'état des objets de votre environnement, examinerez les problèmes en cours, chercherez des solutions et prendrez les mesures appropriées pour résoudre les problèmes.
Ce scénario montre comment évaluer les problèmes qui se produisent sur vos objets et prendre des mesures appropriées pour les résoudre.
L'onglet Analyse vous permet d'afficher les paramètres des ressources d'objet, de cliquer sur les liens
n
fournis pour analyser le problème plus en détails et d'examiner les paramètres de stratégie et les seuils.
20 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
L'onglet Dépannage vous permet d'examiner les symptômes déclenchés sur les objets, de déterminer le
n
moment auquel les problèmes à l'origine de ces symptômes sont apparus, d'identifier les événements associés à ces problèmes et d'examiner les mesures impliquées.
L'onglet Détails vous permet d'étudier l'activité des mesures sous forme de graphiques, de listes ou de
n
diagrammes de distribution et d'examiner les niveaux de gravité des problèmes survenant sur vos objets à l'aide de cartes thermiques.
L'onglet Environnement vous permet d'évaluer l'état de santé, de risque et d'efficacité de divers objets
n
associés dans votre hiérarchie globale d'objets. Vous pouvez afficher les relations des objets pour déterminer la façon dont un objet se trouvant dans un état critique peut affecter d'autres objets.
Pour faciliter les futures opérations de dépannage et celles de maintenance constante, vous pouvez créer une définition d'alerte, ainsi qu'un tableau de bord et un ensemble de vues et de rapports. Pour planifier la croissance et prendre en compte les projets récemment approuvés, vous pouvez créer et engager des projets de capacité. Pour respecter les règles utilisées pour surveiller vos objets, vous pouvez créer et personnaliser des stratégies opérationnelles.
Prérequis
Vérifiez que vous surveillez une ou plusieurs instances de vCenter Server. Reportez-vous au Guide d'administration et de personnalisation de vRealize Operations Manager.
Procédure
1 Scénario utilisateur : Analyser l'état de votre environnement page 22
Les onglets d'analyse facilitent l'analyse de vos objets de plusieurs façons. En tant qu'administrateur d'infrastructure virtuelle, vous utilisez les onglets d'analyse pour évaluer les détails sur l'état de vos objets, afin de résoudre les problèmes plus facilement.
2 Scénario utilisateur : Résolution de problèmes sur un système hôte page 24
Utilisez les onglets de l'espace de dépannage afin d'identifier la cause principale de problèmes ne pouvant être résolus par les recommandations des alertes ou par une analyse simple.
3 Scénario utilisateur : Examiner les détails de l'environnement page 26
Examinez l'état de vos objets dans les vues et dans les cartes thermiques pour identifier les tendances et les pics présentés par les ressources de votre cluster et de vos objets. Pour déterminer si des écarts se sont produits, vous pouvez afficher des résumés globaux sur un objet, comme la répartition de l'utilisation de l'espace disque du cluster.
4 Scénario utilisateur : Examiner les relations de l'environnement page 28
Utilisez la présentation et la vue de liste de l'environnement pour examiner l'état des badges, qui représentent des objets de votre hiérarchie d'environnement, et pour déterminer les objets se trouvant dans un état critique pour un badge particulier. Pour afficher les relations entre vos objets et déterminer si un problème critique touchant un objet ancêtre concerne également ses descendants, utilisez la carte Environnement.
5 Scénario utilisateur : Résoudre le problème page 30
Utilisez les fonctionnalités d'analyse et de dépannage de vRealize Operations Manager pour examiner les problèmes qui mettent vos objets dans un état critique et identifier des solutions. Pour résoudre les problèmes lorsque des actions existent pour le type d'objet, sélectionnez un objet et une action disponible propre à cet objet. Vous pouvez également ouvrir l'objet dans le système vSphere Web Client et modifier ses paramètres pour résoudre le problème.
VMware, Inc. 21
Guide de l'utilisateur de vRealize Operations Manager
6 Scénario utilisateur : Créer une définition d'alerte page 32
À partir de la cause principale du problème et des solutions que vous avez utilisées pour le résoudre, vous pouvez créer une définition d'alerte pour que vRealize Operations Manager vous avertisse. Lorsque l'alerte est déclenchée sur votre système hôte, vRealize Operations Manager vous avertit et vous fournit des recommandations concernant la résolution du problème.
7 Scénario utilisateur : Créer des tableaux de bord et des vues page 33
Pour identifier et résoudre plus facilement les problèmes de cluster et de systèmes d'hôtes susceptibles de se produire, vous pouvez créer des tableaux de bord et des vues qui appliquent les outils et les solutions de dépannage que vous avez utilisés pour identifier et résoudre les problèmes de votre système hôte. Ces outils et solutions de dépannage seront ainsi disponibles pour une utilisation future.
Scénario utilisateur : Analyser l'état de votre environnement
Les onglets d'analyse facilitent l'analyse de vos objets de plusieurs façons. En tant qu'administrateur d'infrastructure virtuelle, vous utilisez les onglets d'analyse pour évaluer les détails sur l'état de vos objets, afin de résoudre les problèmes plus facilement.
En parcourant l'arborescence d'inventaire, vous remarquez que l'un de vos groupes, nommé USA-Cluster, connaît des problèmes de capacité. Vous utilisez les onglets d'analyse pour essayer de déterminer la cause du problème sur USA-Cluster et vous voyez apparaître des problèmes concernant la capacité de l'un de vos systèmes hôtes et d'autres objets.
Prérequis
Vérifiez que vous comprenez le contexte de ce scénario. Reportez-vous à « Scénario utilisateur : Vous
détectez des problèmes en surveillant l'état de vos objets », page 20.
Procédure
1 Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
2 Cliquez sur l'onglet Analyse.
Des icônes rouges apparaissent sur les onglets Capacité restante et Temps restant.
3 Cliquez sur l'onglet Temps restant.
Vous pouvez constater que l'allocation de mémoire est très limitée.
22 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
4 Examinez la répartition du temps restant pour le cluster.
Les icônes indiquent qu'il ne reste aucun jour, sans qu'aucun projet de capacité planifiée ne soit pris en
compte.
5 Faites défiler jusqu'à ce que le volet Temps restant dans les objets associés apparaisse.
L'objet parent est le centre de données et l'homologue représente un autre cluster. Les objets enfants comprennent le pool de ressources et les systèmes hôtes. Le centre de données et l'un des systèmes hôtes connaissent des problèmes de mémoire critiques.
6 Passez votre souris au-dessus des icônes rouges de parents et d'enfants.
La capacité de la mémoire est épuisée sur le centre de données et sur l'un des systèmes hôtes.
Le problème de capacité de mémoire du cluster affecte la capacité de mémoire des objets liés.
Suivant
Utilisez l'onglet Dépannage pour résoudre les problèmes de capacité sur votre cluster et sur le système hôte. Reportez-vous à « Scénario utilisateur : Résolution de problèmes sur un système hôte », page 24.
VMware, Inc. 23
Guide de l'utilisateur de vRealize Operations Manager
Scénario utilisateur : Résolution de problèmes sur un système hôte
Utilisez les onglets de l'espace de dépannage afin d'identifier la cause principale de problèmes ne pouvant être résolus par les recommandations des alertes ou par une analyse simple.
Pour résoudre les symptômes des problèmes de capacité touchant le cluster et le système hôte, ainsi que pour déterminer le moment auquel ces problèmes sont survenus, utilisez les onglets de dépannage afin d'analyser le problème de mémoire plus en profondeur.
Prérequis
Utilisez les onglets de l'espace Analyse pour analyser votre environnement. Reportez-vous à « Scénario
utilisateur : Analyser l'état de votre environnement », page 22.
Procédure
1 Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
2 Cliquez sur l'onglet Dépannage et passez les symptômes en revue.
L'onglet Symptômes affiche les symptômes qui se sont déclenchés sur le cluster sélectionné. Vous remarquez plusieurs symptômes critiques.
Le temps restant pour les ressources de calcul du cluster avec les projets validés est
n
dangereusement faible
Le temps restant pour les ressources de calcul du cluster est dangereusement faible
n
La capacité restante est dangereusement faible
n
3 Analysez les symptômes critiques.
a Passez votre souris sur chaque symptôme critique pour identifier la mesure utilisée.
b Pour afficher uniquement les symptômes qui touchent le cluster, entrez cluster dans la zone de
texte de filtre rapide.
Lorsque vous passez la souris sur Cluster Compute Resource Time Remaining is critically low, la mesure Badge|Time Remaining with committed projects (%) apparaît. Vous remarquez que sa valeur est inférieure ou égale à zéro, ce qui a déclenché le symptôme concernant la capacité et a généré une alerte sur le cluster USA-Cluster.
4 Cliquez sur l'onglet Chronologie pour examiner les symptômes déclenchés, les alertes et les
événements qui se sont produits sur USA-Cluster au fil du temps, ainsi que pour déterminer le moment où les problèmes sont survenus.
a Sur la barre d'outils, cliquez sur Sélectionner le type d'événement.
b Cliquez sur Contrôles de date et sélectionnez 7 derniers jours.
Plusieurs événements apparaissent en rouge.
c Passez votre souris sur chaque événement pour en afficher les détails.
d Pour afficher les événements survenus sur le centre de données du cluster, cliquez sur Afficher les
événements ancêtres et sélectionnez Centre de données.
Les événements de type Avertissement concernant le centre de données apparaissent en jaune.
24 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
e Passez votre souris sur les événements de type Avertissement.
Vous remarquez que la densité commence à être faible et qu'un seuil fixe a été dépassé sur le centre de données en fin de soirée. La violation du seuil fixe indique que la valeur de la mesure Badge| Densité était au-dessous de la valeur acceptable de 25 et que la violation a été déclenchée par une valeur de 14.89.
f Pour voir les objets enfants touchés, cliquez sur Afficher les événements des descendants et
sélectionnez Système hôte.
5 Cliquez sur l'onglet Événements pour examiner les changements survenus sur USA-Cluster et pour
déterminer si l'un d'entre eux a contribué à la cause principale de l'alerte ou à d'autres problèmes sur le cluster.
a Sur la barre d'outils, cliquez sur chaque badge et affichez les événements survenus.
Le badge Charge de travail affiche un graphique des événements survenus sur le cluster. Plusieurs triangles rouges apparaissent à divers points du graphique.
b Passez votre souris sur chaque triangle rouge.
En examinant le graphique, vous pouvez déterminer si un événement récurrent est à l'origine des erreurs. Chaque événement indique que le système de fichiers invité est à court d'espace disque. Les objets touchés apparaissent dans le volet en dessous du graphique.
c Cliquez sur chaque triangle rouge pour identifier l'objet affecté et le mettre en surbrillance dans le
volet ci-dessous.
VMware, Inc. 25
Guide de l'utilisateur de vRealize Operations Manager
6 Cliquez sur l'onglet Toutes les mesures pour évaluer les objets en contexte dans la topologie de
l'environnement afin de mieux identifier la cause possible d'un problème.
a Dans la vue supérieure, sélectionnez USA-Cluster.
b Dans le volet des mesures, développez Badge et cliquez deux fois sur Badge|Capacity Remaining
(%).
Le calcul Badge|Capacity Remaining (%) est ajouté au volet inférieur droit.
c Dans le volet des mesures, cliquez deux fois sur Densité.
d Dans le volet des mesures, cliquez deux fois sur Charge de travail.
e Sur la barre d'outils, cliquez sur Contrôles de date et sélectionnez 7 derniers jours.
Le diagramme des mesures indique que la capacité du cluster est restée stable au cours de la semaine passée, mais que la densité du cluster a augmenté jusqu'à atteindre sa valeur maximale dans les derniers jours. Le calcul Badge|Workload (%) affiche les valeurs extrêmes de charge de travail qui correspondent au problème de densité.
Vous avez analysé les symptômes, la chronologie, les événements et les mesures liés aux problèmes sur votre cluster. Vous avez ainsi déterminé que la lourde charge de travail sur le cluster a réduit la densité de celui-ci au cours des derniers jours, ce qui indique que le cluster arrive à court de capacité.
Suivant
Examinez les vues et les cartes thermiques de l'espace Détails pour identifier des tendances et des pics concernant les ressources de vos objets en interprétant les différentes propriétés, mesures et alertes. Vous pouvez également y consulter la répartition des ressources sur tous vos objets et utiliser des cartes de données pour examiner l'utilisation de divers types de ressources sur tous vos objets. Reportez-vous à
« Scénario utilisateur : Examiner les détails de l'environnement », page 26.
Scénario utilisateur : Examiner les détails de l'environnement
Examinez l'état de vos objets dans les vues et dans les cartes thermiques pour identifier les tendances et les pics présentés par les ressources de votre cluster et de vos objets. Pour déterminer si des écarts se sont produits, vous pouvez afficher des résumés globaux sur un objet, comme la répartition de l'utilisation de l'espace disque du cluster.
Pour examiner plus en profondeur les problèmes avec votre cluster USA-Cluster, utilisez les vues Détails pour afficher les mesures et les données de capacité collectées pour votre cluster. Chaque vue inclut des données de mesure spécifiques collectées sur vos objets. Par exemple, les vues de tendance utilisent des données collectées sur des objets au fil du temps pour calculer des tendances et des prévisions concernant l'utilisation de ressources comme la mémoire, les CPU, l'espace disque, etc.
Les cartes thermiques permettent d'examiner les niveaux de capacité sur le cluster, les systèmes hôtes et les machines virtuelles. La taille et la couleur des blocs dépendent des mesures sélectionnées dans la configuration de la carte thermique. Par exemple, la taille de la carte thermique indiquant la plus forte anomalie de charge de travail pour les machines virtuelles dépend de la mesure Badge|Workload (%), et sa couleur de la mesure Badge|Anomaly.
Prérequis
Utilisez les onglets de dépannage pour rechercher les causes principales. Reportez-vous à « Scénario
utilisateur : Résolution de problèmes sur un système hôte », page 24
Procédure
1 Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
26 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
2 Examinez les informations détaillées sur le cluster USA-Cluster dans les vues.
a Cliquez sur l'onglet Options, puis sur Vues.
Les vues offrent plusieurs façons d'examiner différents types de données collectées, à l'aide de tendances, de listes, de distributions et de résumés.
b Dans la zone de texte de recherche, saisissez capacité.
La liste filtre et affiche les vues de capacité pour les clusters et autres objets.
c Cliquez sur la vue nommée Prévision des risques de capacité des clusters et examinez le nombre
de machines virtuelles du cluster USA-Cluster dans le volet inférieur.
Même si le cluster USA-Cluster comporte deux systèmes hôtes et 30 machines virtuelles, il n'existe aucune capacité.
3 Examinez les systèmes hôtes du cluster et récupérez de la capacité sur les machines virtuelles en aval.
a Cliquez sur l'onglet Analyse et sur Capacité restante.
b Dans l'arborescence de l'inventaire, développez USA-Cluster et cliquez sur chacun des systèmes
hôtes.
Le système hôte nommé w2-vcopsqe2-009 est dans un état critique et n'a plus de capacité restante.
c Dans le volet inférieur, développez Mémoire et Allocation.
La valeur sans contrainte est égale à zéro, de même que la quantité de mémoire disponible, ce qui indique que la capacité du système hôte a été épuisée.
d Dans l'onglet Détails, cliquez sur Vues, puis sur la vue Capacité récupérable de la machine
virtuelle.
e Dans le volet inférieur, cliquez sur le titre de la colonne Mémoire récupérable pour trier la liste des
machines virtuelles de sorte à placer la plus grande quantité de capacité récupérable en haut.
f Pour récupérer de la capacité sur plusieurs machines virtuelles, vous devez les sélectionner :
cliquez à droite du nom de la première machine virtuelle, appuyez sur Maj , puis cliquez à droite de la dernière machine virtuelle.
Les machines virtuelles sur laquelle de la capacité peut être récupérée sont mises en surbrillance.
g Cliquez sur l'icône en forme d'engrenage et sélectionnez l'option Définir le nombre de CPU et la
mémoire de la VM.
h Cliquez sur le titre de la colonne CPU actuel pour ordonner la liste en fonction du plus grand
nombre de CPU.
En se fondant sur l'utilisation effective des machines virtuelles énumérées, la colonne Nouvelle CPU recommande un nombre réduit de CPU pour chaque machine virtuelle.
i Cochez la case située à côté de chaque machine virtuelle dont le nombre de CPU correspond à la
valeur recommandée, puis cliquez sur OK.
En réduisant le nombre de CPU pour chaque machine virtuelle, vous libérez de la capacité sur votre système hôte et vous améliorez la capacité et la charge de travail du cluster USA-Cluster.
4 Examinez les cartes thermiques des objets de système hôte et de machine virtuelle dans le cluster USA-
Cluster.
a Dans l'arborescence de l'inventaire, cliquez sur USA-Cluster.
b Cliquez sur Détails, puis sur Cartes thermiques et plusieurs fois dans la liste des vues de cartes
thermiques.
VMware, Inc. 27
Guide de l'utilisateur de vRealize Operations Manager
c Cliquez sur Quelles machines virtuelles ont actuellement les plus hautes valeurs de conflits et
de demande de CPU ?
La carte thermique affiche des blocs qui représentent les objets du cluster USA-Cluster. Le bloc d'une machine virtuelle apparaît en rouge, ce qui indique la présence d'un problème critique.
d Passez la souris sur le bloc rouge et examinez les détails.
Les noms de cluster, de système hôte et de machines virtuelles apparaissent avec des liens dirigeant vers des informations supplémentaires sur l'objet.
e Cliquez sur l'option Afficher les graphiques Sparkline pour afficher la tendance d'activité de la
machine virtuelle.
f Cliquez sur chacun des liens Détails pour afficher plus d'informations.
Pour vérifier si la libération de mémoire sur les machines virtuelles a amélioré la charge de travail du système hôte et du cluster, vous pouvez maintenant examiner leur état.
Vous avez utilisé des vues et des cartes thermiques pour évaluer l'état de vos objets et identifier les tendances et les pics, ainsi que pour libérer de la capacité pour votre système hôte et votre cluster USA­Cluster. Pour étudier les problèmes de manière plus précise, vous pouvez examiner les autres vues et cartes thermiques. Vous pouvez également créer vos propres vues et cartes thermiques.
Suivant
Examinez l'état des badges des objets de votre hiérarchie d'environnement pour identifier les objets qui sont dans un état critique et étudiez les relations entre objets pour déterminer si un problème détecté sur un objet en affecte d'autres. Reportez-vous à « Scénario utilisateur : Examiner les relations de l'environnement », page 28.
Scénario utilisateur : Examiner les relations de l'environnement
Utilisez la présentation et la vue de liste de l'environnement pour examiner l'état des badges, qui représentent des objets de votre hiérarchie d'environnement, et pour déterminer les objets se trouvant dans un état critique pour un badge particulier. Pour afficher les relations entre vos objets et déterminer si un problème critique touchant un objet ancêtre concerne également ses descendants, utilisez la carte Environnement.
En cliquant sur chacun des badges de la présentation de l'environnement, vous constatez que plusieurs objets rencontrent des problèmes critiques de santé, de charge de travail et de pannes. D'autres présentent un état critique en matière de risque et bon nombre présentent ce même état critique en matière de temps restant et de capacité restante.
Plusieurs objets se trouvent sous contrainte. Vous remarquez que vous pouvez récupérer de la capacité sur plusieurs machines virtuelles et sur un système hôte, mais que l'état global d'efficacité de votre environnement ne présente aucun problème.
Prérequis
Examinez l'état de vos objets dans les vues et les cartes thermiques. Reportez-vous à « Scénario utilisateur :
Examiner les détails de l'environnement », page 26.
Procédure
1 Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
28 VMware, Inc.
Chapitre 1 Surveillance des objets dans votre environnement géré avec vRealize Operations Manager
2 Examinez la présentation de l'environnement USA-Cluster pour consulter l'état des badges d'objets
dans une vue hiérarchique.
a Dans l'arborescence de l'inventaire, cliquez sur USA-Cluster et cliquez sur Environnement >
Présentation.
b Sur la barre d'outils Badge, cliquez sur les badges et recherchez les icônes rouges identifiant les
problèmes critiques.
Option Processus d'évaluation
Icônes d'état Lorsque l'état de mon objet est critique, que dois-je faire pour résoudre le
problème ? Comment puis-je être averti avant que des problèmes graves ne se produisent ?
Badges : Santé, Charge de travail, Anomalies et Pannes
Badges : Risque, Temps restant, Capacité restante, Contrainte
Badges : Efficacité, Capacité récupérable, Densité
Comment l'état de santé et de charge de travail de mes systèmes hôtes peut-il affecter mes machines virtuelles ?
Les anomalies et les pannes présentes sur mes systèmes hôtes et sur mes machines virtuelles touchent-elles d'autres objets ?
Comment le niveau de contrainte de mon cluster et de mes systèmes hôtes affecte­t-il les descendants des machines virtuelles ?
Pour améliorer l'efficacité, comment puis-je récupérer de la capacité sur le cluster, les systèmes hôtes, le pool de ressources et les machines virtuelles, et comment appliquer la capacité récupérée à d'autres objets de mon environnement ?
En cliquant sur les badges, vous remarquez que votre objet vCenter Server et d'autres objets de haut niveau semblent être en bonne santé, mais vous constatez qu'un système hôte et plusieurs machines virtuelles sont dans un état critique concernant la santé, la charge de travail et les pannes. Plusieurs objets présentent aussi des problèmes critiques relatifs au temps restant et à la capacité restante.
c Passez votre souris sur l'icône rouge du système hôte pour en afficher l'adresse IP.
d Entrez l'adresse IP dans la zone de texte de recherche et cliquez sur le lien qui apparaît.
Le système hôte apparaît en surbrillance dans l'arborescence d'inventaire. Vous pouvez alors rechercher des recommandations ou des alertes le concernant dans l'onglet Résumé.
3 Examinez la liste de l'environnement et affichez l'état des badges pour vos objets afin de déterminer
ceux qui sont dans un état critique.
a Cliquez sur Environnement > Liste.
b Examinez l'état des badges pour les objets du cluster USA-Cluster.
c Cliquez sur le nom de colonne du badge Capacité restante pour trier la liste des objets et afficher
ceux qui se trouvent dans un état critique.
Une grande partie des objets présentant un risque concernant la capacité restante affichent également des états critiques en matière de temps restant, de risque et de santé. Vous remarquerez que plusieurs machines virtuelles et un système hôte nommé w2-vropsqe2-009 sont touchés de manière critique. Le système hôte étant l'objet qui rencontre les problèmes les plus critiques, lesquels touchent probablement des objets, concentrez-vous sur la résolution des problèmes le concernant.
d Cliquez sur le système hôte nommé w2-vropsqe2-009, qui se trouve dans un état critique, pour le
localiser dans l'arborescence d'inventaire.
e Cliquez sur w2-vropsqe2-009 dans l'arborescence de l'inventaire, puis cliquez sur l'onglet Résumé
pour rechercher des recommandations et des alertes afin de pouvoir prendre des mesures.
VMware, Inc. 29
Guide de l'utilisateur de vRealize Operations Manager
4 Examinez la carte de l'environnement.
a Cliquez sur Environnement > Carte.
b Dans l'arborescence de l'inventaire, cliquez sur USA-Cluster et affichez la carte des objets associés.
Dans la carte des relations, vous pouvez constater que le cluster USA-Cluster dispose d'un centre de données ancêtre, d'un pool de ressources descendant et de deux systèmes hôtes descendants.
c Cliquez sur le système hôte nommé w2-vropsqe2-009.
Le type et le nombre des objets descendants de ce système hôte apparaissent dans la liste ci­dessous. Utilisez la liste des objets descendants pour identifier tous les objets liés au système hôte, lesquels rencontrent sans doute des problèmes.
Suivant
Prenez les mesures appropriées dans l'interface utilisateur pour résoudre les problèmes. Reportez-vous à
« Scénario utilisateur : Résoudre le problème », page 30.
Scénario utilisateur : Résoudre le problème
Utilisez les fonctionnalités d'analyse et de dépannage de vRealize Operations Manager pour examiner les problèmes qui mettent vos objets dans un état critique et identifier des solutions. Pour résoudre les problèmes lorsque des actions existent pour le type d'objet, sélectionnez un objet et une action disponible propre à cet objet. Vous pouvez également ouvrir l'objet dans le système vSphere Web Client et modifier ses paramètres pour résoudre le problème.
Vous avez utilisé les fonctionnalités Analyse, Dépannage, Détails et Environnement de l'interface utilisateur pour examiner les problèmes critiques qui se produisent sur vos objets. Pour résoudre ces problèmes, vous pouvez sélectionner des actions dans le menu Actions, qui apparaît dans les menus de listes et de vues, et afficher différents widgets de tableau de bord.
Les actions que vous pouvez sélectionner sont propres à un type d'objet, comme une machine virtuelle. Bien que plusieurs actions soient disponibles lorsque vous sélectionnez un système hôte qui rencontre des problèmes critiques de capacité et de temps restant, toutes sauf une s'appliquent aux machines virtuelles. L'action de suppression des snapshots inutilisés s'applique aux banques de données.
Prérequis
Examiner les relations de l'environnement. Reportez-vous à « Scénario utilisateur : Examiner les relations de
l'environnement », page 28.
Procédure
1 Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
2 Dans la vue Détails, sélectionnez le système hôte et prenez les mesures appropriées.
a Dans l'arborescence d'inventaire, cliquez sur le système hôte nommé w2-vropsqe2-009.
b Cliquez sur Détails > Vues et entrez mémoire dans la zone de texte de recherche.
30 VMware, Inc.
Loading...
+ 68 hidden pages