3 votes

Le système de fichiers Linux d'une VM se bloque ou devient en lecture seule chez Citrix XenServer

J'ai lu quelques réponses relatives à ce problème. Le système d'exploitation se bloquera-t-il si la partition système n'est pas accessible pendant une courte période ? Mais je n'arrive pas à résoudre ce problème.

Lors de l'utilisation d'ISCSI comme référentiel de stockage sur XenServer et DomU (VM), les E/S sur disque sont importantes, Si la connexion ISCSI est perdue (principalement problème de connexion réseau / basculement de stockage), Le système de fichiers du DomU (en particulier le système de fichiers linux ext3) se bloque. Dans ce cas, le système de fichiers ext3 du DomU devient en lecture seule ou irrécupérable.

Comment protéger le système de fichiers de la VM en cas de perte de la connexion ISCSI sur le Dom0 ?

Voici mon environnement XenServer.

[root@cnode01-m ~]# iscsiadm -m session
tcp: [1] 10.32.1.240:3260,2 iqn.1986-03.com.sun:02:c5544ae6-9715-6f38-f83b-a446896ac614
tcp: [3569] 10.32.1.240:3260,2 iqn.1986-03.com.sun:02:5c41ce31-3fbb-c6aa-d479-947e85515ac7

[root@cnode01-m ~]# vgs
  VG                                                 #PV #LV #SN Attr   VSize   VFree  
  VG_XenStorage-1aeee13b-2a87-1d0d-1834-7b8c868009b0   1  40   0 wz--n-   6.35T   4.93T
  VG_XenStorage-28e2c663-dae5-9504-9733-e05063ff081d   1  57   0 wz--n-   6.35T   4.52T
  VG_XenStorage-365d6e13-5caa-1fea-9940-e1bb553e3513   1  42   0 wz--n-   6.35T   5.13T
  VG_XenStorage-4ea23f9a-f945-5d45-cbd2-f3eab3fe75b3   1  42   0 wz--n-   6.35T   5.40T
  VG_XenStorage-54d69165-2eed-c058-d587-1b84d488adea   1  37   0 wz--n-   6.35T   5.01T
  VG_XenStorage-598b7237-282b-ea61-8edc-5101a70ea001   1  63   0 wz--n-   6.35T   5.01T
  VG_XenStorage-6a063762-26de-a3f8-f18c-734fce25433a   1  49   0 wz--n-   6.35T   5.56T
  VG_XenStorage-6b7bea84-7269-fa88-7b95-23dce431e1aa   1  71   0 wz--n-   6.35T   4.80T
  VG_XenStorage-6d6d263b-243c-fb24-4f0c-28b226a22bab   1  47   0 wz--n-   6.35T   4.94T
  VG_XenStorage-76fe6d6d-a37a-698d-9af2-50ea3f55e127   1  44   0 wz--n-   6.35T   5.37T
  VG_XenStorage-80e2df33-268c-b8a6-cc02-71f27ebe3326   1  39   0 wz--n-   6.35T   5.80T
  VG_XenStorage-886070b7-34e8-eb96-0931-2c31952608a6   1  13   0 wz--n- 457.65G 369.31G
  VG_XenStorage-97136f70-cf33-2593-38e0-b8c09785a754   1  60   0 wz--n-   6.35T   5.14T
  VG_XenStorage-c910e9fd-8817-0b99-8c8d-1ee0883705de   1  37   0 wz--n-   6.35T   5.67T
  VG_XenStorage-cd709bcb-d46a-8483-acbf-49b2b0c59c06   1  58   0 wz--n-   6.35T   4.80T
  VG_XenStorage-e153d09a-716a-9764-8967-f704278d55bd   1  43   0 wz--n-   6.35T   4.45T
  VG_XenStorage-f8574b51-31d4-7b0e-c71e-8253e1cdd230   1  61   0 wz--n-   6.35T   4.20T

[root@cnode01-m ~]# ls -la /dev/sd[a-z]
brw-r----- 1 root disk  8,   0 Jun  8 17:37 /dev/sda
brw-r----- 1 root disk  8,  16 Aug  1 10:14 /dev/sdb
brw-r----- 1 root disk  8,  32 Jun  8 17:38 /dev/sdc
brw-r----- 1 root disk  8,  48 Jul 31 14:49 /dev/sdd
brw-r----- 1 root disk  8,  64 Jul 31 14:46 /dev/sde
brw-r----- 1 root disk  8,  80 Jul 31 14:51 /dev/sdf
brw-r----- 1 root disk  8,  96 Aug  3 13:52 /dev/sdg
brw-r----- 1 root disk  8, 112 Aug  3 10:53 /dev/sdh
brw-r----- 1 root disk  8, 128 Aug  2 13:40 /dev/sdi
brw-r----- 1 root disk  8, 144 Jul 30 00:17 /dev/sdj
brw-r----- 1 root disk  8, 160 Jul 30 00:17 /dev/sdk
brw-r----- 1 root disk  8, 176 Jul 30 00:17 /dev/sdl
brw-r----- 1 root disk  8, 192 Jul 30 00:17 /dev/sdm
brw-r----- 1 root disk  8, 208 Jul 30 00:17 /dev/sdn
brw-r----- 1 root disk  8, 224 Jul 30 00:17 /dev/sdo
brw-r----- 1 root disk  8, 240 Jul 30 00:17 /dev/sdp
brw-r----- 1 root disk 65,   0 Jul 30 00:17 /dev/sdq

Il s'agit de mon environnement DomU (VM).

[root@i-58-7172-VM ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/mapper/VolGroup00-LogVol00
                       16G  1.5G   14G  11% /
/dev/xvda1             99M   30M   65M  32% /boot
tmpfs                 512M     0  512M   0% /dev/shm

Lorsque je mets une charge d'E/S importante sur la partition / de la VM et que la connexion ISCSI pose des problèmes (problème de réseau, événement de basculement de la cible ISCSI), la partition / s'est écrasée.

Comment puis-je résoudre ce problème ? D'avance, merci beaucoup.

Ajouté

Voici mon fichier iscsid.conf sur Dom0

\[root@cnode01-m ~\]# more /etc/iscsi/iscsid.conf
node.startup = manual
node.session.timeo.replacement\_timeout = 86400
node.conn\[0\].timeo.login\_timeout = 15
node.conn\[0\].timeo.logout\_timeout = 15
node.conn\[0\].timeo.noop\_out\_interval = 0
node.conn\[0\].timeo.noop\_out\_timeout = 0
node.session.initial\_login\_retry\_max = 4
node.session.cmds\_max = 128
node.session.queue\_depth = 32
node.session.iscsi.InitialR2T = No
node.session.iscsi.ImmediateData = Yes
node.session.iscsi.FirstBurstLength = 262144
node.session.iscsi.MaxBurstLength = 16776192
node.conn\[0\].iscsi.MaxRecvDataSegmentLength = 131072
discovery.sendtargets.iscsi.MaxRecvDataSegmentLength = 32768
node.session.iscsi.FastAbort = No

L'Ethernet 10G et la trame Jumbo sont mis en œuvre au niveau de la couche de stockage. Citrix XenServer dispose également d'une commande permettant de mettre en pause les VM lorsque le service de stockage rencontre des problèmes Mais la mise en pause et la remise en pause d'une VM entraînent une désintégration de l'horloge système de la VM. Cela peut donc avoir des effets secondaires, principalement au niveau de la couche application. C'est ce que je pense.

1voto

Andrew T Points 1088

Il faut d'abord s'attaquer à la source du problème : l'accès au stockage. Avec iscsi, vous pouvez modifier iscsi.conf et augmenter la longueur de la file d'attente, la taille des tampons et le délai d'attente, de sorte que la connexion puisse supporter des pannes plus longues. En outre, la mise en œuvre du multipathing, de l'Ethernet 10G (si le SAN le prend en charge) et des trames jumbo est une bonne idée.

Je ne suis pas un expert de Xen, mais avec KVM, il y a une option pour mettre en pause les VM lorsqu'il y a un EIO ou ENOSPACE renvoyé par la couche de stockage, cela devrait être possible avec Xen, si vous creusez dans les options IMO, et si ce n'est pas le cas - j'essaierais de déposer une demande de fonctionnalité auprès des développeurs.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X