3 votes

Isoler un seul périphérique dans un groupe IOMMU distinct pour le passage PCI ?

J'ai les groupes et les dispositifs IOMMU ci-dessous.

$ for a in /sys/kernel/iommu_groups/*; do find $a -type l; done | sort --version-sort
/sys/kernel/iommu_groups/0/devices/0000:00:00.0
/sys/kernel/iommu_groups/1/devices/0000:00:02.0
/sys/kernel/iommu_groups/2/devices/0000:00:04.0
/sys/kernel/iommu_groups/3/devices/0000:00:14.0
/sys/kernel/iommu_groups/3/devices/0000:00:14.2
/sys/kernel/iommu_groups/4/devices/0000:00:15.0
/sys/kernel/iommu_groups/4/devices/0000:00:15.1
/sys/kernel/iommu_groups/5/devices/0000:00:16.0
/sys/kernel/iommu_groups/6/devices/0000:00:17.0
/sys/kernel/iommu_groups/7/devices/0000:00:1c.0
/sys/kernel/iommu_groups/7/devices/0000:00:1c.7
/sys/kernel/iommu_groups/7/devices/0000:01:00.0
/sys/kernel/iommu_groups/7/devices/0000:02:00.0
/sys/kernel/iommu_groups/8/devices/0000:00:1f.0
/sys/kernel/iommu_groups/8/devices/0000:00:1f.2
/sys/kernel/iommu_groups/8/devices/0000:00:1f.3
/sys/kernel/iommu_groups/8/devices/0000:00:1f.4

Je voudrais isoler ce dispositif spécifique, /sys/kernel/iommu_groups/7/devices/0000:01:00.0 L'appareil est placé dans son propre groupe, sans aucun autre appareil dans le même groupe.

Comment isoler un seul périphérique dans un groupe IOMMU distinct pour le passage PCI d'une machine virtuelle KVM ?

2voto

blurry Points 1580

Je sais que c'est une vieille question, mais j'ai dû essayer de la résoudre récemment.

La règle de base avec IOMMU est que le noyau va trouver les mappings pour vous. Lorsque le noyau démarre, il cherche à savoir quels périphériques peuvent être mappés sur une carte virtuelle d'E/S (IOVA). Si les périphériques ont la même IOVA, ils se retrouvent dans le même groupe. Ceci est fait pour garantir que chaque groupe possède des périphériques qui peuvent réellement être adressés et auxquels on peut parler séparément.

Il existe plusieurs solutions. La première est d'essayer de déplacer la carte à un autre endroit sur la carte mère. S'il s'agit d'une carte PCI et non PCIe, vous n'aurez probablement pas de chance puisque tous les ports PCI sont probablement mappés sur le même pont PCIe et partagent donc le même IOVA.

Si vous avez vraiment besoin de le faire, vous pouvez prendre tous les périphériques qui sont dans le même groupe et les assigner à vfio-pci, puis vous pouvez faire les assignations par la suite là où les périphériques doivent aller.

Sur ma machine, par exemple, le groupe 13 contient un certain nombre de périphériques, y compris une carte vidéo supplémentaire (18:00.) Voici la sortie de ce répertoire :

root@rwl01:/sys/kernel/iommu_groups/13/devices# ll
total 0
drwxr-xr-x 2 root root 0 Feb 15 15:43 .
drwxr-xr-x 3 root root 0 Feb 15 15:43 ..
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:03:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:03:00.1 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.1
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:03:00.2 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:01.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:01.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:02.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:02.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:03.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:03.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:04.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:04.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:16:08.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:08.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:17:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:00.0/0000:17:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:18:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:01.0/0000:18:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:18:00.1 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:01.0/0000:18:00.1
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:19:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:02.0/0000:19:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:1a:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:03.0/0000:1a:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:1b:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:04.0/0000:1b:00.0
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:1b:00.1 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:04.0/0000:1b:00.1
lrwxrwxrwx 1 root root 0 Feb 15 15:43 0000:1c:00.0 -> ../../../../devices/pci0000:00/0000:00:01.3/0000:03:00.2/0000:16:08.0/0000:1c:00.0

Comme vous pouvez le constater, le répertoire est constitué d'un ensemble de liens. Voici la chaîne qui explique comment les choses sont connectées :

root@rwl01:/sys/kernel/iommu_groups/13/devices# lspci | grep -E '00:01.3|03:00.2|16:01.0'
00:01.3 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453
03:00.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b0 (rev 02)
16:01.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02)

Pour moi, tous ces périphériques sont sur le même pont, ma carte vidéo supplémentaire, mon contrôleur raid, etc. Vous ne pouvez pas les séparer facilement.

BUT.... vous pouvez

Vous devrez appliquer le https://queuecumber.gitlab.io/linux-acs-override/ (patch ACS Override Kernel) Cela vous permettra d'utiliser des paramètres de ligne de commande pour exposer des parties de groupes qui sont leurs propres groupes. Après avoir installé le patch, vous pouvez alors configurer les paramètres de ligne de commande du noyau que vous souhaitez :

pcie_acs_override =
        [PCIE] Override missing PCIe ACS support for:
    downstream
        All downstream ports - full ACS capabilties
    multifunction
        All multifunction devices - multifunction ACS subset
    id:nnnn:nnnn
        Specfic device - full ACS capabilities
        Specified as vid:did (vendor/device ID) in hex

À partir de là, vous devriez être en mesure de faire en sorte que le dispositif soit dans son propre groupe et vous devriez être prêt pour les courses. Il y a des problèmes avec cette méthode :

Voici quelques bons liens :

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X