1 votes

Que signifie "Page fault failed for pfn[0] = 0x0" dans kern.log ?

J'ai récemment commencé à obtenir les éléments suivants imprimés dans "kern.log" et syslog.

Jan 29 10:28:19 server kernel: [82515.307047] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.315021] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.322996] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.330971] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.338944] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.346923] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.354905] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.362875] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.370855] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.378837] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.386824] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.394788] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.402766] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.410765] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.418722] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.426707] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.434693] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.442670] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.450634] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.458628] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.466590] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.474561] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.482551] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.490528] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.498500] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.506492] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.514463] Page fault failed for pfn[0] = 0x0
Jan 29 10:28:19 server kernel: [82515.522435] Page fault failed for pfn[0] = 0x0

Je n'ai aucune idée de ce qu'ils signifient, mais ils semblent durer très longtemps, rendant les journaux extrêmement volumineux et, en général, le système ne répond plus.

Cela pourrait-il être lié à une mauvaise mémoire vive ? Je n'ai rien changé à la RAM depuis un certain temps et le système fonctionnait bien depuis quelques mois.

0voto

Braiam Points 64282

Le morceau de code provient du Pilotes AMDGPU :

for (i = 0; i < ttm->num_pages; i++) {
    /* FIXME: The pages cannot be touched outside the notifier_lock */
    pages[i] = hmm_device_entry_to_page(range, range->pfns[i]);
    if (unlikely(!pages[i])) {
        pr_err("Page fault failed for pfn[%lu] = 0x%llx\n",
               i, range->pfns[i]);
        r = -ENOMEM;

        goto out_free_pfns;

Apparemment, unlikely() retourne vrai en évaluant la négation du contenu de l'entrée i dans le fichier pages qui contient le résultat de l'opération hmm_device_entry_to_page() pour "la plage utilisée pour décoder la valeur d'entrée du périphérique" et "la valeur d'entrée du périphérique pour obtenir la page de structure correspondante". Ceci est censé entraîner une perte de mémoire ( ENOMEM ) erreur pour le gpu. En gros, il y a eu une erreur de mémoire dans votre gpu et il se plaint qu'il n'a plus de mémoire.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X