Voici un guide approximatif pour le réglage de l'encodeur :
Nous commencerons par les bases, car il serait préjudiciable de conclure qu'un barrage rapide d'options améliorera soudainement le rendement attendu sans comprendre les objectifs et les attentes souhaités :
1. Commencez par comprendre les options de l'encodeur.
Pour les codeurs basés sur NVENC, commencez par apprendre les options que chaque codeur prend (Notez que je suis sous Linux, c'est pourquoi j'utilise xclip pour copier les options du codec dans le presse-papiers avant de les coller ici) :
(a). Pour l'encodeur H.264 :
ffmpeg -hide_banner -h encoder=h264_nvenc | xclip -sel clip
Ausgabe:
Encoder h264_nvenc [NVIDIA NVENC H.264 encoder]:
General capabilities: delay
Threading capabilities: none
Supported pixel formats: yuv420p nv12 p010le yuv444p yuv444p16le bgr0 rgb0 cuda
h264_nvenc AVOptions:
-preset <int> E..V.... Set the encoding preset (from 0 to 11) (default medium)
default E..V....
slow E..V.... hq 2 passes
medium E..V.... hq 1 pass
fast E..V.... hp 1 pass
hp E..V....
hq E..V....
bd E..V....
ll E..V.... low latency
llhq E..V.... low latency hq
llhp E..V.... low latency hp
lossless E..V....
losslesshp E..V....
-profile <int> E..V.... Set the encoding profile (from 0 to 3) (default main)
baseline E..V....
main E..V....
high E..V....
high444p E..V....
-level <int> E..V.... Set the encoding level restriction (from 0 to 51) (default auto)
auto E..V....
1 E..V....
1.0 E..V....
1b E..V....
1.0b E..V....
1.1 E..V....
1.2 E..V....
1.3 E..V....
2 E..V....
2.0 E..V....
2.1 E..V....
2.2 E..V....
3 E..V....
3.0 E..V....
3.1 E..V....
3.2 E..V....
4 E..V....
4.0 E..V....
4.1 E..V....
4.2 E..V....
5 E..V....
5.0 E..V....
5.1 E..V....
-rc <int> E..V.... Override the preset rate-control (from -1 to INT_MAX) (default -1)
constqp E..V.... Constant QP mode
vbr E..V.... Variable bitrate mode
cbr E..V.... Constant bitrate mode
vbr_minqp E..V.... Variable bitrate mode with MinQP (deprecated)
ll_2pass_quality E..V.... Multi-pass optimized for image quality (deprecated)
ll_2pass_size E..V.... Multi-pass optimized for constant frame size (deprecated)
vbr_2pass E..V.... Multi-pass variable bitrate mode (deprecated)
cbr_ld_hq E..V.... Constant bitrate low delay high quality mode
cbr_hq E..V.... Constant bitrate high quality mode
vbr_hq E..V.... Variable bitrate high quality mode
-rc-lookahead <int> E..V.... Number of frames to look ahead for rate-control (from 0 to INT_MAX) (default 0)
-surfaces <int> E..V.... Number of concurrent surfaces (from 0 to 64) (default 0)
-cbr <boolean> E..V.... Use cbr encoding mode (default false)
-2pass <boolean> E..V.... Use 2pass encoding mode (default auto)
-gpu <int> E..V.... Selects which NVENC capable GPU to use. First GPU is 0, second is 1, and so on. (from -2 to INT_MAX) (default any)
any E..V.... Pick the first device available
list E..V.... List the available devices
-delay <int> E..V.... Delay frame output by the given amount of frames (from 0 to INT_MAX) (default INT_MAX)
-no-scenecut <boolean> E..V.... When lookahead is enabled, set this to 1 to disable adaptive I-frame insertion at scene cuts (default false)
-forced-idr <boolean> E..V.... If forcing keyframes, force them as IDR frames. (default false)
-b_adapt <boolean> E..V.... When lookahead is enabled, set this to 0 to disable adaptive B-frame decision (default true)
-spatial-aq <boolean> E..V.... set to 1 to enable Spatial AQ (default false)
-temporal-aq <boolean> E..V.... set to 1 to enable Temporal AQ (default false)
-zerolatency <boolean> E..V.... Set 1 to indicate zero latency operation (no reordering delay) (default false)
-nonref_p <boolean> E..V.... Set this to 1 to enable automatic insertion of non-reference P-frames (default false)
-strict_gop <boolean> E..V.... Set 1 to minimize GOP-to-GOP rate fluctuations (default false)
-aq-strength <int> E..V.... When Spatial AQ is enabled, this field is used to specify AQ strength. AQ strength scale is from 1 (low) - 15 (aggressive) (from 1 to 15) (default 8)
-cq <float> E..V.... Set target quality level (0 to 51, 0 means automatic) for constant quality mode in VBR rate control (from 0 to 51) (default 0)
-aud <boolean> E..V.... Use access unit delimiters (default false)
-bluray-compat <boolean> E..V.... Bluray compatibility workarounds (default false)
-init_qpP <int> E..V.... Initial QP value for P frame (from -1 to 51) (default -1)
-init_qpB <int> E..V.... Initial QP value for B frame (from -1 to 51) (default -1)
-init_qpI <int> E..V.... Initial QP value for I frame (from -1 to 51) (default -1)
-qp <int> E..V.... Constant quantization parameter rate control method (from -1 to 51) (default -1)
-weighted_pred <int> E..V.... Set 1 to enable weighted prediction (from 0 to 1) (default 0)
-coder <int> E..V.... Coder type (from -1 to 2) (default default)
default E..V....
auto E..V....
cabac E..V....
cavlc E..V....
ac E..V....
vlc E..V....
(b). Pour le codeur HEVC/H.265 :
ffmpeg -hide_banner -h encoder=hevc_nvenc | xclip -sel clip
Ausgabe:
Encoder hevc_nvenc [NVIDIA NVENC hevc encoder]:
General capabilities: delay
Threading capabilities: none
Supported pixel formats: yuv420p nv12 p010le yuv444p yuv444p16le bgr0 rgb0 cuda
hevc_nvenc AVOptions:
-preset <int> E..V.... Set the encoding preset (from 0 to 11) (default medium)
default E..V....
slow E..V.... hq 2 passes
medium E..V.... hq 1 pass
fast E..V.... hp 1 pass
hp E..V....
hq E..V....
bd E..V....
ll E..V.... low latency
llhq E..V.... low latency hq
llhp E..V.... low latency hp
lossless E..V.... lossless
losslesshp E..V.... lossless hp
-profile <int> E..V.... Set the encoding profile (from 0 to 4) (default main)
main E..V....
main10 E..V....
rext E..V....
-level <int> E..V.... Set the encoding level restriction (from 0 to 186) (default auto)
auto E..V....
1 E..V....
1.0 E..V....
2 E..V....
2.0 E..V....
2.1 E..V....
3 E..V....
3.0 E..V....
3.1 E..V....
4 E..V....
4.0 E..V....
4.1 E..V....
5 E..V....
5.0 E..V....
5.1 E..V....
5.2 E..V....
6 E..V....
6.0 E..V....
6.1 E..V....
6.2 E..V....
-tier <int> E..V.... Set the encoding tier (from 0 to 1) (default main)
main E..V....
high E..V....
-rc <int> E..V.... Override the preset rate-control (from -1 to INT_MAX) (default -1)
constqp E..V.... Constant QP mode
vbr E..V.... Variable bitrate mode
cbr E..V.... Constant bitrate mode
vbr_minqp E..V.... Variable bitrate mode with MinQP (deprecated)
ll_2pass_quality E..V.... Multi-pass optimized for image quality (deprecated)
ll_2pass_size E..V.... Multi-pass optimized for constant frame size (deprecated)
vbr_2pass E..V.... Multi-pass variable bitrate mode (deprecated)
cbr_ld_hq E..V.... Constant bitrate low delay high quality mode
cbr_hq E..V.... Constant bitrate high quality mode
vbr_hq E..V.... Variable bitrate high quality mode
-rc-lookahead <int> E..V.... Number of frames to look ahead for rate-control (from 0 to INT_MAX) (default 0)
-surfaces <int> E..V.... Number of concurrent surfaces (from 0 to 64) (default 0)
-cbr <boolean> E..V.... Use cbr encoding mode (default false)
-2pass <boolean> E..V.... Use 2pass encoding mode (default auto)
-gpu <int> E..V.... Selects which NVENC capable GPU to use. First GPU is 0, second is 1, and so on. (from -2 to INT_MAX) (default any)
any E..V.... Pick the first device available
list E..V.... List the available devices
-delay <int> E..V.... Delay frame output by the given amount of frames (from 0 to INT_MAX) (default INT_MAX)
-no-scenecut <boolean> E..V.... When lookahead is enabled, set this to 1 to disable adaptive I-frame insertion at scene cuts (default false)
-forced-idr <boolean> E..V.... If forcing keyframes, force them as IDR frames. (default false)
-spatial_aq <boolean> E..V.... set to 1 to enable Spatial AQ (default false)
-temporal_aq <boolean> E..V.... set to 1 to enable Temporal AQ (default false)
-zerolatency <boolean> E..V.... Set 1 to indicate zero latency operation (no reordering delay) (default false)
-nonref_p <boolean> E..V.... Set this to 1 to enable automatic insertion of non-reference P-frames (default false)
-strict_gop <boolean> E..V.... Set 1 to minimize GOP-to-GOP rate fluctuations (default false)
-aq-strength <int> E..V.... When Spatial AQ is enabled, this field is used to specify AQ strength. AQ strength scale is from 1 (low) - 15 (aggressive) (from 1 to 15) (default 8)
-cq <float> E..V.... Set target quality level (0 to 51, 0 means automatic) for constant quality mode in VBR rate control (from 0 to 51) (default 0)
-aud <boolean> E..V.... Use access unit delimiters (default false)
-bluray-compat <boolean> E..V.... Bluray compatibility workarounds (default false)
-init_qpP <int> E..V.... Initial QP value for P frame (from -1 to 51) (default -1)
-init_qpB <int> E..V.... Initial QP value for B frame (from -1 to 51) (default -1)
-init_qpI <int> E..V.... Initial QP value for I frame (from -1 to 51) (default -1)
-qp <int> E..V.... Constant quantization parameter rate control method (from -1 to 51) (default -1)
-weighted_pred <int> E..V.... Set 1 to enable weighted prediction (from 0 to 1) (default 0)
2. Comprenez les limites du matériel et respectez les valeurs par défaut avant d'appliquer des options :
Se référer à cette réponse pour les limitations matérielles que vous rencontrerez avec NVENC, notamment pour les encodages HEVC sur Pascal. Un article plus à jour avec les options actuelles pour les nouvelles et anciennes versions peut être trouvé ici . Adaptez si nécessaire à vos besoins d'encodage.
Pour l'infrastructure accélérée par le matériel disponible sur le matériel NVIDIA de la génération actuelle avec FFmpeg, voir ce réponse.
Ensuite, en utilisant ces informations, passez à l'étape suivante.
3. La syntaxe est essentielle :
Voici l'ordre dans lequel vous devez passer les arguments à FFmpeg :
(a). Appelez le binaire.
(b). Passez n'importe quel argument à FFmpeg (tel que -loglevel
directement) avant de déclarer les entrées.
(c). Si vous utilisez un décodage accéléré par le matériel, tel que cuvid
déclarez-la ici et incluez tous les arguments spécifiques dont elle a besoin. À ce stade, il est impératif de mentionner que les décodeurs ont des contraintes spécifiques, telles que les résolutions d'entrée attendues, les codecs pris en charge, etc., et qu'il est donc recommandé, en production, de déterminer et de valider la nécessité de décodeurs à accélération matérielle, car un échec à ce stade entraîne un échec du codage et est irrécupérable. En fait, le Les développeurs de MPV l'ont mentionné à plusieurs reprises ne comptez pas sur le décodage accéléré par le matériel pour la diffusion de contenu critique.
(d). Déclarez vos entrées. Pour les flux, utilisez l'URL et si nécessaire, ajoutez des drapeaux supplémentaires (comme la taille des tampons). Pour les ressources locales (sur un système de fichiers accessible), le chemin absolu du fichier est nécessaire.
(e). En option, insérez un filtre. Celui-ci est nécessaire pour des fonctions telles que le redimensionnement, les conversations sur le format des pixels, le désentrelacement, etc. Notez que selon le filtre utilisé ici, un décodeur matériel (tel que décrit dans la section (c)) introduira des contraintes que votre filtre doit être capable de gérer, sinon votre encodage échouera.
(f). Appelez les encodeurs vidéo et audio appropriés, et passez-leur les arguments nécessaires, tels que les mappings, les débits binaires, les préréglages d'encodeur, etc. En ce qui concerne les débits binaires, assurez-vous que les valeurs souhaitées sont définies via la fonction -b:v
, -maxrate:v
et -bufsize:v
options. Ne les laissez pas vides. Ce site est un bon point de départ pour comprendre pourquoi ces valeurs sont importantes. Comme toujours, commencez par spécifier un préréglage. Faites défiler la page jusqu'en bas pour voir les notes sur l'impact des préréglages sur les performances avec cet encodeur particulier.
(g). Alors que FFmpeg peut déduire le format de sortie requis d'un fichier en fonction de l'extension sélectionnée du fichier de sortie, il est recommandé de déclarer explicitement le format de sortie (via l'option -f) afin que des options supplémentaires puissent être transmises au muxer sous-jacent si nécessaire, comme c'est souvent le cas avec les formats de streaming tels que HLS, mpegts et DASH.
(h). Le chemin absolu vers le fichier de sortie.
Avec votre exemple ci-dessus, cité comme :
ffmpeg -i "e:\input.ts" -vcodec h264_nvenc -preset slow -level 4.1
-qmin 10 -qmax 52 "e:\output.mp4"
Vous pouvez améliorer la qualité de la sortie en spécifiant des débits binaires appropriés (par l'intermédiaire de l'option -b:v
, -maxrate:v
et -bufsize:v
), en activant les techniques d'encodage de quantification adaptative (les méthodes AQ spatiales et temporelles sont supportées, une seule pouvant être utilisée à la fois) et en activant optionnellement (et séparément) la prédiction pondérée (ce qui désactivera le support des B-frames) comme montré ci-dessous, ainsi qu'un filtre optionnel pour un downscale et un resize appropriés si nécessaire. L'exemple ci-dessous montre un extrait traitant une entrée mpegts encodée en mpeg2 :
ffmpeg -loglevel debug -threads 4 -hwaccel cuvid -c:v mpeg2_cuvid -i "e:\input.ts" \
-filter:v hwupload_cuda,scale_npp=w=1920:h=1080:interp_algo=lanczos \
-c:v h264_nvenc -b:v 4M -maxrate:v 5M -bufsize:v 8M -profile:v main \
-level:v 4.1 -rc:v vbr_hq -rc-lookahead:v 32 \
-spatial_aq:v 1 -aq-strength:v 15 -coder:v cabac \
-f mp4 "e:\output.mp4"
Attention : Notez que la prédiction pondérée ( -weighted_pred
) ne peut être activé en même temps que la quantification adaptative et/ou spatiale. Toute tentative en ce sens entraînera un échec de l'initialisation du codeur.
Sur la mise en œuvre de la quantification adaptative dans NVENC : Notez que l'AQ temporel redistribue les bits dans le temps, de sorte qu'une trame plus complexe recevra plus d'informations. La QA spatiale redistribue les bits dans l'espace, de sorte qu'une partie plus complexe d'une trame recevra plus d'informations.
Le snippet ci-dessus suppose que le fichier d'entrée est un flux MPEG2. Si ce n'est pas le cas, passez au décodeur CUVID correct après l'avoir analysé :
ffprobe -i e:\input.ts
S'il s'agit de H.264/AVC, modifiez l'extrait comme indiqué ci-dessous :
ffmpeg -loglevel debug -threads 1 -hwaccel nvdec \
-hwacccel_output_format cuda -i "e:\input.ts" \
-filter:v "scale_npp=w=1920:h=1080:interp_algo=lanczos" \
-c:v h264_nvenc -b:v 4M -maxrate:v 5M -bufsize:v 8M -profile:v main \
-level:v 4.1 -rc:v vbr_hq -rc-lookahead:v 32 -spatial_aq:v 1 \
-aq-strength:v 15 -coder:v cabac \
-f mp4 "e:\output.mp4"
J'ai remarqué que l'activation des options de quantification adaptative OU de prédiction pondérée pour NVENC peut introduire des problèmes de stabilité, en particulier avec des combinaisons spécifiques de pilotes de périphériques. Dans la mesure du possible, envisagez d'utiliser des trames B (pas plus de 3) combinées à l'option générique -refs:v
à 16 ou à peu près, au lieu de basculer entre QA et prédiction pondérée :
ffmpeg -loglevel debug -threads 1 -hwaccel nvdec \
-hwaccel_output_format cuda -i "e:\input.ts" \
-filter:v scale_npp=w=1920:h=1080:interp_algo=lanczos \
-c:v h264_nvenc -b:v 4M -maxrate:v 5M -bufsize:v 8M -profile:v main \
-level:v 4.1 -rc:v vbr_hq -rc-lookahead:v 32 -refs:v 16 \
-bf:v 3 -coder:v cabac \
-f mp4 "e:\output.mp4"
Avec Turing En particulier, il peut être utile d'activer les cadres B pour la référence, comme indiqué ci-dessous (voir le bouton à bascule -b_ref_mode:v middle)
:
ffmpeg -loglevel debug -threads 1 -hwaccel cuvid \
-hwaccel_output_format cuda -i "e:\input.ts" \
-filter:v scale_npp=w=1920:h=1080:interp_algo=lanczos \
-c:v h264_nvenc -b:v 4M -maxrate:v 5M -bufsize:v 8M -profile:v main \
-level:v 4.1 -rc:v vbr_hq -rc-lookahead:v 32 -refs:v 16 \
-bf:v 3 -coder:v cabac -b_ref_mode:v middle \
-f mp4 "e:\output.mp4"
Une note supplémentaire sur le nombre de threads (transmis à ffmpeg via la fonction -threads
option) :
Un plus grand nombre de fils d'encodage au-delà d'un certain seuil augmente la latence et aura une empreinte mémoire d'encodage plus élevée. La dégradation de la qualité est plus importante lorsque le nombre de threads est élevé dans les modes à débit constant et dans le mode à débit quasi-constant appelé VBV (Video buffer verifier), en raison de l'augmentation du délai d'encodage. Les images clés ont besoin de plus de données que les autres types d'images pour éviter les images clés de mauvaise qualité.
Le mode "zero-delay" ou "sliced thread" n'a pas de délai, mais cette option détériore encore plus la qualité des multi-threads dans les encodeurs supportés.
Il est donc sage de limiter le nombre de threads sur les encodeurs où la latence est importante, car l'augmentation perçue du débit de l'encodeur compense les avantages qu'elle peut apporter à long terme.
Et puisque vous êtes sous Windows, vous pouvez supprimer les échappatoires Shell. \
car j'écris ceci depuis une machine Unix qui teste la commande ci-dessus.
Notes sur l'impact des performances avec les préréglages et les considérations relatives à l'encodage entrelacé :
Pour des performances à haut débit et faible latence, assurez-vous d'utiliser l'une des deux solutions suivantes llhp
o llhq
présélectionnés. Ceci est particulièrement utile pour les charges de travail telles que le streaming en direct, où une compatibilité plus large avec une plus grande variété de périphériques est attendue, et en tant que tel, les fonctionnalités handicapantes pour les performances telles que les B-frames peuvent être complètement omises pour un bon compromis entre les débits binaires plus élevés utilisés et le débit. Les préréglages supérieurs (tels que le préréglage par défaut medium
) ont des rendements qualitatifs rapidement décroissants tout en subissant des ralentissements importants du débit du codeur. La différence de qualité entre llhp
et llhq
tel que mesuré par Le VMAF de Netflix est pratiquement négligeable, mais l'augmentation des performances du codeur (plus de ~30% sur mon banc d'essai) avec le premier est certainement appréciable.
Pour le llhp
et llhq
ainsi que d'autres préréglages en cours d'utilisation, vous pouvez également remplacer les méthodes de contrôle de la vitesse intégrées en passant la propriété -rc:v
arguments tels qu'exposés par les options de l'encodeur. Par exemple, avec un encodage à débit binaire constant, vous pouvez indiquer -rc:v cbr
(qui est nettement plus rapide que le cbr_ld_hq
méthode de contrôle du débit, apportant une augmentation supplémentaire de ~20% du débit). Il convient de noter que le préréglage sélectionné a le plus grand impact sur le débit suivi des options prédéfinies (telles que la méthode de contrôle du débit utilisée) que vous pouvez remplacer si vous le souhaitez.
Sur les versions actuelles (à partir de 2021+), notez que les préréglages sont davantage personnalisables avec des paramètres basés sur le cas d'utilisation, via l'option -tune:v
comme indiqué dans le document ici .
Examinez votre flux de travail d'encodage et ajustez-le si nécessaire. Votre kilométrage variera certainement, en fonction de votre contenu source, des chaînes de filtres utilisées, des variables de configuration spécifiques à pltform (telles que votre GPU et les versions des pilotes), etc.
Dans le même souffle, notez que NVIDIA a désactivé explicitement le codage entrelacé sur Turing sur tous les niveaux, même le 1650 utilise l'ancien codeur Volta NVENC. Si vous avez besoin de la prise en charge de l'encodage entrelacé, passez plutôt au Pascal ou à des SKU plus anciens.