Le problème est la synchronisation.
Lorsque vous envoyez en parallèle, vous devez mesurer toutes les lignes exactement au même moment. Au fur et à mesure que vous accélérez, la taille de la fenêtre pour ce moment devient de plus en plus petite, elle peut finalement devenir si petite que certains des fils peuvent encore être en train de se stabiliser alors que d'autres sont terminés avant que vous ne manquiez de temps.
En envoyant les données en série, vous n'avez plus à vous soucier de la stabilisation de toutes les lignes, mais d'une seule. Et il est plus rentable de faire en sorte qu'une ligne se stabilise 10 fois plus vite que d'ajouter 10 lignes à la même vitesse.
Certaines choses comme le PCI Express font le meilleur des deux mondes, ils font un ensemble parallèle de connexions série (le port 16x sur votre carte mère a 16 connexions série). En faisant cela, chaque ligne n'a pas besoin d'être parfaitement synchronisée avec les autres lignes, du moment que le contrôleur à l'autre extrémité peut réorganiser les "paquets" de données au fur et à mesure qu'ils arrivent en utilisant l'ordre correct.
El Page "How Stuff Works" pour PCI-Express explique en détail comment PCI Express en série peut être plus rapide que PCI ou PCI-X en parallèle.
Version TL;DR : Il est plus facile de faire en sorte qu'une seule connexion soit 16 fois plus rapide que 8 connexions soient 2 fois plus rapides, une fois que l'on arrive à des fréquences très élevées.