Mémoire vive : qu’est-ce que le « On die ECC »

Les barrettes de mémoire vive pour serveur sont dotées de fonctionnalités plus avancées que pour les ordinateurs portables et de bureau. Particularité des postes de travail haut de gamme et des serveurs, la RAM « ECC » (Error-Correcting Code RAM) est un type de mémoire vive capable de détecter et de corriger les erreurs de données. Contrairement à la RAM standard (non-ECC), elle est conçue pour garantir une plus grande fiabilité et intégrité des données, ce qui la rend essentielle pour les systèmes où la moindre erreur peut avoir des conséquences critiques.
L’On-die ECC (Error-Correcting Code) est une fonctionnalité de correction d’erreurs intégrée directement dans les puces de mémoire DRAM elles-mêmes. Cette technologie a été introduite de manière standard avec la mémoire DDR5.
Ce qu’il faut savoir sur l’On-die ECC (ou ODECC)
Correction d’erreurs interne : Contrairement à l’ECC « traditionnel » ou « side-band » qui gère les erreurs sur le module de mémoire ou entre le module et le CPU, l’On-die ECC corrige les erreurs avant même que les données ne quittent la puce DRAM. Cela signifie qu’il détecte et corrige les erreurs de bits qui se produisent à l’intérieur de la puce.
Fiabilité accrue des puces haute densité : Avec l’augmentation de la densité des cellules de mémoire, celles-ci deviennent plus sensibles aux erreurs (bit flips). L’On-die ECC aide à gérer ces erreurs, ce qui permet aux fabricants de produire des modules de mémoire de plus grande capacité avec une meilleure fiabilité. Il vise à garantir que plus de cellules respectent les spécifications requises par la JEDEC (l’organisme de normalisation de l’industrie des semi-conducteurs).
Invisible pour le système : L’On-die ECC fonctionne de manière autonome à l’intérieur de la puce DRAM. Le système d’exploitation ou le contrôleur mémoire du CPU ne « voient » pas directement ces corrections. Les données sont corrigées avant d’être transmises au CPU.
Différence avec l’ECC « traditionnel » (Side-band ECC)
L’On-die ECC protège les données à l’intérieur de la puce de mémoire.
L’ECC « side-band » (ou ECC pleine bande passante) protège les données pendant leur transit entre le module de mémoire et le CPU, et est capable de détecter et de corriger des erreurs plus complexes (comme les erreurs de plusieurs bits) ainsi que de signaler les erreurs au système. C’est le type d’ECC que l’on trouve généralement dans les serveurs et postes de travail très performants (Dell Precision, par exemple).
L’On-die ECC de la DDR5 n’est pas un remplacement de l’ECC « side-band » pour les applications critiques qui nécessitent une intégrité des données de bout en bout. Il s’agit plutôt d’une couche de protection supplémentaire pour améliorer la fiabilité des puces individuelles. Pour une protection complète, un système a besoin des deux types d’ECC.
En résumé, l’On-die ECC est une innovation de la DDR5 qui améliore la fiabilité interne des puces DRAM, permettant des densités plus élevées et une meilleure intégrité des données au niveau du composant.