Processors

Deep Dive Intel Lunar Lake / Ultra 200. Intels vlaggenschip voor AI-laptops zet een enorme stap in efficiëntie en AI-prestaties. - Lion Cove: de nieuwe P-cores

Auteur: Frank Everaardt
Dinsdag, 04.06.2024 om 05:00 uur

Pagina 5: Lion Cove: de nieuwe P-cores

Advertentie

Lunar Lake is de eerste processor met de nieuwe Lion Cove P-cores aan boord. De chips krijgen er maximaal vier. De E-Cores zijn ook vernieuwd. Deze hebben de naam Skymont gekregen. De nieuwe P-Cores.

Om optimaal gebruik te maken van de mogelijkheden van een processor werd in 2002 met de Pentium 4 HT de eerste chip met HyperTreading op de markt gebracht. Dat was een tijd dat processors nog één core aan boord hadden en de rest van het systeem nog zo traag was dat core niet volcontinu kon doorwerken aan een taak en soms moest wachten. Met Hyperthreading werd het mogelijk om ondertussen een andere taak op te pakken om die tijd op te vullen. Processors met deze techniek aan boord laten een processorcore zich voordoen als het dubbele aantal. Als je in Taakbeheer van een besturingssysteem kijkt, ziet het er vaak heel indrukwekkend uit.

Volgens Intel is HyperThreading inmiddels meer een hindernis dan een voordeel. Als een core voldoende te doen heeft en snel over gegevens kan beschikken, heb je volgens het bedrijf de techniek helemaal niet meer nodig. Het nadeel van de techniek is ook dat het de cores complexer maakt en het verdelen van taken ook complex is. Je wilt immers dat de taken zo eerlijk mogelijk worden verdeeld in de tijd van de core.

HyperThreading heeft niet alleen nadelen: het levert tot zo’n dertig procent hogere prestaties op. Het nadeel is dat het stroomverbruik er ook zo’n twintig procent hoger door wordt bij dezelfde frequentie/voltage. Daarom neemt Intel bij deze chip afscheid van de techniek, al kunnen ze het zo opnieuw uit de kast trekken als het in een volgende generatie toch weer nodig blijkt te zijn. Ook blijven ze het toepassen in andere processorfamilies.

Door bij een geoptimaliseerde core geen gebruik meer te maken van deze techniek worden vijftien procent hogere prestaties gehaald bij hetzelfde verbruik en is er zo’n tien procent minder ruimte nodig voor de cores. Dit is heel relevant bij een laptop, waar het stroomverbruik van belang is.

De nieuwe chip kan ook beter een optimale balans vinden. Waar de vorige generatie stappen van 100MHz kon zetten voor het afstellen van de kloksnelheid, kun je Lion Cove traploos, in stappen van 16,67 MHz instellen.

Een van de belangrijkste onderdelen van een core is de front-end. Deze is verantwoordelijk voor zo goed mogelijk vullen van de processor met instructies waaraan gewerkt kan worden. Intel heeft bij Lion Cove een veel groter blok toegevoegd waarmee voorspellingen worden gedaan. Denk aan code als een soort snelweg/stamboom met allerlei afritten/takken. Op basis van je navigatie moet je bepalen waar je heen gaat, om door te kunnen blijven gaan moet je weten wat er achter de afritten/takken ligt. Welke vertakkingen/stoplichten liggen er? Door een groter blok kun je al verder vooruitkijken. Je weet niet zeker of al je voorspellingen juist zijn, maar hoe beter je dat doet, hoe sneller je cores gevuld kunnen worden en door kunnen blijven werken. Hoe dat precies werkt, is het geheim van chef Intel. Dit blok kan ook grotere stukken code alvast inladen, waardoor de bandbreedte vergroot wordt. Tevens zijn de microcode cache, capaciteit en bandbreedte vergroot. De instructies worden nu tot 128 bytes per cycle opgehaald, het dubbele van de vorige generatie. Ook kan de Lion Cove acht in plaats van zes instructies per keer decoderen. De cores worden dus slimmer en efficiënter gevuld.

De volgende stap is klaarmaken van de instructies voor verwerking van de cores. Hierbij is het belangrijk dat de cores zo veel mogelijk parallel kunnen werken aan de taken. De Out of Order engine brengt orde in de chaos. Hier is een belangrijke verandering: er is nu een verschil gemaakt in de verwerking van integer- en vectorverwerking. Deze worden nu onafhankelijk van elkaar klaargezet voor verwerking. De engine zelf heeft ook op alle fronten meer ruimte gekregen om instructies te hernoemen of instructies weg te zetten die niet nodig zijn (retirement).
Voor de verwerking van integer- en vectorinstructies is Lion Cove ook uitgebreid. Dit geldt ook voor de Vector instructies.

Bij voorgaande generaties hadden de P-cores beschikking over twee caches. Nu zijn het er drie, waarbij de grootste van de drie ten opzichte van de L2-cache van de vorige generatie gegroeid is van 2 naar 2,5 – 3MB. Ook dit komt natuurlijk de verwerkingssnelheid ten goede. Voor de samenwerking met het cache is ook het een en ander verbeterd. Het kladblok translation lookaside buffer is gegroeid van 96 naar 128 pagina’s en ook zijn er nu drie in plaats van twee adresgenerators die in contact staan met het geheugen.

De opbouw van de vorige generatie P-cores van Intel was vrij complex. Ze bestonden uit een heel groot aantal kleine stukjes die een puzzel van de core vormden. De nieuwe Lion Cove-cores zijn opgebouwd uit grotere elementen. Dat maakt ze niet alleen overzichtelijk, maar ook veel onafhankelijker van het productieproces. Dat betekent dat ze dus bij bijvoorbeeld TSMC geproduceerd kunnen worden, maar ook uit de eigen fabrieken kunnen rollen.

In het kort, bij Lion Cove heeft Intel HyperThreading ten faveure van het stroomverbruik laten vallen, maar ook heeft het ingezet om de cores nog efficiënter te benutten. Totdat we de chips kunnen benchmarken, kunnen we nog niet zeggen of deze stap het gewenste resultaat heeft gehad, maar in technisch perspectief is het op zijn minst uitermate interessant.