Penryn
Penryn es lo que nos ofrecerá primeramente Intel en 45nm, esto no será una nueva microarquitectura, pero traerá mejoras importantes de revisar

Intel actualmente goza de un liderato en performance que no ha sido gratis, ha tenido que aprender de los errores o estrategias equivocadas, ha sabido pulir sus microarquitecturas cual relojero suizo, una de sus jugadas maestras en el ultimo tiempo, fue sin lugar a dudas el lanzamiento de su microaquitectura Core, la cual representa un salto cualitativo y cuantitativo en lo que respecta a eficiencia y rendimiento, y que dejo atrás una microarquitectura que fue superada por su eterno contendor AMD, sin duda Core fue un gran salto desde Netburst, esta ultima superada por AMD y sus primeros procesadores con computo de 64bit los Athlon 64, sin embargo la moneda da muchas vuelta y tal como Intel en su momento gozo de fama con sus Pentium 4, luego fue el turno de AMD con sus A64, pero la moneda volvió mostrar "Cara" para Intel con Core... e Intel quiere mantener este lado de la moneda es por eso que Core representa sin lugar a dudas el primero de 3 grandes pasos que ha anunciado Intel para dominar el mercado de aquí en adelante, todo se basa en reducir el proceso de fabricación e incrementar aun mas el nivel de performance como así también el nivel de eficiencia en futuros microprocesadores, pero para lograr esto se necesitan nuevos ingredientes como IMC, nuevo sistema de intercomunicación para eL procesador, la virtualizacion de cores del procesador a través de un remozado tipo de HyperThreading, además de nuevos procesos de fabricación mas reducidos y eficientes y la inclusión de mas memoria cache en el procesador entre otras importantes mejoras que detallaremos en el desarrollo de este articulo.
En la siguiente imagen vemos el roadmap en cuanto a futuras microarquitectuas de Intel, aunque son datos conocidos desde hace tiempo sirve para refrescar la memoria al respecto.

Como vemos luego de la actual microarquitectura Core, Intel tiene programado al paso a Nehalem, pero antes de eso hay un paso previo importante que se llama Penrym, luego de eso vendrá la nueva microarquitectura Nehalem (45nm) luego de ella un derivado de Nehalem a 32nm llamado Westmere (siguiendo el mismo procedimiento de Penrym, en cuanto es una derivación optimizada de la microarquitectura y no una nueva propiamente tal), finalmente el ultimo gran salto será la microarquitectura Gesher sucesora de Nehalem, pero cuya principal carta de presentacion será un proceso de 32nm, esto cambios de microarquitecturas se dan cada 2 años tal como se indica en el recorte de diapositiva... un plazo bastante corto pero que encierra lanzamiento de microarquitectura nueva y optimización de esta misma antes de pasar a la siguiente.
Penryn, el ultimo suspiro de Core:
Si no te acuerdas de Penryn, bueno será que leas esta nota al respecto, de todas maneras Penryn será o es el primer procesador de Intel fabricado a 45nm, aunque no de manera nativa, pues será un refresh y Die Shrink de Core 2 Duo (Específicamente de Merom), y será el entremés antes de mudar de Core a la siguiente microarquitectura (Nehalem), por lo tanto, Penryn como dijimos será un refresh, aunque con un cambio en sus entrañas y transistores llamado técnicamente Hi-K process Technology, que deberían traducirse a groso modo en alto rendimiento y mas eficiencia en los consumos de energía, disipación térmica y desde luego nivel de overclock, aunque por ahora en la teoría, pero con lo que ya ha mostrado Core, no es descabellado afirmar que así será, pues Penryn ya ha sido probado en los laboratorios de Intel en varios sistemas operativos con óptimos resultados. Los 45nm también servirán para que Intel meta cerca de 820 millones de transistores en Penryn.
Penryn al igual que Conroe tendrá su familia de procesadores, estos verán la luz con una versión "mobile", la correspondiente versión Desktop Dual Core (Wolfdale), la versión Quad Core (Yorkfield), la versión para servidores Xeon (Wolfdale-DP) y la variante Quad Core Harpertown. La producción en masa de Penrym se espera para la segunda mitad de este año, pues lo disponible actualmente son solo simples para testeo y pruebas internas, por lo tanto, en el primer trimestre del 2008 podríamos ver el anuncio de Penrym como producto listo para el mercado masivo.

En lo que ya es más técnico podemos mencionar que Penryn será seteado sobre los 3.0GHz, un incremento en la velocidad del FSB que llegará a los 1600Mhz, nuevas instrucciones SSE4 (Intel® Streaming SIMD Extensions 4) las cuales incluyen memoras para encoding y decoding de video, procesado de fotografías e imágenes además de mejorar el rendimiento en software que requieran alta performance, esto a través de lo que Intel denomina Unique Super Shuffle Engine, que es otro de los features (Características) destacadas por Intel en Penryn, este engine puede entregar rendimientos con un acho de 128bit en operaciones por segundo en un ciclo, todo esto redunda en una mejora de rendimiento en las instrucciones SSE2, SSE3 y SSE4 que sirven para esos propósitos, de esta manera Penryn tendrá un IPC (Instrucciones por Ciclo) mejor que Conroe. Otra de las cosas que podemos mencionar en Penryn es lo que Intel denomina Radix-16 un nuevo sistema de divisores, aunque me temo que no de memorias sino un divisor de instrucciones y comandos dentro del procesador que permitirá usar un acho de de 4bit por ciclo, comparado con los 2 bit por ciclo usados en Core.

La virtualizacion también se verá mejorada con Penryn, esta tecnología critica para la virtualizacion de sistemas es un elemento clave en entornos servidor, donde la ausencia o caída de un sistema físico puede significar una batahola que se subsana mediante sistemas virtuales y la forma como el procesador soporta esta tecnología es clave para los tiempos de respuesta, es por esto que Intel ha comunicado que el rendimiento o tiempos de su tecnología VT se vera incrementada entre un 25 y 75% en transiciones de maquinas virtuales, digamos en procesos de entrada y salida (entry/exit).

En lo que se refiere a la parte térmica de Penryn este incluirá un nuevo sistema de administración de energía mientras está en idle, este es DPD (Deep Power Down) tecnología que permitirá bajar los voltajes de los cores significativamente, además de desactivar el cache L1/L2, todo esto para brindar un mejor ahorro de energía cuando el procesador no es requerido para trabajos arduos, esto será ideal para equipos portátiles y también servidores. Otra de las cosas que traerá Penryn es la mejora de la tecnología Intel Enhanced Dynamic Acceleration (presente en los actuales C2D), que permite desactivar un core del procesador, mientras el otro trabaja con un incremento inmediato de frecuencia, esto para privilegiar y optimizar el trabajo en aplicaciones single-Threaded.

Según Intel los procesadores Quad Core basados en Penryn (Yorkfield) será un 45% mas rápidos que el actual Kentsfield en lo que se refiere a aplicaciones que hagan uso intensivo del ancho de banda, en el caso de la variante Desktop (Wolfdale) este será un 20% mas rápido que el actual Conroe pero en el apartado de videojuegos. Sin lugar a dudas cifras bastantes augurosas y que nos resultan familiar cuando se dieron a conocer estos mismos datos pero para Core.
En lo que respecta a la memoria Cache, Penryn también tendrá un ajuste en esta memoria interna del procesador, ya que de 4MB de Conroe, saltaremos a 6MB en los procesadores Dual Core y 12MB en los procesadores Quad Core que vengan con Penryn, la miniaturización que conlleva un proceso de 45nm, nos debería ayudar en este sentido para optimizar el espacio e introducir mas cache. El TDP en quizás lo que se mantenga con menos variación pues se mantendrán cifras cercanas a las actuales, es decir, 40, 65 y 80W para las versiones dual core y 50, 80 y 120W para las versiones Quad Core de Penryn.
A estas alturas de la madrugada no se si se me olvida algo, pero hemos revisado lo principal que ofrecerá Intel luego de Conroe, cambios que literariamente resultan interesantes y que nos dejan expectantes, siendo que ni siquiera representa una nueva microarquitectura, sino el paso y medio antes de llegar a Nehalem.
Nehalem
Ya comentamos que Penryn, si bien estará fabricado en 45nm y traerá mejoras a la arquitectura Core en la cual está basado, no será un cambio de micro-arquitectura propiamente tal, mas bien será la ultima remozada a Core (Conroe y CIA) antes de dar el segundo Gran Paso en el itinerario bianual de cambio de arquitectura y procesos de fabricación de Intel; este paso, como ya se ha mencionado antes, es la Microarquitectura Nehalem, la cual traerá una nueva familia de procesadores fabricados nativamente en 45nm, a diferencia de Penryn que es un Die Shrink o encogimiento a 45nm de Conroe (65nm) + mejoras.

En esta imagen que hemos visto ya en mas de una vez, queda claro el plan de Intel respecto a sus micro-arquitecturas, que tienen un periodo de Vigencia de 2 años, quedando 2006-2007 para Intel Core, 2008-2009 para Nehalem y 2010-2012 para Gesher, aunque como vimos en el articulo anterior esta presentación se ve complementada pues entre cada uno de los bienios donde Intel pretende mantener como producto principal sus arquitecturas tendremos el respectivo refresh de cada una de ellas.

En este recorte podemos apreciar las dos etapas de cada una de las micro-arquitecturas: introduccion y refresco, donde vemos que tanto Penryn como Westmere serán ajustes de tuerca de Core y Nehalem respectivamente... ahora solo queda revelar que cosa seguiria luego de Gesher para alcanzar los 22nm y cual será el paso previo... aunque claro esta que es demasiado pronto para hablar de eso; de hecho es mas que probable que mucho de lo que se hable hoy en dia de Nehalem y Gesher sean ideas y trazos preliminares a trabajar... el tiempo puede cambiar mucho las cosas de acuerdo a lo que vaya marcando el mercado y por supuesto su archicompetencia, AMD.
Nehalem: "The first dynamically scalable microarchitecture"
Hasta ahora pocos detalles se habían dado a conocer respecto a Nehalem, pues lo único que sabíamos es que era la arquitectura sucesora a Intel Core y que se basaba en un proceso de fabricación a 45nm, pero mucho mas de eso no sabíamos, aparte de las cosas deducibles como mejor relación de rendimiento y consumo. Los nuevos datos de esta microarquitectura apuntan a aspectos bastante interesantes y otros que resultaran un deja vu si miramos a uno de los elementos claves que introdujo AMD con sus A64.
Controlador de Memoria (IMC): Este es el deja vu al que me refería, por que Intel introducirá en algunos de sus procesadores basados en Nehalem, nada menos que un controlador de memoria integrado en el propio procesador, sin lugar a dudas, esto nos trae de inmediato a la memoria lo acaecido en el 2003 cuando AMD hizo este cambio en la micro-arquitectura de sus procesadores A64 y Opteron, pues el controlador de memoria se incluyo en el propio procesador, en lugar de dejarle esta tarea al chipset de la placa madre, esto se hizo con el fin de mejorar latencias entre la comunicación del procesador con la memoria, pues con un IMC en el procesador se evita el tener que pasar desde propio procesador al northbridge de la placa y luego al sistema de memorias, lo que redunda en menores tiempos y/o latencias.
Sólo algunos de los procesadores basados en la microarquitectura Nehalem usaran un controlador de memoria integrado, marcando cierta diferencia con AMD que lo incorporó en todos sus procesadores. La incorporación de un IMC es algo que Intel ha obviado por años pero que inexorablemente será incorporado e implementado por la compañial. Uno de los primeros procesadores en hacer uso de un IMC en Intel, será Bloomfield (45nm Nehalem), el sucesor de Yorkfield (Derivado de Penryn 45nm). Este IMC será compatible con DDR3, lo que marcaría el paso también de DDR2 a la tercera generación de memoria DDR.
Simultaneous multi-threading: El viejo HyperThreading, uno de los elementos claves de Netburst y los P4 estará de vuelta con Nehalem, aunque tendrá algunos cambios, de partida no será HT a secas sino que se llamará SMT (Simultaneous Multi-Threading) contará con 2 vías (2-way) que permitirá administrar hasta 16 hilos (threads) de ejecución en un procesador de ocho cores, que es lo que permite Nehalem o en su defecto 8 hilos de ejecución en un procesador Quad core. Resulta algo contradictorio pues los procesadores multi-núcleos deberían suplir lo que se intentaba hace con el HT en procesadores single core de la compañía años atrás, pero la idea de tener mas hilos de ejecución es algo que para futuros sistemas de computo seduce bastante y si se pueden entre comillas tener mas hilos, habrá que ver como los sistemas y aplicaciones aprovechan estos canales adicionales para optimizar la performance, pues es sabido que cuando Intel incorporo el HT en sus P4, no todas las aplicaciones hacían uso o sabían aprovecharlo, pues todo o casi todo se programaba para un solo hilo de ejecución, actualmente la tendencia es aprovechar los procesadores dual o quad core para optimizar el rendimiento, veremos si este remozado HT logra hacer diferencia.
Procesadores de 8 Cores: Es una posibilidad que da esta "escalabilidad" de Nehalem, y más si es una arquitectura a 45nm, actualmente la compañía tiene sus Quad Core Kentsfield a 65nm, con los 45nm debiera ser en teoría más fácil poder incorporar mas cores en un solo procesador, solo bastaría un Quad Core monolítico a 45nm para poder hacer un Octo-Core no monolítico al incorporar 2 de estos primeros en un mismo sustrato, la idea suena genial, mas aun si cada uno de los hilos de ejecución de los cores se puede multiplicar por 2 con el Simultaneous multi-threading, llegando a un total de 16 hilos de ejecución en el mejor de los casos, el total de memoria cache por consiguiente también se incrementa en razón de numero de cores.
GPU Integrada en el procesador: La arquitectura Nehalem permitirá a Intel ofrecer procesadores polivalentes, es decir, procesadores que aparte de incluir núcleos para el proceso de cálculos en general, también permitirá incorporar una GPU en el propio procesador, esto será posible solo en algunos casos y no en todos los procesadores, pues Intel sabe que existen diversos sectores de mercado y ofrecerá soluciones acorde a las necesidades de cada uno de ellos, sin llegar a estratificar demasiado eso si con un sin fin de productos. La idea de incorporar un núcleo gráfico en el procesador, es algo que su rival AMD ya ha dejado ver con su proyecto AMD Fusión, del cual hablamos en el respectivo informe y es una tendencia que a través de la unificación pretende ahorrar costos, simplificar diseños y mejorar los consumos (al ahorrarse por ejemplo incorporar un IGP en la placa madre o usar una tarjeta gráfica discreta de conexión PCIE), es algo similar a lo que han hecho algunos fabricantes de chipset como ATI y NVIDIA al incorporar en un solo chip tanto Northbridge, Southbridge e IGP, aunque en el caso de un procesador resulta algo mas interesante de ver funcionar. El hecho de querer mejorar consumos de energía nos indica en todo caso que los rendimientos serán discretos al menos en la parte gráfica, pues mas poder requiere de mas energía, por lo tanto, los procesadores con GPU integrada bajo Nehalem será de gama media hacia abajo o bien productos ad-hoc para equipos portátiles como los notebooks, que podrán ahorrase algunos minutos de batería extra. En todo caso los productos High End serán para los más entusiastas.
CSI (Common System Interface): Una de las cosas que se piensa abolir con Nehalem, es sin lugar a dudas el famoso FSB (Fron-Side Bus), usado largamente por Intel, el cual pretende ser reemplazado por una tecnología de intercomunicación denominada CSI (Common System Interface) que a su vez será como la respuesta que Intel haga al HyperTransport que utiliza AMD. Este tipo de conexión pretende entregar un mayor ancho de banda que el FSB, lo que en sistemas multi-núcleo es una ventaja para administrar grandes caudales de información y no provocar cuellos de botella que limiten la performance o rendimiento general, sobre todo si consideramos que Nehalem puede escalar a procesadores de 8 cores como mencionamos más arriba en este articulo. El paso de FSB a otro sistema es algo que se esperaba de Intel desde el lanzamiento de Core, aunque sinceramente, hemos visto que por el momento Intel con un FSB de 1066Mhz no se ha complicado demasiado, es más, a mediados de este año lanzará la versión de 1333Mhz de FSB de Core 2 Duo. Pero como dijimos con Nehalem pretende dar dicho paso a un sistema como CSI.
Cahe de Alto nivel compartido: Intel tendrá en sus procesadores lo que ha denominado Multi-level shared cache, esto quiere decir que seguramente tanto la memoria cache de nivel 2 (L2) como la memoria Cache de nivel 3 (L3) serán memorias compartidas por cada uno de los núcleos del procesador, esto trae la ventaja de que se simplifica el diseño de la arquitectura interna del procesador, pero hay que ser cuidadosos en la forma en al que cada uno de los cores intenta acceder a la memoria para que no se produzcan conflictos en los accesos, quizás con un switch interno que administre las peticiones. Esto por que siempre será mas optimo que cada core tenga su propio cache y que acceda a el exclusivamente a que tener un solo Gran cache en que dos, cuatro o mas núcleos intenten acceder a el provocando, colas o latencias demasiado altas en los accesos, lo que provoca un contrasentido en la razón de ser del la memoria Cache de un procesador, la cual es ahorrarse tiempos al tener un cache externo o tratar de acceder a la memoria principal en tareas críticas.
¿Nuevos socket?: Sí, es más que seguro que con Nehalem Intel introduzca nuevos socket para sus procesadores, por que si todos estos cambios se concretan inevitablemente será necesario diseñar nuevos sistemas de conexión para el procesador e incrementar el numero de contactos en estos mismos, el solo hecho de incorporar un IMC en el procesador, hace que Intel necesite migrar del actual socket LGA775. Según lo que hemos informado antes serían preliminarmente 2 diseños: estos son el socket B (LGA1366) y el socket H (LGA715) para IMC y procesadores sin IMC respectivamente.
Arquitectura dinámica: Nehalem será una arquitectura que permitirá a Intel poder administrar de manera dinámica tanto los cores, hilos, memoria cache y la propia administración de energía, Intel publica en su sitio web escuetas líneas ("Dynamically managed cores, threads, cache, interfaces and power") que nos permiten deducir lo demás, esto sería un paso más para hacer de la arquitectura flexible y eficiente en los niveles de consumo.
Opinión: Es acaso Nehalem un deja vu de AMD?, esto al juzgar por el IMC, intentar implementar un sistema de comunicación para el procesador que compita con el HyperTransport de AMD, la idea de incorporar en ciertos modelos de procesadores una GPU, es solo para tener algo que decir frente a Fusión de AMD?, también será una vuelta al pasado el hecho de tener que revivir el HyperThreading? Lo cierto es que Intel demostró con Core una tecnología que le dio el liderato en rendimiento y performance que hoy ostenta y le da las preferencias entre los mas entusiastas y podemos confiar merced de los antecedentes, que Nehalem podría ser otro "Salto Adelante" más, tal como versa el slogan de la compañía. Por nuestra parte solo queda esperar a que llegue el 2008 y veamos los primeros resultados de Nehalem.