Autor: Eli5DeFi
Traducción: Tim, PANews
Nota editorial de PANews: El 25 de noviembre, la capitalización bursátil de Google alcanzó un máximo histórico de 3,96 billones de dólares. Además del lanzamiento de su IA más potente, Gemini 3, otro factor que impulsó el precio de sus acciones es su chip propio, TPU. Más allá del campo de la IA, la TPU también mostrará su potencial en blockchain.
La narrativa del hardware de la computación moderna está definida fundamentalmente por el auge de la GPU.
Desde los videojuegos hasta el aprendizaje profundo, la arquitectura paralela de NVIDIA se ha convertido en el estándar de la industria, relegando a la CPU a un papel de coprocesador.
Sin embargo, a medida que los modelos de IA encuentran límites de escala y la tecnología blockchain avanza hacia aplicaciones criptográficas más complejas, un nuevo competidor ha aparecido: el procesador tensorial (TPU).
Aunque la TPU suele analizarse dentro de la estrategia de IA de Google, su arquitectura encaja sorprendentemente bien con los requisitos fundamentales de la próxima gran frontera tecnológica de blockchain: la criptografía post-cuántica.
Este artículo repasa la evolución del hardware y compara características de arquitectura para explicar por qué, a la hora de construir redes descentralizadas resistentes a ataques cuánticos, la TPU (y no la GPU) es más adecuada para los intensivos cálculos matemáticos que exige la criptografía post-cuántica.

Para entender la importancia de la TPU, primero hay que comprender qué problemas resuelve.

La diferencia fundamental entre GPU y TPU radica en cómo procesan los datos.
La GPU necesita recurrir repetidamente a la memoria (registros, cachés) para realizar los cálculos, mientras que la TPU utiliza una arquitectura en flujo. Esta arquitectura, similar al latido de un corazón, hace que los datos fluyan de manera rítmica a través de una red de unidades de cálculo a gran escala.

https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025
El resultado de cada cálculo se transmite directamente a la siguiente unidad de cálculo, sin necesidad de escribirlo de nuevo en la memoria. Este diseño alivia enormemente el cuello de botella de von Neumann, es decir, la latencia producida por el movimiento repetido de datos entre la memoria y el procesador, logrando así un aumento de varios órdenes de magnitud en el rendimiento para ciertos cálculos matemáticos.
La aplicación más relevante de la TPU en blockchain no es la minería, sino la seguridad criptográfica.

Los sistemas blockchain actuales dependen de la criptografía de curva elíptica o de RSA, ambos con debilidades fatales frente al algoritmo de Shor. Esto significa que, en cuanto existan ordenadores cuánticos lo suficientemente potentes, un atacante podría derivar la clave privada a partir de la clave pública, vaciando por completo todos los activos cifrados en Bitcoin o Ethereum.
La solución reside en la criptografía post-cuántica. Actualmente, los algoritmos estándar PQC más populares (como Kyber o Dilithium) están basados en criptografía de retículas (Lattice).
Aquí es donde la TPU aventaja a la GPU. La criptografía de retículas depende en gran medida de operaciones densas con grandes matrices y vectores, principalmente:
Las GPUs tradicionales tratan estos cálculos como tareas de procesamiento paralelo genéricas, mientras que la TPU acelera estos procesos con unidades de cálculo matricial implementadas directamente en el hardware. La estructura matemática de la criptografía de retículas encaja casi perfectamente con la estructura física de la matriz en flujo de la TPU.
Aunque la GPU sigue siendo la reina universal de la industria, la TPU tiene una ventaja absoluta en tareas específicas e intensivas en cálculos matemáticos.

Conclusión: la GPU gana en versatilidad y ecosistema, mientras que la TPU domina en eficiencia de cálculo algebraico lineal intensivo, que es precisamente el núcleo matemático de la IA y de la criptografía avanzada moderna.
Además de la criptografía post-cuántica, la TPU también muestra potencial en otras dos áreas clave de Web3.
Los ZK-Rollups (como Starknet o zkSync), que son soluciones de escalado para Ethereum, requieren una enorme cantidad de cálculos en el proceso de generación de pruebas, principalmente:
Este tipo de cálculos no son el fuerte de los ASIC dedicados al hash, sino de las matemáticas polinómicas. Frente a la CPU convencional, la TPU puede acelerar notablemente las FFT y los cálculos de compromisos polinómicos; y gracias a la naturaleza predecible del flujo de datos de estos algoritmos, la TPU suele superar en eficiencia incluso a la GPU.
Con el auge de redes de IA descentralizada como Bittensor, los nodos de la red deben ser capaces de ejecutar inferencias de modelos de IA. Ejecutar modelos de lenguaje generalizados implica ejecutar muchísimas multiplicaciones de matrices.
En comparación con los clústeres de GPU, la TPU permite que los nodos descentralizados procesen solicitudes de inferencia de IA con menor consumo energético, aumentando así la viabilidad comercial de la IA descentralizada.

Aunque la mayoría de los proyectos aún dependen de la GPU debido a la ubicuidad de CUDA, los siguientes campos están listos para integrar TPUs, especialmente bajo la narrativa de la criptografía post-cuántica y las pruebas de conocimiento cero.

¿Por qué elegir TPU? Porque la generación de pruebas ZK requiere procesar en paralelo grandes volúmenes de cálculos polinómicos, y en ciertas configuraciones de arquitectura, la TPU es mucho más eficiente que la GPU genérica para este tipo de tareas.
¿Por qué elegir TPU? Este es el caso de uso nativo de la TPU, diseñada específicamente para acelerar tareas de aprendizaje automático en redes neuronales.
¿Por qué elegir TPU? El núcleo de la criptografía post-cuántica suele implicar el problema del vector más corto en retículas, tareas que requieren operaciones intensivas de matrices y vectores, muy similares en requisitos arquitectónicos a las cargas de trabajo de IA.
Si la TPU es tan eficiente en criptografía post-cuántica y pruebas ZK, ¿por qué la industria sigue comprando chips H100?
El futuro del hardware de Web3 no será una batalla de ganador único, sino que evolucionará hacia una arquitectura por capas.
La GPU seguirá siendo la principal responsable del cómputo general, el renderizado gráfico y las tareas con lógica de ramificación compleja.
La TPU (y otros aceleradores similares tipo ASIC) se convertirán gradualmente en la configuración estándar de la “capa matemática” de Web3, dedicados a la generación de pruebas de conocimiento cero y a la verificación de firmas criptográficas post-cuánticas.
A medida que blockchain migre hacia estándares resistentes a lo cuántico, el enorme volumen de cálculos matriciales requeridos para las firmas y verificaciones de transacciones hará que la arquitectura en flujo de la TPU deje de ser opcional para convertirse en infraestructura esencial para construir redes descentralizadas cuántico-seguras y escalables.