Tác giả: Eli5DeFi
Biên dịch: Tim, PANews
Biên tập bởi PANews: Ngày 25/11, tổng giá trị thị trường của Google đạt mức cao kỷ lục lịch sử, lên tới 3,96 nghìn tỷ USD, thúc đẩy giá cổ phiếu tăng mạnh nhờ các yếu tố như AI Gemini 3 vừa ra mắt mạnh mẽ nhất, cùng với chip tự nghiên cứu TPU của hãng. Ngoài lĩnh vực AI, TPU cũng sẽ phát huy vai trò lớn trong blockchain.
Câu chuyện phần cứng trong tính toán hiện đại về cơ bản được định nghĩa bởi sự trỗi dậy của GPU.
Từ game đến deep learning, kiến trúc song song của Nvidia đã trở thành tiêu chuẩn được công nhận trong ngành, khiến CPU dần chuyển hướng sang vai trò phụ trợ.
Tuy nhiên, khi mô hình AI gặp phải ngưỡng mở rộng, công nghệ blockchain tiến tới ứng dụng mật mã học phức tạp, đối thủ mới là bộ xử lý tensor (TPU) đã xuất hiện.
Dù TPU thường được bàn luận dưới góc nhìn chiến lược AI của Google, nhưng kiến trúc của nó lại tình cờ phù hợp với nhu cầu cốt lõi của mật mã học hậu lượng tử – cột mốc tiếp theo của công nghệ blockchain.
Bài viết này thông qua việc điểm lại quá trình tiến hóa phần cứng, so sánh đặc điểm kiến trúc, nhằm giải thích vì sao khi xây dựng mạng lưới phi tập trung chống lại tấn công lượng tử, TPU (không phải GPU) lại phù hợp hơn cho các phép toán toán học chuyên sâu mà mật mã học hậu lượng tử yêu cầu.

Để hiểu được tầm quan trọng của TPU, cần biết vấn đề mà nó giải quyết.

Sự khác biệt cốt lõi giữa GPU và TPU nằm ở cách chúng xử lý dữ liệu.
GPU cần truy xuất bộ nhớ (thanh ghi, cache) nhiều lần để tính toán, trong khi TPU dùng kiến trúc sóng mạch (systolic array). Kiến trúc này giống như tim bơm máu, giúp dữ liệu luân chuyển đều đặn qua lưới các đơn vị tính toán quy mô lớn.

https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025
Kết quả tính toán được truyền trực tiếp sang đơn vị kế tiếp mà không cần ghi lại vào bộ nhớ. Thiết kế này giảm thiểu mạnh mẽ nút thắt Von Neumann, tức độ trễ do dữ liệu di chuyển giữa bộ nhớ và bộ xử lý nhiều lần, nhờ đó tăng băng thông phép toán lên cấp số nhân ở một số tác vụ toán học nhất định.
Ứng dụng quan trọng nhất của TPU trong blockchain không phải là đào coin, mà là bảo mật mật mã học.

Hệ thống blockchain hiện tại dựa vào mật mã đường cong elliptic hoặc hệ mã hóa RSA, nhưng lại có điểm yếu chí mạng trước thuật toán Shor. Điều này đồng nghĩa, khi máy tính lượng tử đủ mạnh xuất hiện, hacker có thể suy ra private key từ public key, đủ sức quét sạch toàn bộ tài sản mã hóa trên Bitcoin hoặc Ethereum.
Giải pháp là mật mã học hậu lượng tử. Các thuật toán PQC tiêu chuẩn chủ đạo hiện nay (như Kyber, Dilithium) đều xây dựng trên nền mật mã Lattice.
Đây chính là ưu thế của TPU so với GPU. Mật mã Lattice dựa rất nhiều vào các phép toán ma trận và vector quy mô lớn, chủ yếu gồm:
GPU coi các phép toán này là các tác vụ song song tổng quát, còn TPU thì tăng tốc trực tiếp nhờ các đơn vị tính toán ma trận ở tầng phần cứng. Cấu trúc toán học của mật mã Lattice gần như trùng khít với cấu trúc vật lý của mảng sóng mạch trên TPU.
Dù GPU vẫn là vua vạn năng trong ngành, nhưng khi xử lý các tác vụ toán học chuyên sâu, TPU sở hữu lợi thế tuyệt đối.

Kết luận: GPU mạnh về tính tổng quát và hệ sinh thái, còn TPU lại vượt trội về hiệu suất tính toán đại số tuyến tính chuyên sâu – vốn là lõi toán học mà AI và mật mã học hiện đại đều dựa vào.
Ngoài mật mã hậu lượng tử, TPU còn thể hiện tiềm năng ứng dụng ở hai lĩnh vực then chốt khác của Web3.
ZK-Rollups (như Starknet hay zkSync) – giải pháp mở rộng Ethereum – yêu cầu thực hiện lượng lớn phép toán trong quy trình sinh bằng chứng, chủ yếu gồm:
Các phép toán này không phải là tính toán hàm băm chuyên biệt của ASIC, mà là toán đa thức. So với CPU tổng quát, TPU có thể tăng tốc mạnh mẽ cho FFT và phép toán cam kết đa thức; do các thuật toán này có luồng dữ liệu dự đoán được, TPU thường tăng tốc hiệu quả hơn cả GPU.
Với sự xuất hiện của các mạng AI phi tập trung như Bittensor, các node mạng phải có khả năng thực thi suy luận mô hình AI. Thực thi mô hình ngôn ngữ lớn về bản chất là thực hiện hàng loạt phép nhân ma trận.
So với cụm GPU, TPU giúp node phi tập trung xử lý yêu cầu AI với tiêu thụ điện năng thấp hơn, từ đó nâng cao khả năng thương mại hóa AI phi tập trung.

Dù hiện tại hầu hết các dự án vẫn dựa vào GPU vì phổ biến của CUDA, nhưng các lĩnh vực sau đang tăng tốc tích hợp TPU, đặc biệt trong khung câu chuyện mật mã hậu lượng tử và bằng chứng không kiến thức.

Vì sao chọn TPU? Bởi sinh bằng chứng ZK yêu cầu xử lý song song quy mô lớn các phép toán đa thức, mà trong cấu hình kiến trúc nhất định, TPU hiệu quả vượt xa GPU tổng quát.
Vì sao chọn TPU? Đây chính là kịch bản ứng dụng nguyên bản của TPU, thiết kế để tăng tốc nhiệm vụ học máy mạng thần kinh.
Vì sao chọn TPU? Mật mã hậu lượng tử cốt lõi thường liên quan đến bài toán vector ngắn nhất trên lưới (SVP), đòi hỏi nhiều phép toán ma trận và vector – gần như giống với workload AI về mặt kiến trúc phần cứng.
Nếu TPU hiệu quả đến vậy trong mật mã hậu lượng tử và bằng chứng không kiến thức, tại sao ngành vẫn đổ xô mua chip H100?
Tương lai phần cứng Web3 không phải là cuộc chiến “kẻ thắng ăn cả”, mà đang tiến hóa theo hướng kiến trúc phân lớp.
GPU sẽ tiếp tục đảm nhận vai trò chính cho tính toán tổng quát, đồ họa và tác vụ cần logic nhánh phức tạp.
TPU (và các accelerator ASIC cùng loại) sẽ dần trở thành tiêu chuẩn tầng “toán học” của Web3, chuyên dụng cho sinh bằng chứng không kiến thức và xác nhận chữ ký mật mã hậu lượng tử.
Khi blockchain di chuyển sang tiêu chuẩn bảo mật hậu lượng tử, lượng lớn phép toán ma trận cần cho ký và xác minh giao dịch sẽ khiến kiến trúc sóng mạch của TPU không còn là lựa chọn tùy ý, mà trở thành hạ tầng bắt buộc để xây dựng mạng lưới phi tập trung bảo mật lượng tử có khả năng mở rộng.