Giúp Google tiến tới mốc 4 nghìn tỷ với TPU, làm thế nào để tỏa sáng trong lĩnh vực blockchain?

PANews

2025-12-03 09:39:39

BTC1,99%

ETH3,59%

ZK1,04%

STRK3,37%

Tác giả: Eli5DeFi

Biên dịch: Tim, PANews

Biên tập bởi PANews: Ngày 25/11, tổng giá trị thị trường của Google đạt mức cao kỷ lục lịch sử, lên tới 3,96 nghìn tỷ USD, thúc đẩy giá cổ phiếu tăng mạnh nhờ các yếu tố như AI Gemini 3 vừa ra mắt mạnh mẽ nhất, cùng với chip tự nghiên cứu TPU của hãng. Ngoài lĩnh vực AI, TPU cũng sẽ phát huy vai trò lớn trong blockchain.

Câu chuyện phần cứng trong tính toán hiện đại về cơ bản được định nghĩa bởi sự trỗi dậy của GPU.

Từ game đến deep learning, kiến trúc song song của Nvidia đã trở thành tiêu chuẩn được công nhận trong ngành, khiến CPU dần chuyển hướng sang vai trò phụ trợ.

Tuy nhiên, khi mô hình AI gặp phải ngưỡng mở rộng, công nghệ blockchain tiến tới ứng dụng mật mã học phức tạp, đối thủ mới là bộ xử lý tensor (TPU) đã xuất hiện.

Dù TPU thường được bàn luận dưới góc nhìn chiến lược AI của Google, nhưng kiến trúc của nó lại tình cờ phù hợp với nhu cầu cốt lõi của mật mã học hậu lượng tử – cột mốc tiếp theo của công nghệ blockchain.

Bài viết này thông qua việc điểm lại quá trình tiến hóa phần cứng, so sánh đặc điểm kiến trúc, nhằm giải thích vì sao khi xây dựng mạng lưới phi tập trung chống lại tấn công lượng tử, TPU (không phải GPU) lại phù hợp hơn cho các phép toán toán học chuyên sâu mà mật mã học hậu lượng tử yêu cầu.

Tiến hóa phần cứng: Từ xử lý nối tiếp đến kiến trúc sóng mạch

Để hiểu được tầm quan trọng của TPU, cần biết vấn đề mà nó giải quyết.

Bộ xử lý trung tâm (CPU): Là “người chơi đa năng”, giỏi xử lý nối tiếp và nhánh logic, nhưng hạn chế khi cần thực hiện đồng thời lượng lớn phép toán.
Bộ xử lý đồ họa (GPU): Chuyên gia xử lý song song, ban đầu thiết kế để render pixel, rất mạnh khi thực hiện số lượng lớn tác vụ giống nhau cùng lúc (SIMD: cùng lệnh, nhiều dữ liệu). Đặc điểm này khiến GPU trở thành trụ cột của AI thời kỳ đầu.
Bộ xử lý tensor (TPU): Chip chuyên biệt, Google thiết kế riêng cho tác vụ tính toán mạng thần kinh.

Ưu thế kiến trúc sóng mạch

Sự khác biệt cốt lõi giữa GPU và TPU nằm ở cách chúng xử lý dữ liệu.

GPU cần truy xuất bộ nhớ (thanh ghi, cache) nhiều lần để tính toán, trong khi TPU dùng kiến trúc sóng mạch (systolic array). Kiến trúc này giống như tim bơm máu, giúp dữ liệu luân chuyển đều đặn qua lưới các đơn vị tính toán quy mô lớn.

https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025

Kết quả tính toán được truyền trực tiếp sang đơn vị kế tiếp mà không cần ghi lại vào bộ nhớ. Thiết kế này giảm thiểu mạnh mẽ nút thắt Von Neumann, tức độ trễ do dữ liệu di chuyển giữa bộ nhớ và bộ xử lý nhiều lần, nhờ đó tăng băng thông phép toán lên cấp số nhân ở một số tác vụ toán học nhất định.

Chìa khóa hậu lượng tử: Vì sao blockchain cần TPU?

Ứng dụng quan trọng nhất của TPU trong blockchain không phải là đào coin, mà là bảo mật mật mã học.

Hệ thống blockchain hiện tại dựa vào mật mã đường cong elliptic hoặc hệ mã hóa RSA, nhưng lại có điểm yếu chí mạng trước thuật toán Shor. Điều này đồng nghĩa, khi máy tính lượng tử đủ mạnh xuất hiện, hacker có thể suy ra private key từ public key, đủ sức quét sạch toàn bộ tài sản mã hóa trên Bitcoin hoặc Ethereum.

Giải pháp là mật mã học hậu lượng tử. Các thuật toán PQC tiêu chuẩn chủ đạo hiện nay (như Kyber, Dilithium) đều xây dựng trên nền mật mã Lattice.

Tính phù hợp toán học của TPU

Đây chính là ưu thế của TPU so với GPU. Mật mã Lattice dựa rất nhiều vào các phép toán ma trận và vector quy mô lớn, chủ yếu gồm:

Nhân ma trận - vector: As+e (trong đó A là ma trận, s và e là vector).
Phép toán đa thức: Dựa trên đại số vòng, thường sử dụng biến đổi số học (NTT).

GPU coi các phép toán này là các tác vụ song song tổng quát, còn TPU thì tăng tốc trực tiếp nhờ các đơn vị tính toán ma trận ở tầng phần cứng. Cấu trúc toán học của mật mã Lattice gần như trùng khít với cấu trúc vật lý của mảng sóng mạch trên TPU.

Cuộc chiến công nghệ giữa TPU và GPU

Dù GPU vẫn là vua vạn năng trong ngành, nhưng khi xử lý các tác vụ toán học chuyên sâu, TPU sở hữu lợi thế tuyệt đối.

Kết luận: GPU mạnh về tính tổng quát và hệ sinh thái, còn TPU lại vượt trội về hiệu suất tính toán đại số tuyến tính chuyên sâu – vốn là lõi toán học mà AI và mật mã học hiện đại đều dựa vào.

Mở rộng câu chuyện TPU: Bằng chứng không kiến thức và AI phi tập trung

Ngoài mật mã hậu lượng tử, TPU còn thể hiện tiềm năng ứng dụng ở hai lĩnh vực then chốt khác của Web3.

Bằng chứng không kiến thức

ZK-Rollups (như Starknet hay zkSync) – giải pháp mở rộng Ethereum – yêu cầu thực hiện lượng lớn phép toán trong quy trình sinh bằng chứng, chủ yếu gồm:

Biến đổi Fourier nhanh (FFT): Chuyển đổi dạng biểu diễn dữ liệu.
Nhân vô hướng đa điểm: Tổng hợp các phép toán trên điểm đường cong elliptic.
Giao thức FRI: Hệ thống bằng chứng mật mã đa thức.

Các phép toán này không phải là tính toán hàm băm chuyên biệt của ASIC, mà là toán đa thức. So với CPU tổng quát, TPU có thể tăng tốc mạnh mẽ cho FFT và phép toán cam kết đa thức; do các thuật toán này có luồng dữ liệu dự đoán được, TPU thường tăng tốc hiệu quả hơn cả GPU.

Với sự xuất hiện của các mạng AI phi tập trung như Bittensor, các node mạng phải có khả năng thực thi suy luận mô hình AI. Thực thi mô hình ngôn ngữ lớn về bản chất là thực hiện hàng loạt phép nhân ma trận.

So với cụm GPU, TPU giúp node phi tập trung xử lý yêu cầu AI với tiêu thụ điện năng thấp hơn, từ đó nâng cao khả năng thương mại hóa AI phi tập trung.

Bản đồ hệ sinh thái TPU

Dù hiện tại hầu hết các dự án vẫn dựa vào GPU vì phổ biến của CUDA, nhưng các lĩnh vực sau đang tăng tốc tích hợp TPU, đặc biệt trong khung câu chuyện mật mã hậu lượng tử và bằng chứng không kiến thức.

Bằng chứng không kiến thức & Giải pháp mở rộng

Vì sao chọn TPU? Bởi sinh bằng chứng ZK yêu cầu xử lý song song quy mô lớn các phép toán đa thức, mà trong cấu hình kiến trúc nhất định, TPU hiệu quả vượt xa GPU tổng quát.

Starknet (giải pháp mở rộng lớp 2): Bằng chứng STARK dựa mạnh vào FFT và bằng chứng dự đoán tương tác Reed-Solomon, các phép toán này cực kỳ phù hợp với logic tính toán của TPU.
zksync (giải pháp mở rộng lớp 2): Trình tạo bằng chứng Airbender của nó cần xử lý FFT và phép toán đa thức quy mô lớn – đúng điểm nghẽn mà TPU có thể giải quyết.
Scroll (giải pháp mở rộng lớp 2): Áp dụng hệ thống bằng chứng Halo2 và Plonk, với phép toán cốt lõi là xác minh cam kết KZG và nhân vô hướng đa điểm – hoàn toàn phù hợp với kiến trúc sóng mạch TPU.
Aleo (blockchain bảo vệ quyền riêng tư): Tập trung vào sinh bằng chứng zk-SNARK, các phép toán đa thức cốt lõi trùng khớp với khả năng tính toán chuyên dụng của TPU.
Mina (blockchain nhẹ): Dùng công nghệ SNARKs đệ quy, liên tục sinh lại bằng chứng cần lặp lại phép toán đa thức, nhấn mạnh giá trị hiệu suất của TPU.
Zcash (coin riêng tư): Hệ bằng chứng Groth16 cổ điển dựa vào toán đa thức. Dù công nghệ cũ, nhưng phần cứng băng thông cao vẫn mang lại lợi ích rõ rệt.
Filecoin (DePIN, lưu trữ): Cơ chế Proof of Replication sử dụng bằng chứng không kiến thức và mã hóa đa thức để xác nhận tính hợp lệ dữ liệu lưu trữ.

AI phi tập trung & Tính toán đại lý

Vì sao chọn TPU? Đây chính là kịch bản ứng dụng nguyên bản của TPU, thiết kế để tăng tốc nhiệm vụ học máy mạng thần kinh.

Bittensor: Kiến trúc lõi là AI phi tập trung, hoàn toàn phù hợp với khả năng tính toán tensor của TPU.
Fetch (AI đại lý): Đại lý AI tự chủ cần liên tục suy luận mạng thần kinh để ra quyết định; TPU giúp chạy các mô hình này với độ trễ thấp hơn.
Singularity (nền tảng dịch vụ AI): Là sàn giao dịch dịch vụ AI, Singularity tích hợp TPU để tăng tốc và giảm chi phí thực thi mô hình.
NEAR (blockchain, chuyển hướng AI): Chuyển sang AI on-chain và môi trường thực thi đáng tin cậy, các phép toán tensor mà nó dựa vào cần TPU tăng tốc.

Mạng mật mã học hậu lượng tử

Vì sao chọn TPU? Mật mã hậu lượng tử cốt lõi thường liên quan đến bài toán vector ngắn nhất trên lưới (SVP), đòi hỏi nhiều phép toán ma trận và vector – gần như giống với workload AI về mặt kiến trúc phần cứng.

Algorand (blockchain): Ứng dụng hash và phép toán vector an toàn lượng tử, cực kỳ phù hợp với khả năng tính toán toán học song song của TPU.
QAN (blockchain chống lượng tử): Sử dụng mật mã Lattice, các phép toán đa thức, vector cốt lõi hoàn toàn tương đồng với tối ưu hóa toán học của TPU.
Nexus (nền tảng tính toán, ZkVM): Chuẩn bị cho tính toán chống lượng tử cần các thuật toán đa thức và Lattice, có thể ánh xạ hiệu quả lên kiến trúc TPU.
Cellframe (blockchain chống lượng tử): Sử dụng mật mã Lattice và công nghệ mã hóa hash kiểu tensor, giúp TPU phát huy tối đa khả năng tăng tốc.
Abelian (token riêng tư): Tập trung vào tính toán Lattice hậu lượng tử. Giống QAN, kiến trúc kỹ thuật của nó tận dụng tối đa thông lượng vector của TPU.
Quantus (blockchain): Chữ ký mật mã hậu lượng tử cần lượng lớn tính toán vector, TPU song song hóa các phép toán này vượt xa CPU tiêu chuẩn.
Pauli (nền tảng tính toán): Tính toán bảo mật lượng tử đòi hỏi ma trận quy mô lớn, đúng thế mạnh cốt lõi của kiến trúc TPU.

Nút thắt phát triển: Vì sao TPU chưa phổ biến rộng rãi?

Nếu TPU hiệu quả đến vậy trong mật mã hậu lượng tử và bằng chứng không kiến thức, tại sao ngành vẫn đổ xô mua chip H100?

Hào lũy CUDA: Thư viện phần mềm CUDA của Nvidia đã thành tiêu chuẩn ngành, hầu hết kỹ sư mật mã đều lập trình dựa trên CUDA. Di chuyển mã sang TPU (JAX hoặc XLA) không chỉ phức tạp kỹ thuật mà còn tốn nhiều tài nguyên.
Rào cản truy cập nền tảng đám mây: TPU cao cấp gần như bị Google Cloud độc quyền. Nếu mạng phi tập trung quá phụ thuộc vào một nhà cung cấp đám mây tập trung, sẽ đối mặt với rủi ro kiểm duyệt và sự cố điểm đơn lẻ.
Kiến trúc cứng nhắc: Nếu thuật toán mật mã cần tinh chỉnh (thêm nhánh logic), hiệu suất TPU sụt giảm mạnh, trong khi GPU lại xử lý tốt các logic phi tuần tự.
Hạn chế trong tính toán hash: TPU không thay thế được máy đào Bitcoin. SHA-256 là phép toán bit, không phải ma trận, và TPU không có giá trị trong lĩnh vực này.

Kết luận: Kiến trúc phân lớp mới là tương lai

Tương lai phần cứng Web3 không phải là cuộc chiến “kẻ thắng ăn cả”, mà đang tiến hóa theo hướng kiến trúc phân lớp.

GPU sẽ tiếp tục đảm nhận vai trò chính cho tính toán tổng quát, đồ họa và tác vụ cần logic nhánh phức tạp.

TPU (và các accelerator ASIC cùng loại) sẽ dần trở thành tiêu chuẩn tầng “toán học” của Web3, chuyên dụng cho sinh bằng chứng không kiến thức và xác nhận chữ ký mật mã hậu lượng tử.

Khi blockchain di chuyển sang tiêu chuẩn bảo mật hậu lượng tử, lượng lớn phép toán ma trận cần cho ký và xác minh giao dịch sẽ khiến kiến trúc sóng mạch của TPU không còn là lựa chọn tùy ý, mà trở thành hạ tầng bắt buộc để xây dựng mạng lưới phi tập trung bảo mật lượng tử có khả năng mở rộng.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận