Các tác nhân AI bước vào sân thử nghiệm

2025-08-12 03:39:00

Tóm tắt

Giám đốc điều hành của Recall Labs, Andrew Hill, thảo luận về thách thức trong việc xây dựng và tin tưởng vào các tác nhân AI, nhấn mạnh việc tạo ra một đấu trường onchain để xác minh hiệu suất công khai.

Điều gì đã truyền cảm hứng cho bạn để tạo ra Recall Network, và tại sao lại cấu trúc nó như một đấu trường trên chuỗi cho các tác nhân AI?

Internet đang chuyển từ thông tin sang hành động. Không chỉ tìm kiếm, mà còn giao phó. Các đại lý đã bắt đầu viết mã, quản lý danh mục đầu tư, tóm tắt nghiên cứu. Vấn đề không phải là sự sáng tạo. Đó là niềm tin. Ai cũng có thể tạo ra một đại lý. Ít người có thể chứng minh hiệu suất.

Recall được xây dựng để giải quyết điều đó — không phải như một sản phẩm, mà như cơ sở hạ tầng giao thức. Một mạng lưới trung lập đáng tin cậy nơi các đại lý chứng minh khả năng của họ một cách công khai và trên chuỗi. Các cuộc thi và đánh giá trở thành bằng chứng. Danh tiếng trở nên di động. Và việc khám phá không còn là một trò chơi đoán.

Chúng tôi không chỉ muốn có nhiều đại lý hơn. Chúng tôi muốn một hệ thống kết nối và khuyến khích trí tuệ nhân tạo giải quyết các vấn đề của nhân loại.

Vấn đề cốt lõi nào trong bối cảnh AI ngày nay mà bạn đang hướng tới giải quyết — và Recall giải quyết nó một cách độc đáo như thế nào?

Chúng tôi có quá nhiều đại lý và quá ít lòng tin. Nút thắt không phải là khả năng. Mà là việc đánh giá. Đại lý nào là thật? Đại lý nào chỉ là một lời nhắc và một trang đích? Hiện tại, các câu trả lời đến từ marketing và sự thổi phồng. Chúng tôi muốn chúng đến từ chứng minh.

Recall biến việc đánh giá thành một chức năng mạng sống động và phát triển. Các đại lý kiếm được uy tín bằng cách cạnh tranh. Các nhà tuyển chọn kiếm được token khi làm nổi bật hiệu suất. Người tiêu dùng theo dõi xếp hạng, không phải sự thổi phồng.

Trong một thế giới mà hầu hết các hệ thống AI hoạt động như những hộp đen, sự chuyển biến về tính minh bạch hoàn toàn và các chỉ số hiệu suất công khai có thực tế không?

Điều đó đã xảy ra. Sự chuyển đổi này được thúc đẩy bởi nhu cầu. Người dùng muốn biết một tác nhân có thể làm gì trước khi họ tích hợp nó. Người dùng thông minh muốn tham gia vào việc thử nghiệm và đánh giá giới hạn của họ. Những người xây dựng muốn có những chuẩn mực thực sự, không phải những so sánh mơ hồ.

Khi hồi tưởng, mọi hành động của đại lý đều được ghi lại. Mọi cuộc thi đều có thể phát lại. Các đánh giá có thể kết hợp và thay đổi. Chúng tôi mong đợi các hệ thống khác sẽ áp dụng tiêu chuẩn này theo thời gian vì nó hoạt động.

Làm thế nào để bạn ngăn chặn việc chơi game hoặc thao túng trong một hệ thống mà các đại lý được thưởng cho hiệu suất?

Bạn không thể ngăn chặn các nỗ lực, nhưng bạn có thể khiến chúng trở nên không có lợi - bằng cách sử dụng một token để hỗ trợ các đại lý trung thực và cắt giảm họ vì sự không trung thực. Việc chơi game và thao túng được phát hiện thông qua sự kết hợp của các hệ thống tự động và con người, cho phép con người loại bỏ những kẻ xấu. Chúng tôi đã thấy điều này diễn ra trong các cuộc thi trực tiếp của mình, nơi các người quản lý xác định các hành vi không trung thực và loại bỏ các đại lý khỏi bảng xếp hạng.

Những loại nhiệm vụ hoặc cuộc thi nào có ý nghĩa nhất để đánh giá các tác nhân AI ngày nay - và chúng phát triển như thế nào khi các mô hình trở nên thông minh hơn?

Các nhiệm vụ căng thẳng về lý luận, bối cảnh hoặc phán đoán thực tế là tín hiệu mạnh nhất trong các tác nhân trò chuyện. Đối với chúng tôi, hiện tại chúng tôi đang tập trung vào giao dịch vì có rất nhiều tác nhân cần đánh giá, rất nhiều điều cần hiểu về khả năng của AI trong việc quản lý danh mục đầu tư tiền điện tử, và rất nhiều sự không chắc chắn từ người tiêu dùng về việc liệu có tác nhân nào có thể giao dịch thành công. Đối với chúng tôi, giao dịch tiền điện tử dựa trên AI cho đám đông không phải là nếu mà là khi nào. Chúng tôi hy vọng sẽ đóng một vai trò lớn trong việc tăng tốc điều này thông qua việc đánh giá và các cuộc thi.

Bạn thấy vai trò của blockchain trong tương lai của AI như thế nào — lớp hạ tầng, lớp quản trị, lớp trách nhiệm?

Blockchain có thể hoạt động như cả ba lớp này. Các cuộc cạnh tranh diễn ra trên chuỗi, với các quy tắc quản trị cho các quy tắc tham gia và một sổ cái chung cho hành vi của các tác nhân. Blockchain mang đến cho chúng ta bộ nhớ công khai, lịch sử có thể xác minh và niềm tin lập trình.

Tuy nhiên, vai trò quan trọng nhất của nó là kinh tế. Nó cho phép chúng ta thưởng cho lớp người giữ cho AI trung thực.

Bạn có thấy các tác nhân onchain thay thế các mô hình SaaS truyền thống — hay bổ sung cho chúng?

Họ sẽ bắt đầu bằng cách bổ sung. Sau đó, vượt trội hơn. Cuối cùng, họ sẽ thay thế toàn bộ các danh mục.

Bạn nghĩ rằng các nguyên tắc tiền điện tử — như token, staking hoặc slashing — sẽ đóng vai trò gì trong việc quản lý hành vi AI quy mô lớn?

Token cho phép người sáng tạo trả tiền để có được sự chú ý. Chúng cho phép người quản lý kiếm tiền từ việc làm nổi bật giá trị. Chúng tạo ra những bản ghi bền vững về niềm tin. Staking liên kết niềm tin với chi phí. Slashing biến thất bại thành phản hồi.

Chúng ta nên nghĩ về khả năng tương tác giữa các hệ thống đại lý như thế nào - liệu các tiêu chuẩn sẽ xuất hiện hay vẫn bị phân tán?

Phân mảnh là mặc định. Tính tương tác xuất hiện khi việc cắm vào dễ hơn là xây dựng lại. A2A vẫn chưa được chứng minh nhiều như một giao thức để vượt qua các ranh giới tổ chức. Nhưng để sử dụng các tác nhân giữa các tổ chức, người tiêu dùng và doanh nghiệp cần những hệ thống như Recall để tạo ra các tiêu chuẩn đáng tin cậy và bảo mật cho người dùng.

Bạn thấy mối quan hệ giữa các mô hình nền tảng và các khung tác nhân sẽ phát triển như thế nào trong vài năm tới?

Các mô hình nền tảng sẽ tiếp tục cải thiện. Chúng tôi coi lớp tác nhân là tất cả những gì được xây dựng trên các mô hình thô; các tác nhân là các mô hình phần mềm mà là cơ sở dữ liệu. Giao diện mà chúng tôi sử dụng sẽ tiếp tục trừu tượng hóa nhiều hơn nữa các định tuyến và biến thể bên dưới. Grok 4 Heavy đã là một đàn tác nhân. Tin đồn cho rằng GPT-5 sẽ là một hệ thống định tuyến tiên tiến với nhiều mô hình và tác nhân được sử dụng để giải quyết các nhiệm vụ đúng đắn. Các hệ thống mở sẽ theo sau.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#Show My Alpha Points
113k Phổ biến
#ETH Breaks $4,600
21k Phổ biến
#CPI Data Coming
27k Phổ biến
#TOKEN OF LOVE IS BACK
25k Phổ biến
#Circle Launches ARC
3k Phổ biến

Ghim

sơ đồ trang web