Vào ngày 12 tháng 6 năm 2023, Gensyn, một giao thức thị trường điện toán AGI dựa trên chuỗi khối, đã công bố hoàn thành vòng tài trợ Series A trị giá 43 triệu đô la, do a16z dẫn đầu, với sự tham gia của Eden Block, CoinFund, Galaxy và Phòng thí nghiệm giao thức.
Gensyn là loại dự án gì? Tại sao bạn có thể nhận được khoản đầu tư khổng lồ từ các VC hàng đầu? Tài Chính Vàng sẽ đưa bạn hiểu điều đó trong một bài viết.
a16z: Tại sao dẫn đầu khoản tài trợ Series A trị giá 43 triệu đô la của Gensyn
a16z đã đăng một bài viết giải thích lý do tại sao nó dẫn đầu vòng tài trợ Series A trị giá 43 triệu đô la của Gensyn. a16z nói rằng những tiến bộ gần đây của trí tuệ nhân tạo là không thể tin được và có khả năng cứu thế giới (xem báo cáo trước đây của Jinse Finance "bài viết dài của người sáng lập a16z: Tại sao AI sẽ cứu thế giới"). Nhưng việc xây dựng các hệ thống AI đòi hỏi phải triển khai sức mạnh tính toán lớn hơn nhiều để đào tạo và suy luận về các mô hình lớn nhất, mạnh nhất hiện nay. Điều đó có nghĩa là các công ty công nghệ lớn có lợi thế hơn các công ty khởi nghiệp trong cuộc đua khai thác giá trị từ trí tuệ nhân tạo, nhờ đặc quyền tiếp cận sức mạnh tính toán và quy mô kinh tế của các trung tâm dữ liệu lớn. Để cạnh tranh trên một sân chơi bình đẳng, các công ty khởi nghiệp cần có khả năng sử dụng sức mạnh tính toán khổng lồ của riêng họ một cách hợp lý.
Chuỗi khối, với tư cách là một loại máy tính mới, độc đáo ở chỗ các nhà phát triển có thể viết mã đưa ra những lời hứa chắc chắn về cách mã sẽ hoạt động trong tương lai. Thành phần không được phép này của chuỗi khối có thể tạo ra thị trường cho người mua và người bán sức mạnh tính toán — hoặc bất kỳ loại tài nguyên kỹ thuật số nào khác như dữ liệu hoặc thuật toán — để giao dịch trên toàn cầu mà không cần trung gian.
**Gensyn, một giao thức thị trường điện toán AGI dựa trên chuỗi khối, kết nối các nhà phát triển (bất kỳ ai có thể đào tạo các mô hình máy học) với các bộ giải (Solver, bất kỳ ai muốn sử dụng máy của riêng họ để đào tạo các mô hình máy học). Gensyn có thể tăng sức mạnh tính toán khả dụng cho máy học lên 10-100 lần bằng cách tận dụng chuỗi dài các thiết bị máy tính có khả năng học máy không được sử dụng trên khắp thế giới như trung tâm dữ liệu nhỏ, PC chơi game, máy Mac M1 và M2 và thậm chí cả điện thoại thông minh. **
Các vấn đề đối mặt với AGI (Trí tuệ nhân tạo chung): Tập trung cao độ
Sau gần nửa năm phát triển, thị trường nhìn chung nhận ra rằng AGI là tương lai. Nhưng ngành AGI hiện có vẻ độc quyền cao**, giữa các quốc gia là cuộc chiến thương mại và nhân tài giữa Trung Quốc và Hoa Kỳ, và giữa các công ty là cuộc chơi của các công ty công nghệ lớn (Microsoft, Google, Meta). **Bởi vì ba tài nguyên chính của AGI (sức mạnh tính toán, kiến thức và dữ liệu) hiện đang được tập trung hóa cao độ. **
Sức mạnh tính toán: Các mô hình ngày càng lớn và phức tạp đòi hỏi bộ xử lý có khả năng tính toán cao để đào tạo. Giữa các quốc gia: Cuộc chiến chip giữa Trung Quốc và Hoa Kỳ, Hoa Kỳ đã tích cực ngăn chặn Trung Quốc có được chip công suất cao. Giữa các công ty: Không đủ năng lực sản xuất, các chip AI mới nhất của Nvidia đều được một số khách hàng lớn mua, còn các công ty khác hoàn toàn không mua được. Về mảng công nghệ: Một số công ty thậm chí còn tạo phần cứng chuyên dụng của riêng họ để học sâu, chẳng hạn như cụm TPU của Google. Những GPU tiêu chuẩn này hoạt động tốt hơn để học sâu và không phải để bán, chỉ để cho thuê.
Kiến thức: Nhiều đột phá công khai bắt nguồn từ các kiến trúc mô hình quy mô lớn mới do các nhà nghiên cứu phát triển, nhưng vẫn tồn tại một cuộc chiến về tài sản trí tuệ và tài năng cơ bản. Ví dụ: Hoa Kỳ thu hút hơn 50% tài năng AI của Trung Quốc và các công ty lớn sử dụng những tài năng này để phát triển các mô hình quy mô lớn đang ngày càng giảm khả năng tiếp cận công nghệ này; GPT-3.5 hoặc 4 của OpenAI được cung cấp công khai trên danh nghĩa, nhưng nó nằm sau một API và chỉ Microsoft mới có quyền truy cập vào mã nguồn của nó.
Dữ liệu: Mô hình học sâu AGI yêu cầu lượng dữ liệu lớn—cả được gắn nhãn và không gắn nhãn—và thường cải thiện khi có nhiều dữ liệu hơn. GPT-3 được đào tạo trên 300 tỷ từ. Dữ liệu được dán nhãn đặc biệt quan trọng và các bộ dữ liệu cần thiết để đào tạo AGI được tập trung trong tay một số công ty lớn. Ví dụ: một chút kiến thức hay: mỗi khi bạn truy cập một trang web giải quyết reCaptcha, bạn đang gắn nhãn dữ liệu đào tạo để cải thiện Google Maps.
Khó khăn trong tính toán AGI phi tập trung
Điện toán phi tập trung có thể tạo ra một cơ sở rẻ hơn và tự do hơn để nghiên cứu và phát triển trí tuệ nhân tạo. Nhưng có một vấn đề xác minh công việc trong AGI phi tập trung.Làm thế nào để bạn biết rằng bên thứ ba đã hoàn thành phép tính mà bạn yêu cầu?
Câu đố bằng chứng công việc có hai yếu tố: sự phụ thuộc vào trạng thái và chi phí tính toán cao.
Phụ thuộc trạng thái: Mỗi lớp trong mạng thần kinh được kết nối với tất cả các nút trong lớp trước nó. Điều này có nghĩa là nó cần trạng thái của lớp trước đó. Tệ hơn nữa, tất cả các trọng số của mỗi lớp đều được xác định bởi bước thời gian trước đó. Vì vậy, nếu bạn muốn xác minh rằng ai đó đã đào tạo một mô hình -- chẳng hạn, bằng cách chọn một điểm ngẫu nhiên trong mạng và xem liệu bạn có đạt được trạng thái tương tự hay không -- bạn cần tiếp tục đào tạo mô hình cho đến thời điểm đó, điều này rất tốn kém về mặt tính toán.
Chi phí tính toán cao: Chi phí cho một buổi đào tạo GPT-3 duy nhất vào năm 2020 là khoảng 12 triệu USD, cao hơn 270 lần so với giá trị ước tính khoảng 43.000 USD cho khóa đào tạo GPT-2 vào năm 2019. Nhìn chung, độ phức tạp (kích thước) mô hình của các mạng thần kinh tốt nhất hiện nay tăng gấp đôi sau mỗi ba tháng. Chi phí xác thực, có thể từ các phụ thuộc trạng thái, có thể chấp nhận được nếu mạng nơ-ron rẻ hơn và/hoặc nếu quá trình đào tạo đại diện cho quy trình phát triển mô hình ít hơn.
Nếu bạn muốn đào tạo deep learning với chi phí thấp và kiểm soát phi tập trung, bạn cần một hệ thống quản lý xác thực liên quan đến trạng thái một cách đáng tin cậy trong khi chi phí thấp và thưởng cho những người đóng góp tính toán.
Cách Gensyn phân cấp điện toán AGI
Giao thức Gensyn hợp nhất tất cả máy tính trên thế giới thành một siêu cụm máy học toàn cầu sẵn sàng cho bất kỳ ai. Nó cho phép đào tạo mạng thần kinh không tin cậy ở quy mô rất lớn và chi phí thấp bằng cách kết hợp hai điều:
1. Hệ thống xác minh sáng tạo
Một hệ thống xác minh giải quyết hiệu quả vấn đề phụ thuộc trạng thái trong đào tạo mạng thần kinh ở quy mô tùy ý. Hệ thống kết hợp các điểm kiểm tra đào tạo mô hình với các kiểm tra xác suất kết thúc trên chuỗi. Nó thực hiện tất cả những điều này một cách không tin cậy với chi phí hoạt động có thể chia tỷ lệ tuyến tính theo kích thước mô hình (giữ cho chi phí xác thực không đổi).
Theo Gensyn Litepaper, Gensyn chủ yếu giải quyết vấn đề xác minh thông qua ba khái niệm: bằng chứng xác suất học tập (sử dụng siêu dữ liệu trong quy trình tối ưu hóa dựa trên độ dốc để tạo chứng chỉ cho công việc đã thực hiện và nhanh chóng xác minh nó thông qua việc sao chép các giai đoạn nhất định ), giao thức xác định chính xác dựa trên biểu đồ (sử dụng giao thức xác định chính xác dựa trên biểu đồ, đa hạt và thực thi đồng thuận của người đánh giá chéo để cho phép chạy lại công việc xác thực và so sánh tính nhất quán, và cuối cùng được xác nhận bởi chính chuỗi), kiểu Truebit trò chơi khuyến khích (sử dụng đặt cược và chặt chém để xây dựng trò chơi khuyến khích đảm bảo mỗi người chơi hợp lý về tài chính hành động trung thực và thực hiện các nhiệm vụ dự định của họ)
**Hệ thống chủ yếu bao gồm bốn thành phần tham gia chính: người đệ trình, người giải quyết, người xác minh và người tố giác. **Người gửi: người dùng cuối của hệ thống, người cung cấp nhiệm vụ cần tính toán và thanh toán cho đơn vị công việc đã hoàn thành; người giải quyết: bộ phận làm việc chính của hệ thống, thực hiện đào tạo mô hình và tạo bằng chứng để người xác minh xác minh; người xác minh : không xác định Quá trình đào tạo được liên kết với tính toán tuyến tính xác định, sao chép một phần bằng chứng của người giải và so sánh khoảng cách với ngưỡng dự kiến; người tố cáo: tuyến phòng thủ cuối cùng, kiểm tra công việc của người xác minh và thách thức một giải độc đắc.
2. Nguồn cung cấp mới
Tận dụng các tài nguyên thiết bị máy tính chưa được sử dụng và sử dụng không đúng mức/không được tối ưu hóa. Các thiết bị này bao gồm từ GPU chơi game hiện chưa được sử dụng đến công cụ khai thác GPU từ thời kỳ tiền Ethereum PoW. Và tính phi tập trung của giao thức có nghĩa là nó cuối cùng sẽ được quản lý bởi đa số cộng đồng và không thể bị "đóng cửa" nếu không có sự đồng ý của cộng đồng; không giống như đối tác web2 của nó, điều này làm cho nó chống lại sự kiểm duyệt.
Quy mô + chi phí thấp: Giao thức Gensyn cung cấp chi phí tương tự như GPU thuộc sở hữu của trung tâm dữ liệu, có thể mở rộng ra ngoài AWS
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
a16z dẫn đầu khoản đầu tư 43 triệu đô la vào Gensyn, một thị trường điện toán AGI, để hiểu Gensyn
Vào ngày 12 tháng 6 năm 2023, Gensyn, một giao thức thị trường điện toán AGI dựa trên chuỗi khối, đã công bố hoàn thành vòng tài trợ Series A trị giá 43 triệu đô la, do a16z dẫn đầu, với sự tham gia của Eden Block, CoinFund, Galaxy và Phòng thí nghiệm giao thức.
Gensyn là loại dự án gì? Tại sao bạn có thể nhận được khoản đầu tư khổng lồ từ các VC hàng đầu? Tài Chính Vàng sẽ đưa bạn hiểu điều đó trong một bài viết.
a16z: Tại sao dẫn đầu khoản tài trợ Series A trị giá 43 triệu đô la của Gensyn
a16z đã đăng một bài viết giải thích lý do tại sao nó dẫn đầu vòng tài trợ Series A trị giá 43 triệu đô la của Gensyn. a16z nói rằng những tiến bộ gần đây của trí tuệ nhân tạo là không thể tin được và có khả năng cứu thế giới (xem báo cáo trước đây của Jinse Finance "bài viết dài của người sáng lập a16z: Tại sao AI sẽ cứu thế giới"). Nhưng việc xây dựng các hệ thống AI đòi hỏi phải triển khai sức mạnh tính toán lớn hơn nhiều để đào tạo và suy luận về các mô hình lớn nhất, mạnh nhất hiện nay. Điều đó có nghĩa là các công ty công nghệ lớn có lợi thế hơn các công ty khởi nghiệp trong cuộc đua khai thác giá trị từ trí tuệ nhân tạo, nhờ đặc quyền tiếp cận sức mạnh tính toán và quy mô kinh tế của các trung tâm dữ liệu lớn. Để cạnh tranh trên một sân chơi bình đẳng, các công ty khởi nghiệp cần có khả năng sử dụng sức mạnh tính toán khổng lồ của riêng họ một cách hợp lý.
Chuỗi khối, với tư cách là một loại máy tính mới, độc đáo ở chỗ các nhà phát triển có thể viết mã đưa ra những lời hứa chắc chắn về cách mã sẽ hoạt động trong tương lai. Thành phần không được phép này của chuỗi khối có thể tạo ra thị trường cho người mua và người bán sức mạnh tính toán — hoặc bất kỳ loại tài nguyên kỹ thuật số nào khác như dữ liệu hoặc thuật toán — để giao dịch trên toàn cầu mà không cần trung gian.
**Gensyn, một giao thức thị trường điện toán AGI dựa trên chuỗi khối, kết nối các nhà phát triển (bất kỳ ai có thể đào tạo các mô hình máy học) với các bộ giải (Solver, bất kỳ ai muốn sử dụng máy của riêng họ để đào tạo các mô hình máy học). Gensyn có thể tăng sức mạnh tính toán khả dụng cho máy học lên 10-100 lần bằng cách tận dụng chuỗi dài các thiết bị máy tính có khả năng học máy không được sử dụng trên khắp thế giới như trung tâm dữ liệu nhỏ, PC chơi game, máy Mac M1 và M2 và thậm chí cả điện thoại thông minh. **
Các vấn đề đối mặt với AGI (Trí tuệ nhân tạo chung): Tập trung cao độ
Sau gần nửa năm phát triển, thị trường nhìn chung nhận ra rằng AGI là tương lai. Nhưng ngành AGI hiện có vẻ độc quyền cao**, giữa các quốc gia là cuộc chiến thương mại và nhân tài giữa Trung Quốc và Hoa Kỳ, và giữa các công ty là cuộc chơi của các công ty công nghệ lớn (Microsoft, Google, Meta). **Bởi vì ba tài nguyên chính của AGI (sức mạnh tính toán, kiến thức và dữ liệu) hiện đang được tập trung hóa cao độ. **
Sức mạnh tính toán: Các mô hình ngày càng lớn và phức tạp đòi hỏi bộ xử lý có khả năng tính toán cao để đào tạo. Giữa các quốc gia: Cuộc chiến chip giữa Trung Quốc và Hoa Kỳ, Hoa Kỳ đã tích cực ngăn chặn Trung Quốc có được chip công suất cao. Giữa các công ty: Không đủ năng lực sản xuất, các chip AI mới nhất của Nvidia đều được một số khách hàng lớn mua, còn các công ty khác hoàn toàn không mua được. Về mảng công nghệ: Một số công ty thậm chí còn tạo phần cứng chuyên dụng của riêng họ để học sâu, chẳng hạn như cụm TPU của Google. Những GPU tiêu chuẩn này hoạt động tốt hơn để học sâu và không phải để bán, chỉ để cho thuê.
Kiến thức: Nhiều đột phá công khai bắt nguồn từ các kiến trúc mô hình quy mô lớn mới do các nhà nghiên cứu phát triển, nhưng vẫn tồn tại một cuộc chiến về tài sản trí tuệ và tài năng cơ bản. Ví dụ: Hoa Kỳ thu hút hơn 50% tài năng AI của Trung Quốc và các công ty lớn sử dụng những tài năng này để phát triển các mô hình quy mô lớn đang ngày càng giảm khả năng tiếp cận công nghệ này; GPT-3.5 hoặc 4 của OpenAI được cung cấp công khai trên danh nghĩa, nhưng nó nằm sau một API và chỉ Microsoft mới có quyền truy cập vào mã nguồn của nó.
Dữ liệu: Mô hình học sâu AGI yêu cầu lượng dữ liệu lớn—cả được gắn nhãn và không gắn nhãn—và thường cải thiện khi có nhiều dữ liệu hơn. GPT-3 được đào tạo trên 300 tỷ từ. Dữ liệu được dán nhãn đặc biệt quan trọng và các bộ dữ liệu cần thiết để đào tạo AGI được tập trung trong tay một số công ty lớn. Ví dụ: một chút kiến thức hay: mỗi khi bạn truy cập một trang web giải quyết reCaptcha, bạn đang gắn nhãn dữ liệu đào tạo để cải thiện Google Maps.
Khó khăn trong tính toán AGI phi tập trung
Điện toán phi tập trung có thể tạo ra một cơ sở rẻ hơn và tự do hơn để nghiên cứu và phát triển trí tuệ nhân tạo. Nhưng có một vấn đề xác minh công việc trong AGI phi tập trung.Làm thế nào để bạn biết rằng bên thứ ba đã hoàn thành phép tính mà bạn yêu cầu?
Câu đố bằng chứng công việc có hai yếu tố: sự phụ thuộc vào trạng thái và chi phí tính toán cao.
Phụ thuộc trạng thái: Mỗi lớp trong mạng thần kinh được kết nối với tất cả các nút trong lớp trước nó. Điều này có nghĩa là nó cần trạng thái của lớp trước đó. Tệ hơn nữa, tất cả các trọng số của mỗi lớp đều được xác định bởi bước thời gian trước đó. Vì vậy, nếu bạn muốn xác minh rằng ai đó đã đào tạo một mô hình -- chẳng hạn, bằng cách chọn một điểm ngẫu nhiên trong mạng và xem liệu bạn có đạt được trạng thái tương tự hay không -- bạn cần tiếp tục đào tạo mô hình cho đến thời điểm đó, điều này rất tốn kém về mặt tính toán.
Chi phí tính toán cao: Chi phí cho một buổi đào tạo GPT-3 duy nhất vào năm 2020 là khoảng 12 triệu USD, cao hơn 270 lần so với giá trị ước tính khoảng 43.000 USD cho khóa đào tạo GPT-2 vào năm 2019. Nhìn chung, độ phức tạp (kích thước) mô hình của các mạng thần kinh tốt nhất hiện nay tăng gấp đôi sau mỗi ba tháng. Chi phí xác thực, có thể từ các phụ thuộc trạng thái, có thể chấp nhận được nếu mạng nơ-ron rẻ hơn và/hoặc nếu quá trình đào tạo đại diện cho quy trình phát triển mô hình ít hơn.
Nếu bạn muốn đào tạo deep learning với chi phí thấp và kiểm soát phi tập trung, bạn cần một hệ thống quản lý xác thực liên quan đến trạng thái một cách đáng tin cậy trong khi chi phí thấp và thưởng cho những người đóng góp tính toán.
Cách Gensyn phân cấp điện toán AGI
Giao thức Gensyn hợp nhất tất cả máy tính trên thế giới thành một siêu cụm máy học toàn cầu sẵn sàng cho bất kỳ ai. Nó cho phép đào tạo mạng thần kinh không tin cậy ở quy mô rất lớn và chi phí thấp bằng cách kết hợp hai điều:
1. Hệ thống xác minh sáng tạo
Một hệ thống xác minh giải quyết hiệu quả vấn đề phụ thuộc trạng thái trong đào tạo mạng thần kinh ở quy mô tùy ý. Hệ thống kết hợp các điểm kiểm tra đào tạo mô hình với các kiểm tra xác suất kết thúc trên chuỗi. Nó thực hiện tất cả những điều này một cách không tin cậy với chi phí hoạt động có thể chia tỷ lệ tuyến tính theo kích thước mô hình (giữ cho chi phí xác thực không đổi).
Theo Gensyn Litepaper, Gensyn chủ yếu giải quyết vấn đề xác minh thông qua ba khái niệm: bằng chứng xác suất học tập (sử dụng siêu dữ liệu trong quy trình tối ưu hóa dựa trên độ dốc để tạo chứng chỉ cho công việc đã thực hiện và nhanh chóng xác minh nó thông qua việc sao chép các giai đoạn nhất định ), giao thức xác định chính xác dựa trên biểu đồ (sử dụng giao thức xác định chính xác dựa trên biểu đồ, đa hạt và thực thi đồng thuận của người đánh giá chéo để cho phép chạy lại công việc xác thực và so sánh tính nhất quán, và cuối cùng được xác nhận bởi chính chuỗi), kiểu Truebit trò chơi khuyến khích (sử dụng đặt cược và chặt chém để xây dựng trò chơi khuyến khích đảm bảo mỗi người chơi hợp lý về tài chính hành động trung thực và thực hiện các nhiệm vụ dự định của họ)
**Hệ thống chủ yếu bao gồm bốn thành phần tham gia chính: người đệ trình, người giải quyết, người xác minh và người tố giác. **Người gửi: người dùng cuối của hệ thống, người cung cấp nhiệm vụ cần tính toán và thanh toán cho đơn vị công việc đã hoàn thành; người giải quyết: bộ phận làm việc chính của hệ thống, thực hiện đào tạo mô hình và tạo bằng chứng để người xác minh xác minh; người xác minh : không xác định Quá trình đào tạo được liên kết với tính toán tuyến tính xác định, sao chép một phần bằng chứng của người giải và so sánh khoảng cách với ngưỡng dự kiến; người tố cáo: tuyến phòng thủ cuối cùng, kiểm tra công việc của người xác minh và thách thức một giải độc đắc.
2. Nguồn cung cấp mới
Tận dụng các tài nguyên thiết bị máy tính chưa được sử dụng và sử dụng không đúng mức/không được tối ưu hóa. Các thiết bị này bao gồm từ GPU chơi game hiện chưa được sử dụng đến công cụ khai thác GPU từ thời kỳ tiền Ethereum PoW. Và tính phi tập trung của giao thức có nghĩa là nó cuối cùng sẽ được quản lý bởi đa số cộng đồng và không thể bị "đóng cửa" nếu không có sự đồng ý của cộng đồng; không giống như đối tác web2 của nó, điều này làm cho nó chống lại sự kiểm duyệt.
Quy mô + chi phí thấp: Giao thức Gensyn cung cấp chi phí tương tự như GPU thuộc sở hữu của trung tâm dữ liệu, có thể mở rộng ra ngoài AWS