Gần đây, sự kết hợp giữa mô hình lớn và robot đã rất bắt mắt, từ "trí thông minh hiện thân" do nhóm Giáo sư Li Feifei của Đại học Stanford đề xuất cho đến "ánh sáng gia đình" của Yushu, Zhiyuan và các thương hiệu khác gần đây. Tại Hội nghị Robot Thế giới 2023 vài ngày trước, các robot hình người đã thực hiện nhiều kỹ năng khác nhau ngay tại chỗ, biến khoa học viễn tưởng thành hiện thực và nhiều công ty khác nhau đã chuyển các sản phẩm liên quan đến robot của họ đến hiện trường để thể hiện kỹ năng của họ. Thống kê sau đó cho thấy có 160 công ty robot trong và ngoài nước tham gia hội nghị và 600 robot, trong đó robot hình người là phổ biến nhất. Người sáng lập nổi tiếng của Boston Dynamics, Marc Raibert, và nhà chế tạo robot nổi tiếng người Nhật Hiroshi Ishiguro đã vượt hàng ngàn dặm để tham dự hội nghị.
Không còn nghi ngờ gì nữa, robot hình người đang trở thành một điểm nóng mới trên thị trường vốn. Trên thị trường sơ cấp, BV Baidu Ventures, Jingwei, Hillhouse, Gaorong, Zhenge, v.v ... đang tích cực nghiên cứu tuyến đầu. Các nhà đầu tư mạo hiểm từng nói về các mô hình lớn trong nửa đầu năm nay đang lo ngại về robot phổ thông. Trên thị trường thứ cấp, nguồn cung cấp ý tưởng robot hình người đã được quảng cáo rầm rộ trong nhiều làn sóng. Vào tháng 5, nhận xét của Musk đã trực tiếp dẫn đến làn sóng khái niệm robot A-share “Saimo Smart” tăng vọt đến mức giới hạn hàng ngày. “Fengli Smart” cũng tăng hơn 150% trong vòng sáu ngày giao dịch, và thậm chí còn thu hút sự chú ý của Thâm Quyến Sở giao dịch chứng khoán: Cần giải thích nguyên nhân và tính hợp lý của việc giá cổ phiếu tăng mạnh.
Đẩy Tesla
Tại cuộc họp cổ đông của Tesla năm nay, Musk cho biết: "Robot hình người Optimus đã tăng cường đáng kể khả năng kiểm soát chuyển động và lực cũng như nhận thức về môi trường và công nghệ này đang được lặp đi lặp lại nhanh chóng. Người ta ước tính rằng nhu cầu về robot trong thế giới tương lai có thể đạt tới 10 tỷ, thậm chí nhiều hơn. Nếu tỷ lệ giữa con người và robot được tính là 2:1 thì nhu cầu về robot hình người có thể lớn hơn nhiều so với xe điện.” Với vài lời này, sự tự tin của Musk Sự nhiệt tình và tận tâm đã nhanh chóng thắp lên ngọn lửa của đường đua robot hình người, và xu hướng này ngày càng gia tăng cho đến ngày nay. Ở góc độ ứng dụng thực tế, cũng có thể Tesla là người thúc đẩy sự trưởng thành và hoàn thiện của toàn bộ chuỗi công nghiệp.
Robot hình người Optimus của Tesla đã ra mắt lần đầu tiên tại sự kiện chính thức Ngày AI 2022 vào năm ngoái và đã hoàn thành các hành động tự động đi bộ, quay vòng, dừng lại, vẫy tay và các hành động khác ngay tại chỗ. Hầu hết các công nghệ của Optimus đều phù hợp với công nghệ của xe Tesla, chẳng hạn như thị giác máy và "bộ não" xử lý dữ liệu hình ảnh, đưa ra quyết định hành động, hỗ trợ giao tiếp và quan trọng nhất là phù hợp với xe Tesla Con chip cũng được trang bị máy tính FSD giống như xe Tesla và công nghệ mạng thần kinh liên quan đến Autopilot, dự kiến mức giá cuối cùng sẽ không vượt quá 20.000 đô la Mỹ, tương đương khoảng 144.000 nhân dân tệ.
** Từ góc độ công nghệ thực tế, các công ty như Tesla có lợi thế vốn có trong việc chế tạo robot, bởi vì nhiều nguyên tắc cơ bản của robot và AI giống nhau, và nó cũng có thể được coi là một phần mở rộng tự nhiên của xe điện. thế hệ robot bốn bánh đầu tiên**. Hai năm trước, khi Musk đề xuất chế tạo robot, ông đã vấp phải rất nhiều lời chế giễu rằng ông "kinh doanh không đàng hoàng". Tuy nhiên, vào đầu năm nay, tầm nhìn của Li Auto là trở thành công ty AI và robot tốt nhất, không phải là công ty xe điện lớn nhất thế giới. Có thể thấy giấc mơ cũng sẽ lan rộng.
Hướng dẫn mới cho robot
Robot hiện nay không phải là hiếm, chính khả năng khái quát hóa nhiệm vụ sẽ quyết định một robot hình người có thể đi được bao xa. Đây cũng là hướng mà nhiều công ty đang nỗ lực. Những "đèn nội địa" như Yushu và Zhiyuan đã được nhắc đến trước đây sẽ không được lặp lại ở đây. Có những công ty khởi nghiệp khác cũng rất đáng được quan tâm, chẳng hạn như Yuequan Bionics. Độ khéo léo của các sản phẩm robot của nó đã có thể so sánh được với điều đó của bàn tay con người. Bàn tay khéo léo thông minh sinh học giống con người do công ty phát triển độc lập có thể được điều chỉnh bằng chuyển động tích cực, uốn, lật và các hành động khác dưới sự can thiệp từ bên ngoài để giữ cho vật được giữ không bị rơi. Mô tả chính thức của nó là: "Ngoài các thao tác nắm, ấn và các hành động khác cơ bản, bạn còn có thể hoàn thành 27 thao tác tay phức tạp và tinh tế khác nhau, chẳng hạn như dùng đũa để nhặt vật nhỏ, thoa sản phẩm chăm sóc da, khuấy cà phê, vuốt điện thoại di động, Nút mở khóa, v.v." Bàn tay khéo léo áp dụng công nghệ truyền động của thân căng và nén, có mức độ tự do rất cao. Đồng thời, một cảm biến linh hoạt được tích hợp với phản hồi thần kinh xúc giác.
Ngoài ra, còn có robot hình người "Wukong-4" của nhóm robot của Trường Điều khiển, Đại học Chiết Giang. Theo báo cáo, "Wukong-4" có thể thích nghi với nhiều địa hình khác nhau như đường ngoài trời, đường cỏ, đường lầy lội , tốc độ tiến về phía trước nhanh nhất có thể đạt tới 6 km/h, cũng có thể nhảy cao 0,5 mét, đồng thời có thể vượt lên xuống dốc 25 độ và bậc thang cao 10 cm. Dưới những xáo trộn chưa xác định như mặt đường trơn trượt và nhiễu loạn lực đẩy bên ngoài, nó có thể nhanh chóng khôi phục lại thăng bằng và duy trì khả năng đi lại ổn định. "Wukong-4" hiện thực hóa việc xây dựng bản đồ môi trường ba chiều và điều hướng động tự động của robot bằng cách tích hợp công nghệ chuyển động chân-bàn chân và công nghệ nhận thức môi trường.
Đằng sau những robot mới này là một loạt công nghệ phần mềm và phần cứng được phát triển độc lập bởi các doanh nghiệp và trường đại học: thân robot hình người dựa trên bộ truyền động cảm nhận bản thân; các khớp mô-đun mật độ mô-men xoắn cao tự phát triển và thiết kế cấu trúc tích hợp; hợp kim cường độ cao, sợi carbon và vật liệu tiên tiến chẳng hạn như nhựa kỹ thuật giữ được vẻ ngoài đẹp mắt và cải thiện độ bền và độ ổn định của cấu trúc; kết hợp với mô hình ngôn ngữ lớn và thuật toán điều khiển lực tiên tiến, nó có hiệu suất động cao và có thể hiểu con người tốt hơn.
Từ sự theo đuổi của các nhà đầu tư, sự gia nhập của các công ty công nghệ hàng đầu, đến nghiên cứu đổi mới của các công ty khởi nghiệp và trường đại học, robot hình người đang phát triển theo nhiều hướng và mở ra một giai đoạn phát triển mới. Ví dụ, việc tích hợp một mô hình lớn và trang bị bộ não cho nó là một biến số kỹ thuật quan trọng khác thúc đẩy sự phát triển của robot hình người.
Như tôi đã nói trước đây, "trí thông minh thể hiện" là "một cơ thể thông minh có cơ thể thực tế và hỗ trợ tương tác vật lý", tương đương với việc thêm cơ thể vào AI, thuộc con đường phát triển mới dành cho robot đa năng. Vốn sẽ bổ sung thêm củi cho ngành này, sau 5 đến 10 năm đầu tư quy mô lớn sẽ đốt cháy mạnh mẽ hơn, cuối cùng hiện thực hóa việc thương mại hóa robot đa năng. ** Trong một thời gian dài trước đây, sự phát triển của robot chỉ giới hạn ở một loại công việc cụ thể, giống như AI, vốn từng bị giới hạn như vậy. Mô hình lớn đang dần được phát triển thành AGI và việc kết hợp với robot có thể mở rộng phạm vi ứng dụng của robot một cách tự nhiên. **
So với Trung Quốc, tiến độ ở nước ngoài nhanh hơn một bước và khả năng của mô hình lớn đã được nâng cấp từ ngôn ngữ lên lớp thực thi. Vào tháng 7, robot của nhóm Li Feifei có thể kéo ngăn kéo, mở nắp chai và cân táo. Robotics Transformer 2 (RT-2) do Google DeepMind ra mắt vào cuối tháng tiếp tục tiến hành nghiên cứu chuyên sâu theo hướng tương tự. RT-2 là mô hình Tầm nhìn + Ngôn ngữ + Hành động (VLA) hoàn toàn mới, có thể học từ dữ liệu mạng và robot, đồng thời chuyển kiến thức này thành các hướng dẫn chung để điều khiển robot. RT-2 thể hiện khả năng khái quát hóa tốt hơn, hiểu biết vượt ra ngoài các lĩnh vực ngữ nghĩa và hình ảnh của dữ liệu robot mà nó tiếp xúc, đồng thời có thể diễn giải các hướng dẫn mới và phản hồi các lệnh bằng cách thực hiện lý luận cơ bản.
Dứt khoát là một con đường gập ghềnh
Như người ta vẫn nói, “Lý tưởng thì đầy đủ, nhưng thực tế thì mỏng manh.” Trong khi robot và AI đang tăng tốc phát triển thì vẫn còn nhiều thách thức thực tế về kỹ thuật và thương mại. Người ta nói rằng lĩnh vực robot nói chung cũng cần những công nghệ hoặc sản phẩm như GPT-4 để kết hợp khả năng đa phương thức và thực sự thống nhất sự phát triển của trí tuệ hiện thân. Nhưng đây không phải là một nhiệm vụ dễ dàng, sự kết hợp giữa robot và các mô hình lớn được trình bày trong các bài báo hiện tại và một số bản demo vẫn tập trung vào việc giải quyết các vấn đề tương tác, nhưng điều đó không có nghĩa là robot có thể trở thành robot đa năng sau khi giải quyết các vấn đề tương tác. Từ góc độ phát triển của robot, mô hình lớn có đóng góp nhưng có tác động hạn chế đến việc kiểm soát và thực thi cơ bản. Hiện tại, cộng đồng học thuật áp dụng các phương pháp do AI điều khiển và thường hy vọng sử dụng phương pháp học tăng cường làm phương pháp triển khai kiểm soát cơ bản, nhưng điều này không có mối quan hệ trực tiếp với mô hình lớn và các phương pháp kiểm soát của học tăng cường chưa hoàn thiện, và hầu hết vẫn đang trong giai đoạn nghiên cứu học thuật. .
Một khó khăn khác nằm ở sự đồng phát triển của khả năng phần mềm và phần cứng. Mặc dù nhiều người tin rằng sự kết hợp giữa mô hình lớn và robot sẽ mang đến những cơ hội đột phá, Marc Raibert, người sáng lập Boston Dynamics, cho rằng kỹ thuật phần cứng và phần mềm đều quan trọng như nhau trong việc phát triển robot trong tương lai. "Một số người cho rằng phần mềm có thể khắc phục mọi vấn đề và hạn chế của phần cứng. Tôi không đồng ý với quan điểm này. Chỉ những nhà thiết kế phần cứng và nhà thiết kế phần mềm giỏi nhất mới làm việc cùng nhau để thiết kế ra những con robot tốt nhất thế giới."
Ngoài ra, tính bảo mật cần được cải thiện. “Ảo giác AI” của mô hình lớn có thể không có tác động đáng kể nhưng một khi đi vào cuộc sống, robot cần đảm bảo độ chính xác và an toàn, đây là những hướng công nghệ cần được cải tiến. Công nghệ, kịch bản, chi phí, an toàn, cơ hội và thách thức đang xuất hiện cùng lúc và robot hình người đang thực hiện một bước quan trọng hướng tới tương lai.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Mô hình lớn + robot hình người, liệu đây có phải là xu hướng tiếp theo?
Gần đây, sự kết hợp giữa mô hình lớn và robot đã rất bắt mắt, từ "trí thông minh hiện thân" do nhóm Giáo sư Li Feifei của Đại học Stanford đề xuất cho đến "ánh sáng gia đình" của Yushu, Zhiyuan và các thương hiệu khác gần đây. Tại Hội nghị Robot Thế giới 2023 vài ngày trước, các robot hình người đã thực hiện nhiều kỹ năng khác nhau ngay tại chỗ, biến khoa học viễn tưởng thành hiện thực và nhiều công ty khác nhau đã chuyển các sản phẩm liên quan đến robot của họ đến hiện trường để thể hiện kỹ năng của họ. Thống kê sau đó cho thấy có 160 công ty robot trong và ngoài nước tham gia hội nghị và 600 robot, trong đó robot hình người là phổ biến nhất. Người sáng lập nổi tiếng của Boston Dynamics, Marc Raibert, và nhà chế tạo robot nổi tiếng người Nhật Hiroshi Ishiguro đã vượt hàng ngàn dặm để tham dự hội nghị.
Không còn nghi ngờ gì nữa, robot hình người đang trở thành một điểm nóng mới trên thị trường vốn. Trên thị trường sơ cấp, BV Baidu Ventures, Jingwei, Hillhouse, Gaorong, Zhenge, v.v ... đang tích cực nghiên cứu tuyến đầu. Các nhà đầu tư mạo hiểm từng nói về các mô hình lớn trong nửa đầu năm nay đang lo ngại về robot phổ thông. Trên thị trường thứ cấp, nguồn cung cấp ý tưởng robot hình người đã được quảng cáo rầm rộ trong nhiều làn sóng. Vào tháng 5, nhận xét của Musk đã trực tiếp dẫn đến làn sóng khái niệm robot A-share “Saimo Smart” tăng vọt đến mức giới hạn hàng ngày. “Fengli Smart” cũng tăng hơn 150% trong vòng sáu ngày giao dịch, và thậm chí còn thu hút sự chú ý của Thâm Quyến Sở giao dịch chứng khoán: Cần giải thích nguyên nhân và tính hợp lý của việc giá cổ phiếu tăng mạnh.
Đẩy Tesla
Tại cuộc họp cổ đông của Tesla năm nay, Musk cho biết: "Robot hình người Optimus đã tăng cường đáng kể khả năng kiểm soát chuyển động và lực cũng như nhận thức về môi trường và công nghệ này đang được lặp đi lặp lại nhanh chóng. Người ta ước tính rằng nhu cầu về robot trong thế giới tương lai có thể đạt tới 10 tỷ, thậm chí nhiều hơn. Nếu tỷ lệ giữa con người và robot được tính là 2:1 thì nhu cầu về robot hình người có thể lớn hơn nhiều so với xe điện.” Với vài lời này, sự tự tin của Musk Sự nhiệt tình và tận tâm đã nhanh chóng thắp lên ngọn lửa của đường đua robot hình người, và xu hướng này ngày càng gia tăng cho đến ngày nay. Ở góc độ ứng dụng thực tế, cũng có thể Tesla là người thúc đẩy sự trưởng thành và hoàn thiện của toàn bộ chuỗi công nghiệp.
Robot hình người Optimus của Tesla đã ra mắt lần đầu tiên tại sự kiện chính thức Ngày AI 2022 vào năm ngoái và đã hoàn thành các hành động tự động đi bộ, quay vòng, dừng lại, vẫy tay và các hành động khác ngay tại chỗ. Hầu hết các công nghệ của Optimus đều phù hợp với công nghệ của xe Tesla, chẳng hạn như thị giác máy và "bộ não" xử lý dữ liệu hình ảnh, đưa ra quyết định hành động, hỗ trợ giao tiếp và quan trọng nhất là phù hợp với xe Tesla Con chip cũng được trang bị máy tính FSD giống như xe Tesla và công nghệ mạng thần kinh liên quan đến Autopilot, dự kiến mức giá cuối cùng sẽ không vượt quá 20.000 đô la Mỹ, tương đương khoảng 144.000 nhân dân tệ.
Hướng dẫn mới cho robot
Robot hiện nay không phải là hiếm, chính khả năng khái quát hóa nhiệm vụ sẽ quyết định một robot hình người có thể đi được bao xa. Đây cũng là hướng mà nhiều công ty đang nỗ lực. Những "đèn nội địa" như Yushu và Zhiyuan đã được nhắc đến trước đây sẽ không được lặp lại ở đây. Có những công ty khởi nghiệp khác cũng rất đáng được quan tâm, chẳng hạn như Yuequan Bionics. Độ khéo léo của các sản phẩm robot của nó đã có thể so sánh được với điều đó của bàn tay con người. Bàn tay khéo léo thông minh sinh học giống con người do công ty phát triển độc lập có thể được điều chỉnh bằng chuyển động tích cực, uốn, lật và các hành động khác dưới sự can thiệp từ bên ngoài để giữ cho vật được giữ không bị rơi. Mô tả chính thức của nó là: "Ngoài các thao tác nắm, ấn và các hành động khác cơ bản, bạn còn có thể hoàn thành 27 thao tác tay phức tạp và tinh tế khác nhau, chẳng hạn như dùng đũa để nhặt vật nhỏ, thoa sản phẩm chăm sóc da, khuấy cà phê, vuốt điện thoại di động, Nút mở khóa, v.v." Bàn tay khéo léo áp dụng công nghệ truyền động của thân căng và nén, có mức độ tự do rất cao. Đồng thời, một cảm biến linh hoạt được tích hợp với phản hồi thần kinh xúc giác.
Từ sự theo đuổi của các nhà đầu tư, sự gia nhập của các công ty công nghệ hàng đầu, đến nghiên cứu đổi mới của các công ty khởi nghiệp và trường đại học, robot hình người đang phát triển theo nhiều hướng và mở ra một giai đoạn phát triển mới. Ví dụ, việc tích hợp một mô hình lớn và trang bị bộ não cho nó là một biến số kỹ thuật quan trọng khác thúc đẩy sự phát triển của robot hình người.
Như tôi đã nói trước đây, "trí thông minh thể hiện" là "một cơ thể thông minh có cơ thể thực tế và hỗ trợ tương tác vật lý", tương đương với việc thêm cơ thể vào AI, thuộc con đường phát triển mới dành cho robot đa năng. Vốn sẽ bổ sung thêm củi cho ngành này, sau 5 đến 10 năm đầu tư quy mô lớn sẽ đốt cháy mạnh mẽ hơn, cuối cùng hiện thực hóa việc thương mại hóa robot đa năng. ** Trong một thời gian dài trước đây, sự phát triển của robot chỉ giới hạn ở một loại công việc cụ thể, giống như AI, vốn từng bị giới hạn như vậy. Mô hình lớn đang dần được phát triển thành AGI và việc kết hợp với robot có thể mở rộng phạm vi ứng dụng của robot một cách tự nhiên. **
So với Trung Quốc, tiến độ ở nước ngoài nhanh hơn một bước và khả năng của mô hình lớn đã được nâng cấp từ ngôn ngữ lên lớp thực thi. Vào tháng 7, robot của nhóm Li Feifei có thể kéo ngăn kéo, mở nắp chai và cân táo. Robotics Transformer 2 (RT-2) do Google DeepMind ra mắt vào cuối tháng tiếp tục tiến hành nghiên cứu chuyên sâu theo hướng tương tự. RT-2 là mô hình Tầm nhìn + Ngôn ngữ + Hành động (VLA) hoàn toàn mới, có thể học từ dữ liệu mạng và robot, đồng thời chuyển kiến thức này thành các hướng dẫn chung để điều khiển robot. RT-2 thể hiện khả năng khái quát hóa tốt hơn, hiểu biết vượt ra ngoài các lĩnh vực ngữ nghĩa và hình ảnh của dữ liệu robot mà nó tiếp xúc, đồng thời có thể diễn giải các hướng dẫn mới và phản hồi các lệnh bằng cách thực hiện lý luận cơ bản.
Dứt khoát là một con đường gập ghềnh
Như người ta vẫn nói, “Lý tưởng thì đầy đủ, nhưng thực tế thì mỏng manh.” Trong khi robot và AI đang tăng tốc phát triển thì vẫn còn nhiều thách thức thực tế về kỹ thuật và thương mại. Người ta nói rằng lĩnh vực robot nói chung cũng cần những công nghệ hoặc sản phẩm như GPT-4 để kết hợp khả năng đa phương thức và thực sự thống nhất sự phát triển của trí tuệ hiện thân. Nhưng đây không phải là một nhiệm vụ dễ dàng, sự kết hợp giữa robot và các mô hình lớn được trình bày trong các bài báo hiện tại và một số bản demo vẫn tập trung vào việc giải quyết các vấn đề tương tác, nhưng điều đó không có nghĩa là robot có thể trở thành robot đa năng sau khi giải quyết các vấn đề tương tác. Từ góc độ phát triển của robot, mô hình lớn có đóng góp nhưng có tác động hạn chế đến việc kiểm soát và thực thi cơ bản. Hiện tại, cộng đồng học thuật áp dụng các phương pháp do AI điều khiển và thường hy vọng sử dụng phương pháp học tăng cường làm phương pháp triển khai kiểm soát cơ bản, nhưng điều này không có mối quan hệ trực tiếp với mô hình lớn và các phương pháp kiểm soát của học tăng cường chưa hoàn thiện, và hầu hết vẫn đang trong giai đoạn nghiên cứu học thuật. .
Ngoài ra, tính bảo mật cần được cải thiện. “Ảo giác AI” của mô hình lớn có thể không có tác động đáng kể nhưng một khi đi vào cuộc sống, robot cần đảm bảo độ chính xác và an toàn, đây là những hướng công nghệ cần được cải tiến. Công nghệ, kịch bản, chi phí, an toàn, cơ hội và thách thức đang xuất hiện cùng lúc và robot hình người đang thực hiện một bước quan trọng hướng tới tương lai.