Châu Hồng Chí bàn về sự nổi tiếng của Seedance: Từ "mô phỏng ở cấp độ pixel" đến "tấn công hạ chiều" AI Trung Quốc định nghĩa tiêu chuẩn thế giới

2026-02-22 01:20:20

Nói về từ khóa nóng nhất trong giới AI gần đây, không gì khác ngoài mô hình video lớn mới nhất của ByteDance, Seedance.

Ngày 12 tháng 2, ByteDance chính thức ra mắt mô hình tạo video AI thế hệ mới Seedance 2.0, đồng thời tích hợp vào nền tảng sáng tạo AI generative của công ty “Jimeng” và ứng dụng Doubao. Chỉ cần vài câu gợi ý ngắn gọn, có thể tạo ra video chất lượng điện ảnh, ngay khi ra mắt đã gây tranh luận toàn cầu, thậm chí có một số đạo diễn Mỹ sau khi sử dụng Seedance 2.0 còn thốt lên: Hollywood có thể sẽ sụp đổ.

Nhờ khả năng đa mô thức đầu vào, tạo hình ảnh/ văn bản xuất sắc, Seedance nhanh chóng trở thành xu hướng AI hàng đầu toàn cầu. Vào ngày 14 tháng 2, về hiện tượng Seedance nổi tiếng toàn cầu này, sáng lập viên 360, Zhou Hongyi, trong cuộc phỏng vấn độc quyền với báo Pengpai, cho biết sự bùng nổ của DeepSeek và Seedance đều có ý nghĩa Trung Quốc đang chuyển từ “bắt chước pixel” sang “đòn phủ đầu giảm chiều”.

Zhou Hongyi nói với phóng viên rằng, khi Silicon Valley vẫn còn tranh luận về triết lý của AGI trong phòng thí nghiệm, thì Seedance, Vidu (mô hình video lớn của sinh số công nghệ) của Trung Quốc đã tiến vào các thị trường trị giá hàng nghìn tỷ như phim ngắn, game, quảng cáo để xây dựng hạ tầng. AI Trung Quốc đang định nghĩa “ứng dụng chính là tiêu chuẩn”, bỏ qua phòng thí nghiệm, trên chiến trường thực tế rèn giũa công nghệ thành “vũ khí hạt nhân”.

【Dưới đây là ghi chép đối thoại】

Báo Pengpai: Đánh giá về sự bùng nổ của Seedance và nguyên nhân đằng sau, ông nghĩ có những công nghệ đột phá nào?

Zhou Hongyi: Seedance 2.0 gần đây nổi bật trên các mặt báo. Nhiều người phản ứng đầu tiên là: AI làm video trông giống hơn rồi. Nhưng sau khi xem xong, tôi chỉ muốn nói một câu: vấn đề không phải là “giống hay không giống”, mà là AI bắt đầu tạo ra thế giới theo quy luật vật lý.

Khi bạn thấy mech tốc độ ma sát mặt đất, tia lửa bay đâu đó, độ sáng giảm thế nào; thấy vật nặng đổ xuống, bụi bay cuồn cuộn, sóng khí lan tỏa ra sao; thậm chí khi kính vỡ, hình ảnh và âm thanh đồng bộ “phát triển”. Đây không phải là ghép素材 hay hiệu ứng mẫu, mà là mô hình đang dự đoán ở tầng nền: lực truyền thế nào, năng lượng phát tán ra sao.

Mô hình thị giác đang từ việc bắt chước thế giới, chuyển sang hiểu thế giới. Đây là một bước chuyển đổi thế hệ.

Báo Pengpai: Năm ngoái, sự nổi tiếng của DeepSeek còn rõ ràng, ông có nghĩ rằng sự bùng nổ của Seedance trong dịp Tết này có phải là sự lặp lại của thời điểm DeepSeek không?

Zhou Hongyi: Trước đây, mọi người nghĩ rằng không thể làm ra AI đỉnh cao mà không cần vài vạn card đồ họa, nhưng DeepSeek đã chứng minh rằng thuật toán và tối ưu kỹ thuật có thể vượt qua đối thủ. Lần này, Seedance cũng làm điều đó. Nó không dựa vào tăng cường sức mạnh tính toán để “rút thẻ”, mà thực sự hiểu quy luật vật lý và logic phân cảnh của phim.

Sự bùng nổ của DeepSeek và Seedance đều có ý nghĩa chúng ta cuối cùng đã chuyển từ “bắt chước pixel” sang “đòn phủ đầu giảm chiều”. Khi Silicon Valley còn tranh luận về triết lý của AGI trong phòng thí nghiệm, thì Seedance, Vidu của Trung Quốc đã tiến vào các thị trường trị giá hàng nghìn tỷ như phim ngắn, game, quảng cáo để xây dựng hạ tầng. AI Trung Quốc đang định nghĩa “ứng dụng chính là tiêu chuẩn”, bỏ qua phòng thí nghiệm, trên chiến trường thực tế rèn giũa công nghệ thành “vũ khí hạt nhân”.

Báo Pengpai: Sự bùng nổ của Seedance có nghĩa là mô hình AI lớn của Trung Quốc đang thu hẹp khoảng cách với quốc tế và dần vượt qua không?

Zhou Hongyi: Hiện tại, khoảng cách công nghệ giữa mô hình lớn nội địa và quốc tế vẫn còn rõ ràng, nhưng ngoài cạnh tranh về tham số nền tảng, yếu tố quyết định thắng thua thực sự đang dịch chuyển. Nếu chỉ nhìn vào “mô hình mạnh hơn”, thì mới chỉ thấy phần đầu của trận đấu. Bởi vì khi mô hình bắt đầu hiểu thế giới, điều quyết định thực sự về độ cao của ngành không còn chỉ là mô hình nữa, mà là khả năng biến năng lực của mô hình thành hệ thống kỹ thuật ổn định, chất lượng cao, giao hàng nhanh.

Tại sao lại như vậy? Bởi vì mô hình càng mạnh, yêu cầu về thực thi cuối cùng càng cao, đặc biệt là tính nhất quán. Ví dụ: nhân vật có phải là cùng một người từ đầu đến cuối không? Nhìn từ bên cạnh, chính diện, lưng có phải là cùng một khuôn mặt không? Sau khi đổi góc quay, cột, cửa sổ, ánh sáng còn đúng không? Nhân vật bước vào cảnh, còn đứng đúng vị trí hợp lý không? Nếu không giải quyết được những vấn đề này, dù mô hình có mạnh đến đâu, kết quả cũng chỉ là Demo, không phải tác phẩm.

Thậm chí Seedance còn thẳng thắn thừa nhận, gần đây nó đã đăng bài nói rằng: hiện tại Seedance còn tồn tại hạn chế về độ ổn định chi tiết, phù hợp nhiều nhân vật, chỉnh sửa phức tạp, cần tiếp tục tối ưu. Nói cách khác, trong ngắn hạn, rất khó để có mô hình “đảm bảo mỗi lần sinh ra đều hoàn hảo”.

Vì vậy, cuộc cạnh tranh bây giờ không chỉ là mô hình có ít lỗi hơn, mà là ai có thể biến mô hình không hoàn hảo thành dây chuyền sản xuất ổn định.

Báo Pengpai: Ông dự đoán và đánh giá thế nào về xu hướng cạnh tranh chung của ngành AI trong năm nay, và trong năm 2026, điều gì sẽ là “điểm chỉ đạo” quan trọng nhất của ngành AI?

Zhou Hongyi: Hiện tại, AI đã bước vào giai đoạn “hợp tác của các thể thông minh tỷ tỷ”. Sự khác biệt thực sự đang chuyển từ mô hình sang khả năng ứng dụng và hệ thống. AI không chỉ cạnh tranh về tham số mô hình, mà còn về phương pháp sản xuất nội dung và khả năng giải quyết các vấn đề ngành công nghiệp thực sự. Giống như gần đây, công ty AI nổi tiếng Anthropic, mô hình chưa chắc đã vượt OpenAI, nhưng dựa vào dạng thể thông minh, lại dẫn đầu trong nhiều kịch bản.

Tôi có một nhận định rõ ràng: điểm phân chia thực sự của ngành đang chuyển từ “ai mô hình mạnh hơn” sang “ai có thể biến mô hình thành dây chuyền”, tức là từ việc sinh video AI theo kiểu rút thẻ, sang sản xuất kỹ thuật. Logic này về cơ bản giống như ngành công nghiệp điện ảnh.

Dựa trên nhận định này, gần đây 360 cũng đã ra mắt nền tảng sản xuất phim hoạt hình AI công nghiệp đầu tiên của Trung Quốc — Nano Manhua Production Line. Chúng tôi tích hợp các mô hình hàng đầu trong ngành, qua cơ chế điều phối thông minh, phù hợp với nhu cầu các phân cảnh khác nhau, chọn ra mô hình có hiệu suất và khả năng thể hiện tốt nhất. Từ phân chia kịch bản, tạo nhân vật, cảnh vật, quản lý kho, đến tạo storyboard, video storyboard, và hoàn chỉnh chỉnh sửa thành phim. Chúng tôi đã mang phương pháp của ngành công nghiệp điện ảnh vào hệ thống AI.

Tôi cho rằng, các dây chuyền sản xuất phim hoạt hình công nghiệp như Nano Manhua, cộng với mô hình thị giác hiểu quy luật vật lý như Seedance, mới thực sự bắt đầu cuộc cách mạng năng suất nội dung, và cũng là chiến trường cạnh tranh trong tương lai.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.