Zhou Hongyi parle du succès de Seedance : du « mimétisme pixel par pixel » à la « frappe en réduction dimensionnelle » La norme mondiale de l'IA chinoise
En évoquant les mots-clés les plus en vogue dans le domaine de l’IA récemment, il ne fait aucun doute que le dernier grand modèle vidéo de ByteDance, Seedance, est en tête.
Le 12 février, ByteDance a officiellement lancé le nouveau modèle d’IA de génération vidéo Seedance 2.0, intégré à sa plateforme de création d’IA générative « Jimeng » ainsi qu’à l’application Doubao. Avec seulement quelques instructions brèves, il est possible de générer des vidéos de qualité cinématographique. Dès sa mise en ligne, il a suscité un engouement mondial, certains réalisateurs américains se plaignant même après avoir utilisé Seedance 2.0 : Hollywood pourrait être fini.
Grâce à ses capacités exceptionnelles d’entrée multimodale, de génération de texte/image, Seedance est rapidement devenu la star mondiale de l’IA. Le 14 février, à l’occasion de cette popularité mondiale, Zhou Hongyi, fondateur de 360, a déclaré dans une interview exclusive avec Pengpai News que le succès de DeepSeek et Seedance signifiait que l’IA chinoise passait d’une simple « imitation pixel par pixel » à une « attaque en réduction ».
Zhou Hongyi a indiqué que, pendant que la Silicon Valley débat encore dans ses laboratoires sur la philosophie de l’AGI, la Chine avec Seedance et Vidu (le grand modèle vidéo de la société Shengshu Technology) a déjà investi massivement dans les marchés des courts-métrages, des jeux et de la publicité, qui représentent des trillions de yuan. L’IA chinoise est en train de définir « l’application comme norme », en sautant directement les phases expérimentales pour affiner la technologie sur le terrain, la transformant en « arme nucléaire ».
【Voici le transcript de l’entretien】
Pengpai News : Comment percevez-vous le succès de Seedance et ses raisons, quelles technologies disruptives voyez-vous derrière ?
Zhou Hongyi : Seedance 2.0 fait récemment le buzz. Beaucoup pensent d’abord : l’IA devient plus réaliste dans la vidéo. Mais après avoir vu, je ne peux m’empêcher de dire : ce n’est pas une question de ressemblance, mais l’IA commence à générer le monde selon les lois physiques.
Quand vous voyez un mecha frottant rapidement le sol, d’où volent les étincelles, comment la luminosité diminue ; quand un objet lourd tombe, comment la poussière tourbillonne, comment la vague d’air se propage ; même au moment où le verre se brise, l’image et le son sont synchronisés « en train de sortir ». Ce n’est pas un simple collage de matériaux ou un effet de modèle, mais une déduction en profondeur du modèle : comment la force se transmet, comment l’énergie se libère.
Les modèles visuels passent de l’imitation du monde à la compréhension du monde. C’est une transition générationnelle.
Pengpai News : Lors du Nouvel An chinois l’an dernier, le succès de DeepSeek était encore récent. Pensez-vous que la récente explosion de Seedance durant cette période est une réplique du moment DeepSeek ?
Zhou Hongyi : Avant, tout le monde pensait qu’il fallait des dizaines de milliers de cartes graphiques pour faire de l’IA de haut niveau, mais DeepSeek a prouvé que l’optimisation des algorithmes et de l’ingénierie pouvait dépasser la concurrence. Cette fois, Seedance fait la même chose. Ce n’est pas en accumulant la puissance de calcul qu’on tire la carte, mais en comprenant réellement les lois du monde physique et la logique de montage cinématographique.
Le succès de DeepSeek et Seedance signifie que nous passons enfin d’une « imitation pixel par pixel » à une « attaque en réduction ». Pendant que la Silicon Valley débat encore dans ses laboratoires sur la philosophie de l’AGI, nos Seedance et Vidu (le grand modèle vidéo de Shengshu Technology) ont déjà investi dans les marchés des courts-métrages, des jeux et de la publicité, qui représentent des trillions de yuan. L’IA chinoise définit « l’application comme norme », en sautant directement les phases expérimentales pour transformer la technologie en « arme nucléaire » sur le terrain.
Pengpai News : La popularité de Seedance indique-t-elle que l’écart entre les grands modèles chinois et étrangers se réduit ou même se rapproche ?
Zhou Hongyi : Il existe encore un écart objectif entre les grands modèles nationaux et étrangers, mais au-delà des paramètres fondamentaux, la clé du succès ou de l’échec commence à changer. Si vous ne voyez que la puissance du modèle, vous ne regardez que la première moitié. Car lorsque le modèle commence à comprendre le monde, ce qui détermine vraiment la hauteur de l’industrie, ce n’est plus seulement le modèle lui-même. C’est votre capacité à transformer cette puissance en un système d’ingénierie stable, fiable et rapide.
Pourquoi ? Parce qu’un modèle plus puissant exige une plus grande cohérence dans sa mise en œuvre. Par exemple : le même personnage est-il reconnu de face, de profil, de dos ? Après un changement de scène, les colonnes, fenêtres, lumières correspondent-elles toujours ? Lorsqu’un personnage entre dans une scène, est-il placé de manière cohérente ? Si ces problèmes ne sont pas résolus, même un modèle puissant ne produira peut-être qu’un prototype, pas une œuvre.
Même Seedance lui-même a admis récemment qu’il existe encore des insuffisances en termes de stabilité des détails, de correspondance de plusieurs personnages, de montage complexe, et qu’il faut continuer à optimiser. En d’autres termes, à court terme, il sera difficile d’obtenir un modèle garantissant une perfection à chaque génération.
Ce qui compte désormais, ce n’est plus seulement le nombre de bugs du modèle, mais la capacité à transformer un modèle imparfait en une ligne de production stable et fiable.
Pengpai News : Comment prévoyez-vous la tendance globale de la compétition dans le secteur de l’IA cette année ? Face à une évolution rapide, quel sera, selon vous, en 2026, le « indicateur de tendance » le plus important pour l’industrie de l’IA ?
Zhou Hongyi : L’IA entre actuellement dans une phase de « collaboration d’agents intelligents à plusieurs milliards ». La véritable différenciation ne se fait plus uniquement au niveau du modèle, mais au niveau de l’application et des capacités systémiques. L’IA ne se résume pas à la taille du modèle, mais à la nouvelle paradigme de production de contenu et à la capacité à résoudre réellement les problèmes industriels. C’est comme avec Anthropic récemment : leur modèle ne bat pas forcément OpenAI, mais grâce à leur forme d’agent intelligent, ils prennent souvent l’avance dans de nombreux scénarios.
J’ai une conviction claire : la véritable ligne de démarcation dans l’industrie se situe dans la transition de « qui a le modèle le plus puissant » à « qui peut faire tourner le modèle en ligne de production », c’est-à-dire passer de la génération de vidéos IA à la production industrielle. Cette logique est en fait identique à celle de l’industrie cinématographique.
Sur cette base, 360 a récemment lancé la première plateforme nationale de production d’IA pour séries animées industrielles — la ligne de production Nano-Manhua. Nous intégrons les meilleurs modèles du secteur, via une gestion intelligente, pour répondre aux besoins spécifiques de chaque scène, en associant la capacité la plus rentable et la plus expressive. De la décomposition du script à la génération d’actifs réutilisables pour les personnages et les décors, leur stockage, jusqu’à la création de storyboards, de vidéos storyboard, puis au montage final. Nous avons transplanté la méthode de l’industrie cinématographique dans un système d’IA.
Je pense que la ligne de production industrielle Nano-Manhua, combinée à des modèles visuels capables de comprendre les lois physiques comme Seedance, marque véritablement le début d’une révolution dans la productivité de contenu, et sera la zone de compétition de demain.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Zhou Hongyi parle du succès de Seedance : du « mimétisme pixel par pixel » à la « frappe en réduction dimensionnelle » La norme mondiale de l'IA chinoise
En évoquant les mots-clés les plus en vogue dans le domaine de l’IA récemment, il ne fait aucun doute que le dernier grand modèle vidéo de ByteDance, Seedance, est en tête.
Le 12 février, ByteDance a officiellement lancé le nouveau modèle d’IA de génération vidéo Seedance 2.0, intégré à sa plateforme de création d’IA générative « Jimeng » ainsi qu’à l’application Doubao. Avec seulement quelques instructions brèves, il est possible de générer des vidéos de qualité cinématographique. Dès sa mise en ligne, il a suscité un engouement mondial, certains réalisateurs américains se plaignant même après avoir utilisé Seedance 2.0 : Hollywood pourrait être fini.
Grâce à ses capacités exceptionnelles d’entrée multimodale, de génération de texte/image, Seedance est rapidement devenu la star mondiale de l’IA. Le 14 février, à l’occasion de cette popularité mondiale, Zhou Hongyi, fondateur de 360, a déclaré dans une interview exclusive avec Pengpai News que le succès de DeepSeek et Seedance signifiait que l’IA chinoise passait d’une simple « imitation pixel par pixel » à une « attaque en réduction ».
Zhou Hongyi a indiqué que, pendant que la Silicon Valley débat encore dans ses laboratoires sur la philosophie de l’AGI, la Chine avec Seedance et Vidu (le grand modèle vidéo de la société Shengshu Technology) a déjà investi massivement dans les marchés des courts-métrages, des jeux et de la publicité, qui représentent des trillions de yuan. L’IA chinoise est en train de définir « l’application comme norme », en sautant directement les phases expérimentales pour affiner la technologie sur le terrain, la transformant en « arme nucléaire ».
【Voici le transcript de l’entretien】
Pengpai News : Comment percevez-vous le succès de Seedance et ses raisons, quelles technologies disruptives voyez-vous derrière ?
Zhou Hongyi : Seedance 2.0 fait récemment le buzz. Beaucoup pensent d’abord : l’IA devient plus réaliste dans la vidéo. Mais après avoir vu, je ne peux m’empêcher de dire : ce n’est pas une question de ressemblance, mais l’IA commence à générer le monde selon les lois physiques.
Quand vous voyez un mecha frottant rapidement le sol, d’où volent les étincelles, comment la luminosité diminue ; quand un objet lourd tombe, comment la poussière tourbillonne, comment la vague d’air se propage ; même au moment où le verre se brise, l’image et le son sont synchronisés « en train de sortir ». Ce n’est pas un simple collage de matériaux ou un effet de modèle, mais une déduction en profondeur du modèle : comment la force se transmet, comment l’énergie se libère.
Les modèles visuels passent de l’imitation du monde à la compréhension du monde. C’est une transition générationnelle.
Pengpai News : Lors du Nouvel An chinois l’an dernier, le succès de DeepSeek était encore récent. Pensez-vous que la récente explosion de Seedance durant cette période est une réplique du moment DeepSeek ?
Zhou Hongyi : Avant, tout le monde pensait qu’il fallait des dizaines de milliers de cartes graphiques pour faire de l’IA de haut niveau, mais DeepSeek a prouvé que l’optimisation des algorithmes et de l’ingénierie pouvait dépasser la concurrence. Cette fois, Seedance fait la même chose. Ce n’est pas en accumulant la puissance de calcul qu’on tire la carte, mais en comprenant réellement les lois du monde physique et la logique de montage cinématographique.
Le succès de DeepSeek et Seedance signifie que nous passons enfin d’une « imitation pixel par pixel » à une « attaque en réduction ». Pendant que la Silicon Valley débat encore dans ses laboratoires sur la philosophie de l’AGI, nos Seedance et Vidu (le grand modèle vidéo de Shengshu Technology) ont déjà investi dans les marchés des courts-métrages, des jeux et de la publicité, qui représentent des trillions de yuan. L’IA chinoise définit « l’application comme norme », en sautant directement les phases expérimentales pour transformer la technologie en « arme nucléaire » sur le terrain.
Pengpai News : La popularité de Seedance indique-t-elle que l’écart entre les grands modèles chinois et étrangers se réduit ou même se rapproche ?
Zhou Hongyi : Il existe encore un écart objectif entre les grands modèles nationaux et étrangers, mais au-delà des paramètres fondamentaux, la clé du succès ou de l’échec commence à changer. Si vous ne voyez que la puissance du modèle, vous ne regardez que la première moitié. Car lorsque le modèle commence à comprendre le monde, ce qui détermine vraiment la hauteur de l’industrie, ce n’est plus seulement le modèle lui-même. C’est votre capacité à transformer cette puissance en un système d’ingénierie stable, fiable et rapide.
Pourquoi ? Parce qu’un modèle plus puissant exige une plus grande cohérence dans sa mise en œuvre. Par exemple : le même personnage est-il reconnu de face, de profil, de dos ? Après un changement de scène, les colonnes, fenêtres, lumières correspondent-elles toujours ? Lorsqu’un personnage entre dans une scène, est-il placé de manière cohérente ? Si ces problèmes ne sont pas résolus, même un modèle puissant ne produira peut-être qu’un prototype, pas une œuvre.
Même Seedance lui-même a admis récemment qu’il existe encore des insuffisances en termes de stabilité des détails, de correspondance de plusieurs personnages, de montage complexe, et qu’il faut continuer à optimiser. En d’autres termes, à court terme, il sera difficile d’obtenir un modèle garantissant une perfection à chaque génération.
Ce qui compte désormais, ce n’est plus seulement le nombre de bugs du modèle, mais la capacité à transformer un modèle imparfait en une ligne de production stable et fiable.
Pengpai News : Comment prévoyez-vous la tendance globale de la compétition dans le secteur de l’IA cette année ? Face à une évolution rapide, quel sera, selon vous, en 2026, le « indicateur de tendance » le plus important pour l’industrie de l’IA ?
Zhou Hongyi : L’IA entre actuellement dans une phase de « collaboration d’agents intelligents à plusieurs milliards ». La véritable différenciation ne se fait plus uniquement au niveau du modèle, mais au niveau de l’application et des capacités systémiques. L’IA ne se résume pas à la taille du modèle, mais à la nouvelle paradigme de production de contenu et à la capacité à résoudre réellement les problèmes industriels. C’est comme avec Anthropic récemment : leur modèle ne bat pas forcément OpenAI, mais grâce à leur forme d’agent intelligent, ils prennent souvent l’avance dans de nombreux scénarios.
J’ai une conviction claire : la véritable ligne de démarcation dans l’industrie se situe dans la transition de « qui a le modèle le plus puissant » à « qui peut faire tourner le modèle en ligne de production », c’est-à-dire passer de la génération de vidéos IA à la production industrielle. Cette logique est en fait identique à celle de l’industrie cinématographique.
Sur cette base, 360 a récemment lancé la première plateforme nationale de production d’IA pour séries animées industrielles — la ligne de production Nano-Manhua. Nous intégrons les meilleurs modèles du secteur, via une gestion intelligente, pour répondre aux besoins spécifiques de chaque scène, en associant la capacité la plus rentable et la plus expressive. De la décomposition du script à la génération d’actifs réutilisables pour les personnages et les décors, leur stockage, jusqu’à la création de storyboards, de vidéos storyboard, puis au montage final. Nous avons transplanté la méthode de l’industrie cinématographique dans un système d’IA.
Je pense que la ligne de production industrielle Nano-Manhua, combinée à des modèles visuels capables de comprendre les lois physiques comme Seedance, marque véritablement le début d’une révolution dans la productivité de contenu, et sera la zone de compétition de demain.