beaucoup de gens architecturent encore autour d'une dépendance de calcul qui a disparu depuis longtemps


qwen3 32b, par exemple, est en ligne sur des GPU communautaires distribués en ce moment, parallélisme de pipeline fonctionnant à travers des nœuds sans qu'un seul opérateur contrôle, inférence sans permission sur Internet ouvert
trois couches, toutes ouvertes : poids ouverts (alibaba les a publiés), calcul sans permission (matériel communautaire, sans garde-fou), transport ouvert (pas de cluster privé, pas de porte d'API). la propriété ne s'applique à aucune d'entre elles
le modèle mental selon lequel une inférence capable de frontier nécessitait des rails hyperscalers était une norme, et cette norme expire lorsque l'infrastructure sous-jacente est déployée. les constructeurs qui exécutent l'inférence aujourd'hui n'ont pas besoin de demander à quiconque
la norme a expiré. la pile est déjà publique.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler