Alibaba Qwen3.5-Omni veröffentlicht ein multimodales All-in-One-Modell, das 113 Arten von Spracherkennung unterstützt

Gate News Nachricht, 30. März, Ali Qianwen hat das vollmodale Sprachmodell Qwen3.5-Omni offiziell eingeführt. Die Serie umfasst Instruct-Versionen in drei Größen: Plus, Flash und Light, unterstützt einen langen Kontext von 256k (lange Eingänge und lange Ausgaben) und ermöglicht Audioeingaben von mehr als 10 Stunden sowie Video- und Audioeingaben von mehr als 400 Sekunden in 720P (1FPS). Das Modell wurde nativen multimodalen Vortraining auf riesigen Text-, Bild- sowie Audio- und Videodaten von über 1 Milliarde Stunden unterzogen und zeigt herausragende Fähigkeiten in der ganzheitlichen Wahrnehmung und Generierung von Multimodalität. Im Vergleich zum Vorgänger Qwen3-Omni wurde die mehrsprachige Fähigkeit von Qwen3.5-Omni deutlich verbessert; es kann Spracherkennung in 113 Sprachen und Dialekten sowie Sprachgenerierung in 36 Sprachen und Dialekten unterstützen.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare