Index TTS2のテスト直後、オープンソースの音声クローンの上限が再び引き上げられました。



他のTTSと最大の違いは「感情のコントロール」です。 機械的な読み方の代わりに、「悲しげで怒りに満ちた、非常に興奮した」口調で話し、ペースや間もコントロールできると指定できます。 ゼロショット機構で、10秒の音声を直接クローンします。

しかし、元のGithubでのデプロイは非常に反人間的です。 Card CUDAバージョン、card Python依存関係、card C++コンパイル環境。 普通のコンピュータはネイティブコードを実行しており、エラーは1日報告できます。

チーム自身のために、環境依存関係をカプセル化しました。 WindowsとMacの両方のバージョンに対応したワンクリックの統合パッケージとなっています。

· 減圧(経路は中国語ではないことに注意してください)
· ダブルクリックでワンクリックで.batを起動できます
· ウェブ側はWebUIを通じて直接操作されます
トークンに一切お金をかけずにオフラインでローカルで動作します。 必要ならプライベートメッセージを送ってください!
プロジェクトオープンソースアドレス:
原文表示
post-image
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン