Googleは静かにオフラインAI音声認識アプリ「Eloquent」をリリースし、Gemmaモデルを使用してローカルで口癖をフィルタリングし、テキストをブラッシュアップします

BlockBeatNews

1M AI News のモニタリングによると、Google が iOS で「Google AI Edge Eloquent」という無料の音声書き起こしアプリを公開し、オフライン優先を売りにしている。ユーザーは Gemma に基づく音声認識モデルをダウンロードすれば、ネットワーク環境なしでも利用できる。アプリは書き起こしテキストをリアルタイムで表示し、停止すると「えー」「あー」などのフィラー(つなぎ言葉)を自動的にフィルタリングして、読みやすい文章として整える。さらに画面下部には、「要点の抽出」「フォーマル」「簡潔」「詳細」の4種類のテキスト言い換えオプションも用意されている。

アプリはデフォルトでクラウドモードを有効にしており、この場合は Gemini モデルでテキストをクリーンアップする。有効を切ると、処理は完全にローカルで行われる。ユーザーは Gmail アカウントから専門用語や固有名詞などのキーワードを取り込めるほか、手動でカスタム語彙を追加することもできる。アプリは書き起こし履歴も記録し、検索にも対応しており、各回の書き起こしの単語数と話速を表示する。

現在 Eloquent は iOS のみで提供されているが、App Store の説明文には Android バージョンに言及があり、システム標準のキーボードとして設定できるようになり、さらにフローティングボタンによるクイックアクセスも提供するとしている。これは、AI 音声書き起こしアプリ Wispr Flow の Android 版の機能と似ているという。Google は TechCrunch からのコメント依頼にまだ応じていない。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし