A Microsoft lançou a ferramenta de entrada de voz gratuita Vibing, baseada no seu modelo VibeVoice, como alternativa ao produto pago WisprFlow.

BlockBeatNews

据 1M AI News 监测,微软发布桌面语音输入工具 Vibing,基于自家开源语音 AI 模型 VibeVoice,支持 macOS 和 Windows,免费使用。
De acordo com a monitorização da 1M AI News, a Microsoft lançou a ferramenta de entrada de voz para desktop Vibing, baseada no seu próprio modelo de IA de voz open source VibeVoice, suportando macOS e Windows, e disponível gratuitamente.
按下快捷键(Mac 右 Option / Windows Ctrl+Win)即可在任意应用中唤起录音,结束后自动输出文本。
Ao pressionar a tecla de atalho (Mac Right Option / Windows Ctrl+Win), é possível ativar a gravação em qualquer aplicação, que ao terminar, gera automaticamente o texto.
AI/ML 社区测评者 @realmrfakename 亲测后称转录准确、速度快,评价为「WisprFlow 的免费替代品」。
Um avaliador da comunidade de IA/ML, @realmrfakename, testou e afirmou que a transcrição é precisa e rápida, classificando-a como “uma alternativa gratuita ao WisprFlow”.

Vibing 不只是语音转文字。
O Vibing não é apenas uma ferramenta de conversão de voz para texto.
它通过 LLM 将口语重写为适合当前场景的书面文本,支持在输入过程中用自然语言直接修改、删除、整理已有内容。
Ele usa LLM para reescrever a fala em texto escrito adequado para o cenário atual, permitindo modificar, deletar e organizar o conteúdo existente diretamente em linguagem natural durante a entrada.
其他功能包括单次 5 分钟以上连续录音、50+ 语言自动识别、同一句话内中英文混合输入、自定义热词以及实时翻译。
Outras funcionalidades incluem gravação contínua de mais de 5 minutos de cada vez, reconhecimento automático de mais de 50 idiomas, entrada mista em chinês e inglês na mesma frase, palavras-chave personalizadas e tradução em tempo real.

底层的微软 VibeVoice 是 MIT 协议开源的语音 AI 模型家族,
A base do Microsoft VibeVoice é uma família de modelos de IA de voz open source sob a licença MIT,
GitHub 星标超 2.8 万,包含 7B 参数的 ASR 模型(单次处理 60 分钟音频)、1.5B 的 TTS 模型(生成 90 分钟多人语音)和 0.5B 的实时模型(300ms 延迟)。
com mais de 28 mil estrelas no GitHub, incluindo um modelo ASR com 7B parâmetros (processando 60 minutos de áudio de cada vez), um modelo TTS de 1.5B (gerando 90 minutos de voz de múltiplas pessoas) e um modelo em tempo real de 0.5B (300 ms de latência).
WisprFlow 是目前 Mac 上最受欢迎的 AI 语音输入工具之一,
O WisprFlow é uma das ferramentas de entrada de voz de IA mais populares no Mac atualmente,
按月订阅收费,Vibing 直接以免费 + 开源的方式进入同一赛道。
com cobrança por assinatura mensal, enquanto o Vibing entra diretamente na mesma categoria de forma gratuita e open source.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário