MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR是小米开源的语音识别模型,作为全链路语音交互系统的听觉基座,复杂真实场景下的高鲁棒性语音转写。它无需预设语种标签即可精准处理中英混说、方言交织、强噪音干扰等环境,在多人会议...
文明旁观者的头像2周前
0380
GenflowAI – 多模态AI创意工作空间

GenflowAI – 多模态AI创意工作空间

GenflowAI是面向创作者、电商与营销团队的多模态AI创意工作空间,主打无代码自动化工作流。聚合 GPT、Gemini、Seedance 2.0等顶尖模型,单一画布内完成文本、图像、视频、音频的生...
文明旁观者的头像2周前
0390