MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR是小米开源的语音识别模型,作为全链路语音交互系统的听觉基座,复杂真实场景下的高鲁棒性语音转写。它无需预设语种标签即可精准处理中英混说、方言交织、强噪音干扰等环境,在多人会议...
文明旁观者的头像2周前
0380
字节跳动ai产品有哪些

字节跳动ai产品有哪些

字节跳动已构建覆盖对话交互、内容生成、编程开发、智能体应用四大核心场景的AI产品矩阵,以豆包大模型为技术底座,通过C端应用验证商业化路径,同时向B端企业服务和垂直领域深度渗透。目前主要产品线聚焦于降低...
文明旁观者的头像2周前
0440
GenflowAI – 多模态AI创意工作空间

GenflowAI – 多模态AI创意工作空间

GenflowAI是面向创作者、电商与营销团队的多模态AI创意工作空间,主打无代码自动化工作流。聚合 GPT、Gemini、Seedance 2.0等顶尖模型,单一画布内完成文本、图像、视频、音频的生...
文明旁观者的头像2周前
0390