豆包ai
字节跳动的AI智能助手

全模态能力:支持文本对话、图像生成 / 编辑、5 分钟级长视频创作、语音克隆与实时交互,覆盖多场景内容生产。
高效推理架构:采用 5600 亿参数 MoE(混合专家)架构,动态激活仅约 270 亿参数,推理速度超 100tokens/s。
中文深度优化:精准理解中文语境与文化词汇,图像生成支持全部 8105 个标准汉字渲染。
长内容一致性:视频生成支持多镜头人物 / 场景一致性,可生成分段式长视频。
工具链完善:内置代码助手、智能体、数据分析、旅行规划等工具,支持 API 调用与本地部署。
性能与成本平衡:MoE 架构 + 零计算专家机制,降低硬件依赖,推理成本较同级别模型低 60%+。
中文场景领先:在本地生活、零售、餐饮等领域理解精准,适配 “烟火气” 等中文特色表达。
开源生态友好:MIT 协议开源,提供多版本模型(LongCat-Flash/Lite/Video/Image),适配不同算力需求。
工业级落地能力:视频生成支持 720p/30fps,图像编辑覆盖 15 类任务,已在美团内部大规模应用。
多平台适配:支持 Web 端、APP 端、PC 客户端及服务器部署,兼容主流 GPU 与操作系统。
内容创作:自媒体短视频生成、影视解说、有声书制作、国潮 / 中文元素图像设计。
企业服务:智能客服、会议纪要自动生成、文档自动化、零售 / 餐饮行业智能经营分析。
本地生活:美食推荐、旅行规划、外卖智能助手、到店服务智能预约。
开发者生态:AI 智能体开发、代码辅助、模型二次开发、行业定制化解决方案。
多媒体生产:广告视频制作、虚拟人直播、语音内容批量生成、教育课件制作。






