ITCOW牛新网 9月24日消息,字节跳动旗下的火山引擎今日正式推出豆包视频生成大模型。该模型采用高效的DiT融合计算单元、创新的扩散模型训练方法以及深度优化的Transformer结构,从而实现了视频与文本的高效编码压缩,显著提升了视频生成的泛化能力。
火山引擎总裁谭待指出,豆包视频生成大模型支持多种风格和比例的一致性多镜头生成,广泛适用于电商营销、动画教育、城市文旅及微剧本等多个领域。自发布以来,该模型的使用量迅速增长,日均tokens使用量超过1.3万亿,生成图片达到5000万张,语音处理时长达85万小时。