豆包PixelDance指南：字节跳动推出的AI视频生成大模型，突破多主体互动难关

豆包PixelDance指南：字节跳动推出的AI视频生成大模型，突破多主体互动难关

2024-12-27 09:36

豆包PixelDance是由字节跳动旗下火山引擎发布的AI视频生成大模型。它是业界首个突破多主体互动难关的视频生成模型，支持多风格多比例的一致性多镜头生成。PixelDance基于DiT架构，具备高效的DiT融合计算单元，能够实现复杂的多主体运动交互和多镜头内容一致性。

豆包PixelDance和豆包Seaweed都是字节跳动发布的AI视频生成大模型，但它们在功能和侧重点上有所不同。

豆包PixelDance：

功能特色：PixelDance模型基于DiT架构，具备精准的语义理解能力，能够执行复杂的文本提示，生成具有连贯动作的视频，支持多主体间的交互和时序性动作指令。它还拥有强大的动态效果和炫酷的运镜能力，能够一键生成具有故事性的多镜头短片。
适用场景：PixelDance适用于影视制作、广告传媒、短视频内容创作、直播行业和电商等多个领域，尤其适合需要快速生成高质量视频内容的场景。

豆包Seaweed：

功能特色：Seaweed模型基于Transformer结构，利用时空压缩技术进行训练，原生支持多分辨率输出。它默认生成720p、24fps、5秒视频，可延长至20-30秒。Seaweed模型生成的视频逼真度高，细节丰富，动态流畅，色彩光影专业。
适用场景：Seaweed广泛应用于电商、文旅、教育、影视等领域，大幅降低视频制作门槛，提升内容创作效率。

区别：

豆包PixelDance目前免费体验，每周提供10次体验机会，体验有效期至2024年10月31日结束。

用户可以访问火山引擎平台进行体验。如果是个人用户，可以直接访问“Doubao-视频生成-PixelDance”进行体验；如果是企业用户，需要提交申请表单，说明使用场景申请API对接（目前暂未对外开放）。