LTX 2.3 AI 视频生成器

在 klingaio.com 上在线体验 LTX 2.3。这个友好且强大的开源模型由 Lightricks 开发,支持文生视频、图生视频和音频生视频工作流。创建长达 20 秒的高保真视频片段,支持原生音频同步、1080p 到 4K 分辨率,以及扩展视频和重拍视频等专业工具。

多图融合视频

融合1张或多张参考图片,生成自定义风格与视觉特效的视频

指定视频首尾画面

第一张图为视频的起始画面,第二张图为视频的结束画面

多场景多镜头视频

生成包含多个不同镜头和场景的视频,像一部短篇电影故事

LTX 2.3

A model of all-round capabilities

视频画质
Fast
Professional

0/2000
分辨率
1080p
1440p
2160p
生成音频
Yes
No
每秒帧数
25
24
48
50

生成的视频将显示在这里。

您可以从“我的作品”菜单查看您的视频。

什么是 LTX 2.3?

我们很高兴推出 LTX 2.3,这是由 Lightricks 开发的最新开源多模态 AI 视频生成模型。它由高度优化的 20.9B 参数扩散 Transformer(DiT)架构驱动,作为一个单一的基础模型,能够生成高保真视频以及同步音频。它的设计初衷是成为开发者、工作室和企业构建真实工作流的真正生产级创意引擎。LTX 2.3 引擎接受文本、图像和音频输入,并无缝集成扩展视频和重拍视频等专业编辑功能。最重要的是,它在 Apache 2.0 许可下完全开源,允许本地运行以最大程度地保护隐私。

LTX 2.3 的所有功能

原生音视频同步

LTX 2.3 并没有将声音作为事后的补充,而是在生成视频的同时生成完美同步的音频。它能够在一步操作中输出清晰的对话、环境声音和音效,确保您的视觉元素和节奏保持完美一致。

    原生 1080p、4K 放大和 9:16 支持

    该引擎生成原生的 1080p 分辨率输出,并可使用内置的潜空间放大器扩展至 4K。此外,LTX Video 2.3 具有针对 9:16 肖像尺寸的原生训练,为社交媒体提供真正的垂直格式,而无需依赖裁剪。

      确保流畅度的尾帧插值技术

      为了确保您的视觉叙事自然流畅,该模型采用了深度的尾帧插值技术。这项技术有助于保持过渡和场景扩展的平滑,显著减少突兀的视觉跳跃和伪影。

        开源自由与本地运行

        我们坚信创作自由。模型权重和训练代码完全开源。您可以使用 LTX Desktop 或 ComfyUI 等工具完全在本地运行 LTX 2.3,保持数据 100% 隐私。

          LTX 2.3 支持的视频生成模式

          LTX 2.3 提供了一套多功能的生成端点,以适应您可能拥有的任何创意输入。以下是您可以直接在 klingaio.com 上探索的模式的友好分类。

          文生视频

          只需输入您的创意想法,文生视频模式就会以惊人的清晰度和动态效果将其变为现实。还提供了一个快速端点,用于快速制作原型和验证想法。

          图生视频

          将您的静态图像转换为动态的移动序列。图生视频功能对您的原始图片保持高保真度,密切保留纹理、面部细节和结构。

          音频生视频

          上传音频轨道,让 AI 生成与节奏和基调相匹配的视频。强烈推荐将音频生视频模式用于音乐视频、播客精彩片段和对话驱动的场景。

          扩展视频

          您需要让故事持续更长时间吗?扩展视频模式可以在您的现有片段上无缝添加更长的持续时间,同时在风格和角色动作上保持完美的一致性。

          重拍视频

          此模式充当您的本地电影剪辑师。通过设置特定的开始时间并提供新的提示词,您可以使用重拍视频精确地重写或替换素材的某些部分,同时保持核心构图完好无损。

          与 LTX-2 相比的主要升级和改进

          LTX 2.3 代表了对其前身的重大、以生产为核心的引擎升级。我们仔细倾听了社区的意见,为您带来这些至关重要的改进。

          更清晰的视觉细节

          得益于完全重建的 VAE 和精炼的潜在空间,您会注意到更清晰的边缘、高度真实的头发纹理,以及压缩伪影的大幅减少。

          更强的提示词理解能力

          LTX AI 2.3 配备了四倍大的文本连接器,能够理解复杂的空间关系、多个主体和特定的摄像机运动,而无需您过度设计提示词。

          更纯净的音频质量

          音频引擎进行了全面彻底的改造,采用了全新的声码器。背景噪音和静音间隙被大幅减少,提供纯净且达到广播级标准的声音。

          增强的运动稳定性

          在以前的版本中,图生视频模式有时会出现定格效果。新引擎通过引入看起来非常自然的强大、动态运动解决了这个问题。

          LTX 2.3 的适用场景

          因为它是作为一个稳定的生产引擎而不仅仅是一个研究演示而构建的,所以 LTX 2.3 完美地适用于众多实际应用。

          专业工作室制作

          凭借其可靠的一致性以及通过重拍视频进行精确编辑的能力,它是制作品牌资产、广告和电影预可视化的绝佳选择。

          音频驱动的叙事

          如果您制作播客或虚拟化身内容,音频生视频功能将自动把您的语音轨道同步到逼真的视觉动作中。

          社交媒体垂直内容

          原生的 9:16 支持使旨在为 TikTok、YouTube Shorts 或 Instagram Reels 制作引人入胜的视频片段的创作者感到极其方便。

          隐私敏感环境

          对于处理机密数据的企业,LTX Video 2.3 可以完全使用本地硬件脱机运行,彻底避免与云 API 上传相关的风险。

          通过 3 个步骤使用 LTX 2.3 生成视频

          第 1 步

          选择模式并提供输入

          首先选择您希望如何引导 AI。您可以为文生视频输入提示词,为图生视频上传图片,或为音频生视频提供声音文件。

          第 2 步

          配置您的设置

          设置您想要的分辨率(最高 4K/2160p)、时长(最高 20 秒)、帧率(24 或 48 FPS)以及纵横比。如果是编辑现有的视频片段,请选择扩展视频或重拍视频。

          第 3 步

          生成并下载

          点击生成按钮,让 LTX 2.3 处理您的请求。预览带有原生音频的结果,如果需要的话进行微调,并下载您的高质量 MP4 文件。

          常见问题