悦灵犀AI底层技术重大突破，发布2.0多模态

Connor 币安交易所 2024-09-06 97 0

6月11日，悦享控股有限公司（纳斯达克:CHR）宣布，悦灵犀AI发布2.0多模态重磅更新，采用了更加先进复杂的算法和模型，拥有更强大的应用能力，以及更全面的人工智能新交互功能。这标志着悦灵犀AI在底层技术层面取得重大突破，在应用层面实现了质的飞跃，为用户带来前所未有的应用体验，以及更加丰富、多样和真实的生成效果。

在本次重磅更新中，悦灵犀AI推出了极具开拓性的“文生视频”工具，并对用户全面开放使用。悦灵犀AI文生视频技术已超越国内行业平均水平，其主要得益于以下几个方面的技术创新和应用：

1.DiT混合模型架构：悦灵犀平台的文生视频技术采用了当前最前沿的DiT (DiffusionTransformer)混合模型架构，该模型架构区别于目前AI视频领域广泛基于的UNet架构的扩散模型，悦灵犀融合了Diffusion和 Transformer两种模型的优点，可用于生成高质量的视频内容。

2.深度模拟与可控性：悦灵犀文生视频技术不仅能够生成高质量的图像，还具备对真实物理世界的深度模拟能力。通过DRL深度强化学习，悦灵犀能够理解和模拟复杂的现实场景和物体动态，为用户提供更为真实和准确的视频内容。同时，该技术还具有高度的可控性，允许用户根据具体需求调整和优化生成的视频，实现个性化的创意表达。

3.独特的创造力：悦灵犀文生视频技术拥有独特的创造力，可以基于用户的文本描述指令，创造性地生成不同风格的视频内容。这种创造力的实现，得益于模型中的CGV算法，能够捕捉和理解用户的创意意图，并将其转化为可视化的视频内容。

4.语义理解与本地化优势：依托于悦享人工智能大模型北辰星悦的强大支持，悦灵犀在语义理解方面表现出色，特别是在中文语境下的理解能力。这使得用户在使用悦灵犀进行视频创作时，无论想表达复杂的情感还是细腻的文化元素，都能够得心应手。

在本次悦灵犀AI2.0版本的迭代更新中，产品团队不仅对核心功能进行了深度优化，还新增了创新的AI扩图工具与AI头像制作工具，进一步拓宽了平台在商业化场景中的应用广度，为商业品牌提供了更为多样化的营销工具。

AI扩图工具利用先进的人工智能技术，能够智能识别并扩展图像内容，帮助用户轻松实现高质量图像的无损放大与创意扩展，无论是产品细节展示还是广告画面的高清呈现，都能满足商业需求的高标准。而AI头像制作工具则通过个性化的算法，让用户能够快速生成独具特色的虚拟形象，为社交媒体营销、虚拟助手或个性化服务提供了全新的互动方式。

此外，在本次2.0版本更新的同时，悦灵犀还特别增加了AI课程模块，精心录制了大量AI课程，旨在帮助普通用户快速理解和使用，为个人创作者提供了强有力的服务与技术支持。