悦灵犀AI底层技术重大突破,发布2.0多模态

Connor 币安交易所 2024-09-06 13 0

6月11日,悦享控股有限公司(纳斯达克:CHR)宣布,悦灵犀AI发布2.0多模态重磅更新,采用了更加先进复杂的算法和模型,拥有更强大的应用能力,以及更全面的人工智能新交互功能。这标志着悦灵犀AI在底层技术层面取得重大突破,在应用层面实现了质的飞跃,为用户带来前所未有的应用体验,以及更加丰富、多样和真实的生成效果。

在本次重磅更新中,悦灵犀AI推出了极具开拓性的“文生视频”工具,并对用户全面开放使用。悦灵犀AI文生视频技术已超越国内行业平均水平,其主要得益于以下几个方面的技术创新和应用:

1.DiT混合模型架构:悦灵犀平台的文生视频技术采用了当前最前沿的DiT (DiffusionTransformer)混合模型架构,该模型架构区别于目前AI视频领域广泛基于的UNet架构的扩散模型,悦灵犀融合了Diffusion和 Transformer两种模型的优点,可用于生成高质量的视频内容。

2.深度模拟与可控性:悦灵犀文生视频技术不仅能够生成高质量的图像,还具备对真实物理世界的深度模拟能力。通过DRL深度强化学习,悦灵犀能够理解和模拟复杂的现实场景和物体动态,为用户提供更为真实和准确的视频内容。同时,该技术还具有高度的可控性,允许用户根据具体需求调整和优化生成的视频,实现个性化的创意表达。

3.独特的创造力:悦灵犀文生视频技术拥有独特的创造力,可以基于用户的文本描述指令,创造性地生成不同风格的视频内容。这种创造力的实现,得益于模型中的CGV算法,能够捕捉和理解用户的创意意图,并将其转化为可视化的视频内容。

4.语义理解与本地化优势:依托于悦享人工智能大模型北辰星悦的强大支持,悦灵犀在语义理解方面表现出色,特别是在中文语境下的理解能力。这使得用户在使用悦灵犀进行视频创作时,无论想表达复杂的情感还是细腻的文化元素,都能够得心应手。

在本次悦灵犀AI2.0版本的迭代更新中,产品团队不仅对核心功能进行了深度优化,还新增了创新的AI扩图工具与AI头像制作工具,进一步拓宽了平台在商业化场景中的应用广度,为商业品牌提供了更为多样化的营销工具。

AI扩图工具利用先进的人工智能技术,能够智能识别并扩展图像内容,帮助用户轻松实现高质量图像的无损放大与创意扩展,无论是产品细节展示还是广告画面的高清呈现,都能满足商业需求的高标准。而AI头像制作工具则通过个性化的算法,让用户能够快速生成独具特色的虚拟形象,为社交媒体营销、虚拟助手或个性化服务提供了全新的互动方式。

此外,在本次2.0版本更新的同时,悦灵犀还特别增加了AI课程模块,精心录制了大量AI课程,旨在帮助普通用户快速理解和使用,为个人创作者提供了强有力的服务与技术支持。

评论