可灵AI进入2.0年代，可用“文字+图片+视频”生成视频

liukang20244个月前 (05-23)观众吃瓜979

4月15日，可灵AI举办2.0版别模型发布会，发布可灵2.0视频生成模型及可图2.0图画生成模型。据悉，可灵2.0上线了一种能够将文字、图片、视频等不同格局的文件结合起来一同修改生成视频的新交互形式，此举改变了以往只能用文字生成视频的单一模态修改方法。

记者了解到，当时视频生成首要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就发表，85%的视频创造经过“图生视频”完结。一般情况下，AI视频制作者往往经过文字生成图片，再用图片生成视频。而可灵AI此次上线多模态视频修改功用，使得文字或图片不再成为仅有的AI修改言语，也可让AI生成的视频愈加契合制作者的描绘。

依据发布会上的演示，用户能够结合图画、视频片段等多模态信息，将脑海中的多维度杂乱主意传达给AI。这也意味着，用户在运用AI生成视频时，提示词中能够夹藏图片或视频。业界也将这种全新的交互形式称为MVL（Multi-modal Visual Language，即多模态视觉言语）。

“仅仅用文字描绘自己的幻想是不行的，人和AI的交互需求新的言语。”快手高档副总裁、社区科学线负责人盖坤说道，例如，用户能够将视频中主人公的面庞、服装、布景的参阅图片及人物动作的参阅视频悉数添加到描绘中，视频中的人物便可更靠近用户的幻想来出现。此外，这一功用不只能够灵敏了解用户目的，还能支撑对视频内容进行部分的增、删、改。

此外，主打“文生图”功用的可图2.0的才能也将迎来晋级，其指令遵从才能、电影美学表现力均大幅提高，在多元化的艺术风格方面，可图2.0现在可支撑60多种风格化的作用转绘。

据悉，可灵2.0版别发布即上线。即日起，全球用户即可运用可灵AI 2.0模型。“AI在辅佐构思表达上具有巨大潜力，但当时的职业开展现状还远远无法满意用户需求，在AI生成内容的稳定性、用户杂乱构思的准确传达上仍有许多应战。”盖坤表明。

来历：北京日报客户端

记者：鹿杨

告发/反应

标签: 视频可灵 AI 2.0 生成

返回列表

上一篇：巴媒：欧盟对华贸易方针不该顺从美国

下一篇：“360智脑大模型4.0”正式发布，图片、文字、视频相互生成，已接入360全家桶｜最前哨

阿里云AI新进展：只需图片和文字就能生成数字人视频

【亿邦原创】阿里云在生成式AI范畴又有新进展。8月16日，阿里云推出数字人视频生成东西Live Portait，上传一张相片和一段文本或语音即可生成一段开口说话的数字人视频，可使用于视频直播、谈天机器...

友情链接：

二区吃瓜网

可灵AI进入2.0年代，可用“文字+图片+视频”生成视频

相关文章

阿里云AI新进展：只需图片和文字就能生成数字人视频

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

二区吃瓜网

可灵AI进入2.0年代，可用“文字+图片+视频”生成视频

相关文章

阿里云AI新进展：只需图片和文字 就能生成数字人视频

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

阿里云AI新进展：只需图片和文字就能生成数字人视频