可灵AI进入2.0年代,可用“文字+图片+视频”生成视频

liukang20249小时前观众吃瓜909
4月15日,可灵AI举办2.0版别模型发布会,发布可灵2.0视频生成模型及可图2.0图画生成模型。据悉,可灵2.0上线了一种能够将文字、图片、视频等不同格局的文件结合起来一同修改生成视频的新交互形式,此举改变了以往只能用文字生成视频的单一模态修改方法。
记者了解到,当时视频生成首要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就发表,85%的视频创造经过“图生视频”完结。一般情况下,AI视频制作者往往经过文字生成图片,再用图片生成视频。而可灵AI此次上线多模态视频修改功用,使得文字或图片不再成为仅有的AI修改言语,也可让AI生成的视频愈加契合制作者的描绘。
依据发布会上的演示,用户能够结合图画、视频片段等多模态信息,将脑海中的多维度杂乱主意传达给AI。这也意味着,用户在运用AI生成视频时,提示词中能够夹藏图片或视频。业界也将这种全新的交互形式称为MVL(Multi-modal Visual Language,即多模态视觉言语)。
“仅仅用文字描绘自己的幻想是不行的,人和AI的交互需求新的言语。”快手高档副总裁、社区科学线负责人盖坤说道,例如,用户能够将视频中主人公的面庞、服装、布景的参阅图片及人物动作的参阅视频悉数添加到描绘中,视频中的人物便可更靠近用户的幻想来出现。此外,这一功用不只能够灵敏了解用户目的,还能支撑对视频内容进行部分的增、删、改。
此外,主打“文生图”功用的可图2.0的才能也将迎来晋级,其指令遵从才能、电影美学表现力均大幅提高,在多元化的艺术风格方面,可图2.0现在可支撑60多种风格化的作用转绘。
据悉,可灵2.0版别发布即上线。即日起,全球用户即可运用可灵AI 2.0模型。“AI在辅佐构思表达上具有巨大潜力,但当时的职业开展现状还远远无法满意用户需求,在AI生成内容的稳定性、用户杂乱构思的准确传达上仍有许多应战。”盖坤表明。
来历:北京日报客户端
记者:鹿杨
告发/反应

相关文章

特朗普2.0局面支持率创新高

美国总统特朗普在第二任期初经过一系列行政举动,取得了其十年政治生计中最高的支撑率之一。依据CBS新闻与YouGov联合进行的最新民调,53%的美国成年人对其整体作业体现表明认可。大多数受访者以为,78...

友情链接: