你的位置:kaiyun体育最新版 > 新闻中心 > 开云kaiyun官方网站当PixelDance生成10秒视频时-kaiyun体育最新版

开云kaiyun官方网站当PixelDance生成10秒视频时-kaiyun体育最新版

时间:2024-12-27 06:19 点击:51 次

开云kaiyun官方网站当PixelDance生成10秒视频时-kaiyun体育最新版

  着手:中国想法报开云kaiyun官方网站

  本报记者 李昆昆 李正豪 北京报谈

  近日,腾讯混元大模子公布最新进展:庄重上线视频生成才调,这是其继文生文、文生图、3D生成之后的又一新的里程碑。其实,就在最近,字节逾越也发布了视频生成模子PixelDance和Seaweed,在AI创作平台即梦AI庄重上线,面向公众免费通达使用。

  盘古智库高档赓续员江瀚在接纳《中国想法报》记者采访时示意:“从时期进步的角度来看,腾讯和字节逾越在视频生成大模子领域的干预与效果,展示了AI时期的赶紧发展。从商场竞争的角度来看,跟着腾讯、字节逾越等巨头的加入,视频生成大模子领域的竞争将愈加浓烈。”

  大厂进犯文生视频

  “用户只需要输入一段形色即可生成视频。”腾讯混元联系负责东谈主向记者说,咫尺的生成视频撑捏中英文双语输入、多种视频尺寸以及多种视频显然度。咫尺该模子已上线腾讯元宝APP,用户可在AI欺诈中的“AI视频”板块恳求试用。企业客户通过腾讯云提供职业接入,咫尺API(欺诈步调接口)同步通达内测恳求。

  腾讯方面先容称,腾讯混元生成视频大模子不错兑现超写实画质、生成高度合适领导词的视频画面,画面畅通不易变形。比如在冲浪、舞蹈等大幅度通顺画面的生成中,腾讯混元不错生成畅通、合理的通顺镜头,物体不易出现变形;光影反射基本合适物理王法,在镜面约略照镜子场景中,不错作念到镜面表里当作一致。同期,模子还不错兑当今画面主角保捏不变的情况下自动切镜头,这是业界大部分模子咫尺所不具备的才调。

  据先容,混元视频坐蓐模子基于跟Sora肖似的DiT架构,并在架构打算上进行多处升级。混元视频生成模子适配了新一代文本编码器来提高语义恪守,其具备坚定的语义奴隶才调,更好地应酬多个主体描绘,兑现愈加精细的指示和画面呈现;领受褪色的全刺眼光机制,使得每帧视频的邻接更为畅通,并能兑现主体一致的多视角镜头切换;通过先进的图像视频羼杂VAE(3D变分编码器),让模子在细节进展上有较着提高,尽头是东谈主脸、高速镜头等场景。

  记者采访字节逾越方靠近于其文生视频居品的最新进展及将来发展联系问题,落拓发稿前,对方尚未回复。其公开府上自满,本年9月底,字节逾越发布豆包模子家眷的两款视频生成模子Pixeldance和Seaweed,并通过即梦AI、火山引擎分离面向创作家和企业客户小范围邀测。当PixelDance生成10秒视频时,切换镜头3—5次的效果最好,场景和变装能保捏很好的一致性。通过小幅度、渐进式的领导词形色,PixelDance能生成魔术般的殊效。此外,用户还可使用时序领导词、长镜头等妙技,增强视频的复杂度和进展力,对剧情创作有匡助。

  Seaweed模子则在图生视频场景体现出较好的首帧一致性,不错保捏与用户输入图的一致性、色调等细节回答,兑现大幅度通顺画面畅通天然,具有视觉好意思感和真的感。

  据了解,字节逾越在文生视频方面亦然领受了DiT架构,在大幅度通顺画面进展畅通天然。经过剪映、即梦AI等业务场景打磨和捏续迭代,豆包视频生成模子具备专科级的光影布局及色调缓助才调,画面视觉具有好意思感和真的感。

  已成“混战”时势

  东吴证券在本年8月发布的研报里提到,在AI浸透率为15%的中性假定下,中国AI视频生成行业的潜在空间为3178亿元;在全AI花式下,电影、长剧、动画片和短剧的制作资本,相较传统花式将下落超95%。

  除了腾讯、字节逾越,国内其他一些公司也在发力文生视频。比如在10月举行的“2024中国臆测机大会”上,快手副总裁、大模子团队负责东谈主见迪败露,自本年6月发布以来,快手可灵AI已有杰出360万用户,累计生成3700万个视频以及杰出1亿张图片。11月8日,“AI六小龙”之一的智谱AI对其视频生成器具清影进行升级。更早之前,8月31日,MiniMax发布了其首款AI高清视频生成模子时期abab-video-1。

  国外方面,12月10日凌晨,OpenAI通告旗下视频生成模子Sora庄重面向大家推出。自本年2月初次预报以来,Sora仅向一些艺术家、知名演员和导演提供试用职业,但迟迟未上线,吊足大家胃口。如今庄重落地,激励原宥。

  与上一个版块比拟,这次的Sora Turbo撑捏生成1080p分辨率、最长20秒的视频,在时长上有较着增长。更大的亮点在于它提供“编订”职业,除了单纯的文生视频、图生视频、视频生视频外,用户还不错通过指示兑现视频重混、重新编订、轮回、羼杂等功能,更像是一个加强版的视频编订器。

  早在Sora发布之前,2023年1月起,Runway、Genmo、英伟达、Pika等外洋公司皆发布了AI 视频生成和多模态时期居品。而跟着Sora爆火,AI+视频时期和居品正在迅猛升级迭代,诸如电影、告白、视频编订、视频流媒体平台、UGC(用户生成试验)创作平台、短视频笼统平台等宽广行业有望受益。

  业内东谈主士合计,与创业公司比拟,腾讯、字节逾越这种大厂数据等资源比较丰富,又有流量撑捏,生意化进度会比较快一些。

  江瀚向记者说,这种竞争不仅体当今时期层面,还体当今欺诈场景的拓展和生意化花式的探索上。咫尺,天然视频生成时期还未到大范畴商用的阶段,但腾讯、字节逾越如故看到了其在工业级生意场景中的欺诈后劲,如告白宣传、动画制作、创意视频生成等。跟着时期的不竭锻真金不怕火和欺诈场景的拓展,视频生成大模子将成为企业数字化转型和智能化升级的弥留器具,商场出息宽广。

  本年6月,继好莱坞编剧在大歇工中条目适度AI撰写脚本之后,代表好莱坞演员权力的好意思国电视和播送艺东谈主团结会(SAG-AFTRA)示意,AI在影视行业确灵验武之地,但必须在演员喜悦并付费的前提下使用,比喻在臆测机生成的当作、颜色捕捉画面上,“AI应该是辅助、增强东谈主类,而不是取代东谈主类”。

  文生视频时期的进步,为试验创作、产业升级带来了积极影响,同期也为商场发展提供了纷乱的空间。跟着居品的进一步迭代升级,文生视频有望在细分领域试验创作经过中大大提高效用,加快优质供给产出,为各细分行业带来新的契机。

海量资讯、精确解读,尽在新浪财经APP

职守编订:李桐 开云kaiyun官方网站

服务热线
官方网站:www.sdhmxgw.com
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:23366558707
邮箱:2ccd2a09@outlook.com
地址:新闻中心科技园639号
关注公众号

Powered by kaiyun体育最新版 RSS地图 HTML地图


kaiyun体育最新版-开云kaiyun官方网站当PixelDance生成10秒视频时-kaiyun体育最新版

回到顶部