AG真人百家乐官方

热点资讯

ag百家乐积分有什么用

AG旗舰厅百家乐潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

发布日期：2025-01-02 09:39 点击次数：120

裁剪部发自凹非寺AG旗舰厅百家乐

奥特曼说，Sora代表了视频生成大模子的GPT-1时刻。

从开年到当前，国表里、初创独角兽到互联网大厂，皆纷繁参预视频生成范畴，带来一个个清新模子的同期，视频、影视行业也随之发生剧变。

不可否定，当下的视频生成模子还遭遇诸多问题，比如对空间、对物理端正的领会，咱们皆期待着视频生成的GPT-3.5/4时刻到来。

在国内，有这么一家从加快检会启程的初创公司，正在为此长途。

它即是潞晨科技，创举东说念主尤洋博士毕业于UC伯克利，后赴新加坡国立大学担任校长后生确认。

本年潞晨科技在加快计较范畴除外，建立视频生成模子VideoOcean，为行业带来更具性价比的摄取。

在MEET 2025现场，尤洋博士也向咱们共享这一年关于视频生成范畴的领会与倡导。

MEET 2025智能改日大会是由量子位主持的行业峰会，20余位产业代表与会照看。线下参会不雅众1000+，线上直播不雅众320万+，赢得了主流媒体的平方暖和与报说念。

中枢不雅点梳理

视频生成模子应该杀青缜密化文本限制、淘气机位/淘气角度、扮装一致性、立场定制化

3年后约略就能迎来视频生成的GPT-3.5/GPT-4时刻

视频生成大模子的一个径直诓骗价值即是冲破实际的死字，极大裁减真实场景复现难度。

（为更好呈现尤洋的不雅点，量子位在不转变应许的基础上作念了如下梳理）

3年后或是视频大模子的GPT-3.5时刻

今天相配忻悦来到量子位大会，相配忻悦和众人筹商，今天讲一下咱们在视频大模子范畴作念的一些使命。

领先是我和我的创业公司潞晨科技的先容。我从UC伯克利毕业到新加坡国立大学任教，很行运创办了潞晨科技。

咱们之前是作念算力优化的。2018年谷歌打造了宇宙上第一个千卡集群TPU Pod，其时宇宙上最大的模子也曾BERT。咱们匡助谷歌，将（其时）宇宙上最大模子的检会时辰从3天压缩到76分钟。

也很行运，昨年华为盘古大模子的一个使命亦然咱们扫数来作念的，并赢得了ACL最好论文。咱们的时间匡助华为盘古大模子在检会中更高效。微软、英伟达等公司团队也使用了咱们的时间作念一些散播式检会，咱们但愿让大模子检会更快、资本更低。

步入今天的话题，来重心先容一下视频生成大模子。

咱们打造了一个产物叫Video Ocean，当前正处在测试阶段。先来先容一下产物，后头再探讨我以为视频大模子将会如何发展。

领先，我以为视频大模子第一个伏击的方面是，它应该能够杀青缜密化的文本限制。

其实咱们今天皆在用AI去生成大模子了，咱们详情但愿它能够精确反应出念念要的东西。但很缺憾，比如当前用文生图APP去生成图移时，也曾会发现许多图片实质无法作念到精确限制，是以我认为这方面还有很大的发展空间。

在Video Ocean模子检会经过中，咱们作念了一些初步探索。一个相比好的例子，咱们能够精确地提供一些描写，戴着墨镜，长的胡茬的欧洲男东说念主。不言而谕这个视频内部如实是咱们念念要的阿谁嗅觉，蓝天、海岸、沙滩、背光、单手抓相机、玄色T恤，也有对着镜头语言。

我认为AI视频大模子改日3年可能最伏击的也曾杀青视频大模子的Scaling Law。

这个经过不需要相配炫酷的产物智力，最伏击的是把它的模子与实际宇宙的敞开智力作念到极致。我以为最终步地即是东说念主们说一段话、给一段描写，它能精确地把描写以视频的神态展示出来。

是以我以为改日3年，AI视频大模子就像山姆·奥特曼说的那样，今天是Video的GPT-1时刻，可能3年后到视频大模子的GPT-3.5、GPT-4时刻。

这里展示一下Video Ocean的Demo，当前咱们作念到了这么的水平。

第二点是改日视频大模子如何能够杀青淘气机位、淘气角度。

当前拍电影、拍记录片可以拿入部属手机、录像机握住地晃，念念如何晃就如何晃，这么是对镜头有真实限制的。改日AI视频大模子，领先应该作念到这少许，雷同的描写，换一下角度、换一个镜头，它的形象是不应该转变的，它即是雷同一个物体。

更进一步讲，改日AI视频大模子还能颠覆许多行业。比如当前看足球、看篮球赛，咱们看到的镜头是现场编导给咱们看的镜头。他给咱们看出路、近景。

改日能不行依靠AI视频大模子，AG百家乐到底是真是假东说念主来限制镜头，决定念念要看哪，终点于在通顺场里可以瞬息转移，转移到老师席、终末一溜、第一溜。淘气机位、淘气角度的限制。我以为改日AI视频大模子在这方面也曲直常要道的，天然天然Video Ocean当前作念了一些尝试，初步效力也曾可以的。

我以为第三点伏击的是扮装一致性。

因为作念出AI视频大模子，最终详情是需要产生营收、杀青变现的。谁会安详为这个付费，比如告白使命室、告白商、电商博主、影视行业。淌若深远这些行业的话，一个要道点是扮装一致性。

比如一个产物的告白，详情从新到尾这个视频中的一稔、鞋、车，面容不行有太大变化，物体扮装保抓一致性。

拍一部电影，从来源到终结，主演的面容、要道副角的面容详情也不行变化，在这方面Video Ocean也作念一些很好的探索。

再一个是立场的定制化。咱们知说念当前演员东说念主工资本曲直常贵的，说念具资本也很高。

改日3年之内，淌若AI视频大模子正常发展，我嗅觉会有一种需求，比如一个导演可以让一个演员在游池塘里拍一段戏，然后拿到素材通过AI将它转成泰坦尼克场景下的游水，转成阿凡达场景下的游水，这种智力反而是AI最擅长的。赋予电影感、艺术感的画面。

总之大模子一个径直的诓骗价值即是冲破实际的死字，能够极大裁减真实场景复现的难度。

可能之前众人听过一个段子，好莱坞导演念念制造一个爆炸镜头，他算了一下预算，第一种决策是盖一个城堡把它炸掉，第二个决策是用计较机模拟这个画面。资本算下来之后，发现这两种决策的资本皆很高，其时用计较机模拟的资本更高，当前AI即是要大幅裁减大模子关于生成电影的资本。

淌若这少许杀青后，咱们可以不受地方、天气等外部身分的死字，并减少对真实演员的依赖。这倒不是抢演员的饭碗，因为一些要道镜头曲直常危急的，比如演员跳飞机、跳楼，演员去转圜行将引爆的炸弹之类，这种镜头改日只需要演员的身份和肖像权，AI可以把这么的镜头作念好，是以对电影行业能够极大作念到降本增效。

正如昆仑万维方汉淳厚刚才说的，天然咱们的计较资源有限，然而咱们发现通过更好的算法优化如实能够训出更好的效力，比如Meta使用6000多个GPU检会30B的模子，最近咱们会在一个月内发一个10B版的模子，咱们仅用了256卡。

Video Ocean前身是咱们团队先打造了一个Open-Sora的开源产物，这个开源产物是完好意思免费的，在Github上，效力相配可以，比如好意思国独角兽Lambda labs作念了一个火爆的诓骗数字乐高，其实这个数字乐高即是基于Open-Sora作念的。

本年龄首Sora出来之后，多样短视频巨头皆对视频大模子这一块相比心疼，比如中国的快手、抖音，好意思国即是Instagram、TikTok、SnapChat，这可以看到SnapChat的视频模子也在早些时候发布了，叫Snap Video，这是它的官方论文，他们就援用了咱们检会视频大模子的时间，是以说这些时间也匡助一些巨头真的把视频大模子训得更快，精度更高，智能进度更高。

谢谢众人！

— 完 —AG旗舰厅百家乐

上一篇：AG旗舰厅百家乐电信国际家具部王洪涛：中资IDC出海方兴未已，寰球化进度机遇与挑战并存
下一篇：AG百家乐网站年终报谈丨中非互助谱写大众南边发展新篇章

AG旗舰厅百家乐 潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

AG旗舰厅百家乐潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025