扫码阅读
手机扫码阅读

2024年的AI视频,究竟何去何从

22 2024-09-29

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:2024年的AI视频,究竟何去何从
文章来源:
数字生命卡兹克
扫码关注公众号
AI视频突破的一年:现状,挑战与展望

文章讨论了2023年为AI视频技术爆发的一年,以及作者对AI视频现状、存在的问题和对未来发展的展望的看法。AI视频技术从最初的Runway Gen1和wonder studio的不完善阶段,经历了Runway Gen2的推出和《创世纪》以及《流浪地球3》AI预告片的成功,逐渐走向了大众。2024年初,许多AI视频公司成立并推出产品,大型科技公司也在开发相关产品。

A16Z提供的2023年AI视频关键节点图显示,尽管产品众多,但大多数产品在可控性上仍存在不足。Runway的运动笔刷和PIKA的区域修改是少数支持较好可控性的产品示例。尽管大厂的动作较慢,但预计2024年上半年可能会出现大规模的AI视频产品爆发。

关于AI视频的挑战,作者认为目前的进展大约是5%到10%,离行业全面降负还有长路。其中最核心的问题是AI对物理规律的理解。这不仅影响视频中的交互镜头的真实性,也限制了AI视频的上限。作者认为,AI视频技术需要集成物理引擎来处理交互和运动。

目前,有两个主要的解决方向:Runway代表的世界模型和商汤代表的AI 3D。世界模型面临的主要挑战是海量物理数据的收集和抽象化,而AI 3D则依赖于图像分离、3D建模和物理引擎。AI 3D技术尚未成熟,但发展迅速,与AI视频结合后将带来重大突破。

总结来说,AI视频仍然面临着包括一致性、时长、运动幅度、可控性等许多问题,但物理规律的理解是最重要的挑战。作者期待大厂能加大投入,加快解决这些问题,以迎来AI视频技术的颠覆性时刻。

作者鼓励读者支持和关注AI视频的发展,并期待未来技术的进步。

想要了解更多内容?

查看原文:2024年的AI视频,究竟何去何从
文章来源:
数字生命卡兹克
扫码关注公众号