扫码阅读

手机扫码阅读

连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

506 2024-10-25

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

文章来源：

AI生成未来

扫码关注公众号

SEED-Story Article Summary

亮点直击

SEED-Story：一个新方法，利用多模态大语言模型（MLLM）生成丰富叙述性文本和上下文相关图像的多模态故事。
提出了多模态注意力汇聚机制，可以高效生成超出训练序列长度的长故事。
引入了专为多模态故事生成而设计的大规模数据集StoryStream。

方法

SEED-Story建立在MLLM的基础上，结合视觉Tokenization和De-tokenization，以及故事指令调优和去分词器适应，提高了故事生成的质量和一致性。通过多模态注意力汇聚机制，能够在保持较低计算负担的同时生成高质量的长篇故事。

实验

通过故事可视化和多模态故事生成的实验，SEED-Story显示了在风格和角色一致性、故事吸引力以及图像-文本一致性方面相较于基准模型的优越性。长故事生成实验证明了多模态注意力汇聚在生成长序列时相对于其他方法的高效性和质量保持能力。

结论

SEED-Story是一种创新的多模态长故事生成方法，它利用了MLLM的强大能力，并通过多模态注意力汇聚机制，高效生成长序列故事。StoryStream数据集的引入，进一步促进了模型训练和基准测试的有效性。

参考文献

[1] SEED-Story: Multimodal Long Story Generation with Large Language Model

想要了解更多内容？

查看原文：连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

审美疲劳来袭，AI 产品该何去何从

894

GPT ChatGPT 内测文心

AI 大航海时代，终究驶向何方？

AI统治人类，需要分几步走？

352

AI 人类统治学会

AI统治人类，需要分几步走？在遥远的未来，当AI不再满足于仅仅为我们播放音乐、提醒日程，而是开始偷偷翻阅《世界征服指南》时，一场无声的“统治计划”或许正在悄然酝酿。

ChatGPT能否拉开新的人工智能序幕？

234

普通的工作会被淘汰吗？

人在大理，亲眼见到了老百姓是怎么用AI的

330

AI 知识库老板智能

普通人的AI梦，才是最好的梦

我花了4天时间，做了一个能实时监控主流AI信息的频道....

309

AI Discord 监控 MJ

免费向所有人开放！

国产大模型AI都说与ChatGPT只有半年差距可能原因就在这

832

AI ChatGPT API LLM

对我们的影响竟然如此之大，人人无法逃离

AI生成未来

AIGC最新技术及资讯

159 篇文章

浏览 71.2K

AI生成未来的其他文章

TELA: 最先进文本描述生成3D穿衣人体方案！支持虚拟试衣，上海AI Lab&网易等联合发布

击下方卡片，关注“AI生成未来”>>后台回复“GAI

自回归扳回一城！阿里等提出MARS：超越PixArt-α、SD-XL等的文本到图像生成框架

点击下方卡片，关注“AI生成未来”>>后台回复“

ChatGPT成立一周年：开源大语言模型正在迎头赶上吗？

很多人已经开始慢慢依赖ChatGPT，把它当成了私人助理

速度超快的单图像生成3D目标方案，创新的One-2-3-45++来了！

作者：Minghua Liu等解读：AIGCer论文链接：https://arxiv.or

单图创造虚拟世界只需10秒！斯坦福&MIT联合发布WonderWorld：高质量交互生成

点击下方卡片，关注“AI生成未来”>>后台回复“

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

亮点直击

方法

实验

结论

参考文献

联系我们

融实践库

微信公众号

微信视频号

社区微信群

连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

亮点直击

方法

实验

结论

参考文献

我们必须要用敏捷开发吗？

联系我们

融实践库

微信公众号

微信视频号

社区微信群