扫码阅读
手机扫码阅读
AI绘图SDXL大模型推荐榜 - 重铸开源荣光
184 2024-09-29
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
文章来源:
数字生命卡兹克
扫码关注公众号
在7月份对SDXL1.0大模型的评测后,作者观察到了Stable Diffusion生态的新进展。随着Stable Diffusion WebUI1.6.0的发布和ControlNET的稳定支持,SDXL的生态开始显现起色,促使作者分享基于SDXL1.0微调的大模型推荐。
所有SD大模型均基于stability.ai发布的Stable Diffusion开源模型微调而来,其中SD1.5因其稳定性而受到广泛应用。SDXL1.0作为一款新发布的大模型,拥有比SD1.5近7倍的参数量和改进的语言模型,其生成图像的上限远高于SD1.5。
作者推荐了以下几款基于SDXL1.0的大模型:
- DreamShaper XL1.0:通用写实模型,质量和清晰度表现出色,是作者常用的模型。
- SDXL_Niji_Special Edition:通用卡通模型,精通各种卡通风格。
- LEOSAM's HelloWorld 新世界 SDXL:亚洲真人模型,逼真度和电影质量高。
- DynaVision XL:3D专化模型,对风格化3D模型如皮克斯风格表现好。
- Microsoft Design SDXL:专门针对UI图标的模型,风格独特,质量高。
同时,作者也列举了几款LoRA模型:
- Juggernaut Cinematic XL LoRA:增加电影质感的模型。
- InkPunk XL LoRA:具有前卫+复古风格的艺术模型。
- Voxel XL LoRA:体素风格模型,可创造《我的世界》式的效果。
作者提醒,SDXL的硬件要求较高,可能不是所有人都能运行这些模型。因此,作者提供了一个包含这些模型和插件的SDXL镜像,让用户可以在云端部署使用。
最后,作者认为AI绘图目前形成了三足鼎立的格局:Midjourney拥有极强审美和泛化能力,Dalle3在语义理解和多模态方面表现最佳,而Stable Diffusion则在控制能力和生态方面领先。作者强调这些工具可以相互补充,鼓励用户保持开放和好奇的心态。
想要了解更多内容?
文章来源:
数字生命卡兹克
扫码关注公众号
数字生命卡兹克的其他文章
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线