扫码阅读
手机扫码阅读
ChatGPT多模态识图评测 - 传奇依旧
33 2024-09-29
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
文章来源:
数字生命卡兹克
扫码关注公众号
自2023年3月GPT-4发布以来,多模态能力的加入被广泛期待,该功能支持图片识别和图片+文字的结合,提供了新的互动可能性。9月25日,OpenAI正式宣布将在两周内推出识图功能,让多模态功能得以面世。
虽然作者本人没有直接的使用权限,但通过借用他人账号体验了GPT-4的多模态功能,并分享了一些有趣的案例,来展现其潜力:
- 个人医生助理:多模态GPT-4可以作为医生助理,提供初步的医疗分析和建议,尽管不能完全替代专业医师,但在家庭医疗方面有巨大潜力。
- 教育助理:该技术能够根据学生的不同水平提供个性化的学习支持,OpenAI已成立教育研究院,展现了教育行业与AI结合的前景。
- 健身助理:GPT-4能通过图片计算食物的卡路里,并提供健身动作的反馈。
- 摄影助理:多模态GPT-4可以对照片进行评分、优化构图,并提供滤镜参数。
- 开发助理:通过草图来生成网页或游戏,大大简化了开发过程。
- 解码文件:有用户使用GPT-4V解码了政府编辑过的UFO目击文件,标志着新时代的到来。
作者认为,多模态和通用AGI是AI未来发展的关键方向。随着GPT-4V的发布,这个新时代已经开始,将会带来知识与技术的巨大进步。最后,作者鼓励大家保持好奇心,一起拥抱即将到来的技术革命。
文章的最后,作者邀请读者对文章做出反馈,如点赞、评论和转发,并希望获得星标支持。
想要了解更多内容?
文章来源:
数字生命卡兹克
扫码关注公众号
数字生命卡兹克的其他文章
我跟12家大厂一起弄了个免费的AI大聚会 - 上海,我们来了
3.16号,上海见
首批艺术家创作的Sora视频放出 - OpenAI超大杯肌肉秀
当你不是复制旧的,而是将我们本来没有机会看到的新的、不可能的想法变为现实时,Sora 才是最强大的
Midjourney全新模型V6实图前瞻 - 神功大成
Midjourney V6的质量真的有了飞跃般的提升,我真的非常非常想分享给大家看
SD全新开源模型SDXL1.0评测 - 留给Midjourney的时间不多了
所有的SD玩家都特么的可以自豪的说一句:劳资也有通用大模型啦!MJ吔屎啦你!
仅需30秒完美复刻任何人的声音 - 最强AI音频11Labs
我的用词一直都挺克制的,基本不会用到“最强”这?
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线