扫码阅读

手机扫码阅读

ChatGPT多模态识图评测 - 传奇依旧

381 2024-09-29

模态图片助理。。。扔给

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：ChatGPT多模态识图评测 - 传奇依旧

文章来源：

数字生命卡兹克

扫码关注公众号

自2023年3月GPT-4发布以来，多模态能力的加入被广泛期待，该功能支持图片识别和图片+文字的结合，提供了新的互动可能性。9月25日，OpenAI正式宣布将在两周内推出识图功能，让多模态功能得以面世。

虽然作者本人没有直接的使用权限，但通过借用他人账号体验了GPT-4的多模态功能，并分享了一些有趣的案例，来展现其潜力：

个人医生助理：多模态GPT-4可以作为医生助理，提供初步的医疗分析和建议，尽管不能完全替代专业医师，但在家庭医疗方面有巨大潜力。
教育助理：该技术能够根据学生的不同水平提供个性化的学习支持，OpenAI已成立教育研究院，展现了教育行业与AI结合的前景。
健身助理：GPT-4能通过图片计算食物的卡路里，并提供健身动作的反馈。
摄影助理：多模态GPT-4可以对照片进行评分、优化构图，并提供滤镜参数。
开发助理：通过草图来生成网页或游戏，大大简化了开发过程。
解码文件：有用户使用GPT-4V解码了政府编辑过的UFO目击文件，标志着新时代的到来。

作者认为，多模态和通用AGI是AI未来发展的关键方向。随着GPT-4V的发布，这个新时代已经开始，将会带来知识与技术的巨大进步。最后，作者鼓励大家保持好奇心，一起拥抱即将到来的技术革命。

文章的最后，作者邀请读者对文章做出反馈，如点赞、评论和转发，并希望获得星标支持。

想要了解更多内容？

查看原文：ChatGPT多模态识图评测 - 传奇依旧

文章来源：

数字生命卡兹克

扫码关注公众号

相关推荐

多模态AI全解析，概念、应用与风险

548

人工智能模态模型技术

介绍多模态人工智能。

最强图像大模型Phi-3.5-vision，教你跑起来

343

模型 Phi vision 3.5

介绍微软新AI模型Phi-3.5-vision的技术亮点及实际应用。

OpenAI突然宣布新大模型，o1-preview来了（代号“草莓”）

385

模型 o1 AI 模态

o1-preview新型人工智能模型

【SwiftUI系列】11.Image和图形的应用

469

图片 Image 加载 100

SwiftUI,Image控件，图形控件，

SpringBoot+Vue实现（表单+图片）上传、图片地址保存到数据库。上传图片保存位置自己定义、图片可以在前端回显

435

图片资源文件上传

你是否会有这样的疑问：如何将图片和商品的其它属性一起传给后端？是优先处理图片信息？还是图片和其它属性数据一块提交给后端处理？带有图片资源的请求头如何设置？数据库中是存放图片还是存放图片的访问地址？。。。

视频类产品经理，这6个点怎么顺利过的评审？（送福利）

图片上传功能贴纸

短视频/图片元素，已深深融入到社交、电商等应用场景中。即使不做这类产品，也可以了解下。

数字生命卡兹克

努力分享一些很新、很酷的AI干货。

185 篇文章

浏览 83.1K

数字生命卡兹克的其他文章

人在大理，亲眼见到了老百姓是怎么用AI的

普通人的AI梦，才是最好的梦

聊聊AI产品做算法备案这件事

最近很多人来问我AI算法备案这事，于是我就写一篇。

我花了4天时间，做了一个能实时监控主流AI信息的频道....

免费向所有人开放！

2分钟用AI造一个微信红包封面 - 顺便来领个我的限量款

送限量200个专属红包封面哦～

他们在WAIC看科技，而我当了一天的“显眼包”。

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

ChatGPT多模态识图评测 - 传奇依旧

联系我们

融实践库

微信公众号

微信视频号

社区微信群

ChatGPT多模态识图评测 - 传奇依旧

烧掉 700 亿学费后，中国企业终于懂了：换软件才是真正的省钱

联系我们

融实践库

微信公众号

微信视频号

社区微信群