扫码阅读
手机扫码阅读
基于 AI大模型训练自己的小模型
154 2024-03-30
ML - Machine Learning,机器学习。AI 的一个分支,关注使用数据让计算机系统学习的方法。 DL - Deep Learning,深度学习。ML 的一个分支,使用神经网络和大量数据进行学习的方法,目前最成功的 ML 方法。 -
NLP -Natural Language Processing,是自然语言处理的缩写,是人工智能和语言学领域的一个重要方向,目前很多产品的交互都是基于自然语言的输入,都需要NLP技术作为入口与后端复杂的服务交互。
LLM - Large Language Model,大规模语言模型的统称,它也是在DL深度学习技术之下的产出物。 GPT - Generative Pre-trained Transformer,GPT是一个基于DL的预训练语言模型,后面携带的数字标记为版本,比如GPT-1,GPT-2,GPT-3,GPT-3.5,最新对外版本是GPT-4。可以看作是LLM下的具体技术架构实现。 ChatGPT,是由OpenAI公司开发的一个基于GPT架构的产品,同类似的产品还是Google公司的Bard,Anthropic公司的Claude,Baidu公司的文心一言
知道自己在哪
上游,提供底层基础服务,芯片、算力、数据等,比如NVIDIA等 中游,搞大小模型算法的,比如各家的大模型、不同特定领域的算法 下游,做面向用户的应用开发,各种基于模型之上的搭建的应用,常见的套壳程序,基于 ChatGPT 的 New Bing等
原文链接:
http://mp.weixin.qq.com/s?__biz=MzIwMjE3MDIwMA==&mid=2247487473&idx=1&sn=70f778f2d535024e587f6fbddd716304&chksm=96e385c6a1940cd01f4839878ad41353da4259c520a44c787c0224cebaedbe74618335016e06#rd
MavenTalk的其他文章
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线