2023年大模型发展脉络梳理（含思维导图）

AI赋能实验室

2023-12-26 12:53发布于广东财经领域创作者

+关注

点击可放大。本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。欢迎转发给你的朋友，让更多人受益

简要文本实录：

好，大家好，咱们今天讲的东西就是给大家讲一下大模型今年的一个趋势，包括了我个人一年以来的学习的一个情况。这里面给了大家一个非常庞大的思维导图，理清这个脉络是需要花点时间的。

海外发展脉络

前面会比较快速的理一下这个脉络，今年的这个AI浪潮实际上是由OpenAI把这个浪潮带起来的。CHATGPT是在去年的12月发布，也就是3.5的这个版本。这个版本打败了所有的nlp框架的东西，就是所有的几乎一夜之间，所有原来做NLP框架的都发现自己之前的全部干掉了。

第二个是他证明这个东西就是美国佬这大数据量的训练，大规模的训练，超大算力的训练，最后能力就会提升，这个模型能力就会提升。

GPT4是今年 4月份发布的，有人怀疑他是多专家的结构，比3.5的逻辑能力大幅的提升。这个大家用过都知道。它支持插件系统，插件系统包括了你可以放文档，可以有人设。另外就是你可以接一些外部的agent, 让他去实现那个叫autogen的能力。就是让这个大模型自动的去跑一些流程。

这个自动跑流程是我们今年以来一直在关注的一个非常强的能力。因为它只要模型能力不断的提升，这个工作流的覆盖率迟早会形成一个能够把人给替代掉的，或者把某些岗位给替代掉的能力。这是我们非常关注的一个点。

今天到10月份，它的多模态能力得到了提升。就是我们我看到的是4.5，现在我们实际上很多在用的是4.5。4.5是可以你上传一个图片给他，也可以扔一段视频给他。你甚至可以给他一个你写的画的草图，他会帮你生成一段网站的代码。他还有一个新的版本，应该是支持这个内置的agent，就GPTS. 这个新生态因为他们内讧了，现在推迟了，推出来。因为明年他推出来以后，应该也是个很火的东西，这块就不多讲了，

开源产品体系主要是facebook来主导的，facebook就因为打不赢这种巨头，他们就把他们自己模型扔出来开源了。他们这个公司有个好玩的东西，他把所有东西他之前做在元宇宙的领域做了的所有东西都扔出来了。

那么开源以后这些大家就llama 2月份发布的，然后llama2 7月份发布的。然后下面ALPACA\ VICUNA 这些都是社区微调的代表，不多展开。

国内发展脉络

国内这个领域有大概现在有非常多，国内最高的时候有100家，现在至少有个四五十家在搞大模型家。但是我认为最后能活存下来的可能也就二三十家左右，也就是这些巨头能够活存下来一部分。就因为持续迭代对企业投入的这个研发是极其继续烧钱的。

国内的传统大厂就不用说多讲了，大家也用过文心、阿里、华为、讯飞、华为，这些除了阿里之外都不开源。阿里是因为大模型打不赢人家，所以他做了一堆的小模型扔出来也是像meta一样的思路，就是造福大家了。

国内的开源的也有一些像百川，像清华，其中清华是最目前做的最广最多的，就是一个清华顶了半个国内的AI研发。所以我们很多开源的方案也是基于清华去辅助的。

这里面有一个某个企业帮我们做的一个测评，就用清华的模型来做这种客服，就是基于公司内部文档的一个问答。基于GLM优化的模型，准确率大概在七成左右。相对比之下，GPT4基于文档的回答准确度对比大概是在6成多。也就是中文领域一些具体的应用上，GLM并不那么差。

这里面还有个零一万物，李开复搞的。目前可能是这里面中文最好的一个。我们测的时候基本上是把他的文本生成率当成GPT3.5来用的。

其他技术趋势方面，大家可以看下图：

总结一下就是。目前中美的顶级模型差距维持在1年左右；开源模型领域海外比我们的繁荣，因为他们开源的程度比我们高很多，模型的多样性比我们强很多，你可以理解为两个生态系统。在我们这边的主要是以大厂来主导的。他们那边的是有很多微小的个体来主导的，所以他们的生物多样性比我们强；而我们基本是目标先守住中文大模型这块的主阵地。

MAAS和商业逻辑

接下来我们讲一个核心的观点，MAAS这个是李彦宏这个提法，以前我们叫saas，叫software as a service就是软件即服务。现在是maas. MODEL as a service.

模型是服务，就是你的服务是由你的模型决定的，模型是你的核心竞争力，是你服务的核心；然后我自己总结的就是工作流和业务流是次级核心竞争力；也就是你如何去实现各种优化。

在商业上，刚才教授讲的，如何把这些东西都结合在场景上。用场景给消费者定价。所以你如果要想在这里面依靠模型，依靠这个趋势赚到钱，你一定要理解这个MAAS模型是竞争力。

企业如何利用LLM提升效率？

这里面最核心的就是你自己要鼓励整个流程去接触AI，能参与的都要参与进来。像飞书、钉钉都有这方面的流程，你也可以自己通过不同的技术方案去解决一部分问题，只要用起来，都能逐步的不由自主的进入迭代流程。

接下来，流程再造节省了人，替代一部分岗位；然后你要不要裁人？你不裁人你怎么办呢？你就鼓励他们内部创业；在管理上切入阿米巴模式，尝试公司更加的扁平化管理。

然后很重要的一点就是设立一些AI的流程改造岗，你可能要有专门的人去负责这个流程改造，也可以请一些专家，比如可以请我们给你做点咨询服务没问题的，这个黄婆卖瓜自卖自夸一下。

然后很重要的一点是，还是开源节流，你怎么去赋能业务？这是个思考题：AI人工智能在业务中如何赋能每一个流程？

现在这个时代，省钱和赚钱都要两手抓，这里面我们目前摸索出来的一些思路就是，你用自己的AI改造流程去做成一些作品获取流量，比如你要去在抖音上把你的这个用AI生成的结果去做一些流量的获取。然后想办法把流量导回来到业务上去。

本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。欢迎转发给你的朋友，让更多人受益