2023年大模型发展脉络梳理(含思维导图)

图片


图片


点击可放大。本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。 欢迎转发给你的朋友,让更多人受益


图片


简要文本实录:


好,大家好,咱们今天讲的东西就是给大家讲一下大模型今年的一个趋势,包括了我个人一年以来的学习的一个情况。这里面给了大家一个非常庞大的思维导图,理清这个脉络是需要花点时间的。


海外发展脉络


前面会比较快速的理一下这个脉络,今年的这个AI浪潮实际上是由OpenAI把这个浪潮带起来的。CHATGPT是在去年的12月发布,也就是3.5的这个版本。这个版本打败了所有的nlp框架的东西,就是所有的几乎一夜之间,所有原来做NLP框架的都发现自己之前的全部干掉了。


第二个是他证明这个东西就是美国佬这大数据量的训练,大规模的训练,超大算力的训练,最后能力就会提升,这个模型能力就会提升。


图片


GPT4是今年 4月份发布的,有人怀疑他是多专家的结构,比3.5的逻辑能力大幅的提升。这个大家用过都知道。它支持插件系统,插件系统包括了你可以放文档,可以有人设。另外就是你可以接一些外部的agent, 让他去实现那个叫autogen的能力。就是让这个大模型自动的去跑一些流程。


这个自动跑流程是我们今年以来一直在关注的一个非常强的能力。因为它只要模型能力不断的提升,这个工作流的覆盖率迟早会形成一个能够把人给替代掉的,或者把某些岗位给替代掉的能力。这是我们非常关注的一个点。


图片


今天到10月份,它的多模态能力得到了提升。就是我们我看到的是4.5,现在我们实际上很多在用的是4.5。4.5是可以你上传一个图片给他,也可以扔一段视频给他。你甚至可以给他一个你写的画的草图,他会帮你生成一段网站的代码。他还有一个新的版本,应该是支持这个内置的agent,就GPTS. 这个新生态因为他们内讧了,现在推迟了,推出来。因为明年他推出来以后,应该也是个很火的东西,这块就不多讲了,


图片


开源产品体系主要是facebook来主导的,facebook就因为打不赢这种巨头,他们就把他们自己模型扔出来开源了。他们这个公司有个好玩的东西,他把所有东西他之前做在元宇宙的领域做了的所有东西都扔出来了。


图片


那么开源以后这些大家就llama 2月份发布的,然后llama2 7月份发布的。然后下面ALPACA\   VICUNA 这些都是社区微调的代表,不多展开。




国内发展脉络


国内这个领域有大概现在有非常多,国内最高的时候有100家,现在至少有个四五十家在搞大模型家。但是我认为最后能活存下来的可能也就二三十家左右,也就是这些巨头能够活存下来一部分。就因为持续迭代对企业投入的这个研发是极其继续烧钱的。


国内的传统大厂就不用说多讲了,大家也用过文心、阿里、华为、讯飞、华为,这些除了阿里之外都不开源。阿里是因为大模型打不赢人家,所以他做了一堆的小模型扔出来也是像meta一样的思路,就是造福大家了。


图片


国内的开源的也有一些像百川,像清华,其中清华是最目前做的最广最多的,就是一个清华顶了半个国内的AI研发。所以我们很多开源的方案也是基于清华去辅助的。


这里面有一个某个企业帮我们做的一个测评,就用清华的模型来做这种客服,就是基于公司内部文档的一个问答。基于GLM优化的模型,准确率大概在七成左右。相对比之下,GPT4基于文档的回答准确度对比大概是在6成多。也就是中文领域一些具体的应用上,GLM并不那么差。


这里面还有个零一万物,李开复搞的。目前可能是这里面中文最好的一个。我们测的时候基本上是把他的文本生成率当成GPT3.5来用的。


其他技术趋势方面,大家可以看下图:


图片


总结一下就是。目前中美的顶级模型差距维持在1年左右;开源模型领域海外比我们的繁荣,因为他们开源的程度比我们高很多,模型的多样性比我们强很多,你可以理解为两个生态系统。在我们这边的主要是以大厂来主导的。他们那边的是有很多微小的个体来主导的,所以他们的生物多样性比我们强;而我们基本是目标先守住中文大模型这块的主阵地。


MAAS和商业逻辑


接下来我们讲一个核心的观点,MAAS这个是李彦宏这个提法,以前我们叫saas,叫software as a service就是软件即服务。现在是maas. MODEL as a service.


模型是服务,就是你的服务是由你的模型决定的,模型是你的核心竞争力,是你服务的核心;然后我自己总结的就是工作流和业务流是次级核心竞争力;也就是你如何去实现各种优化。


图片


在商业上,刚才教授讲的,如何把这些东西都结合在场景上。用场景给消费者定价。所以你如果要想在这里面依靠模型,依靠这个趋势赚到钱,你一定要理解这个MAAS模型是竞争力。


企业如何利用LLM提升效率?


这里面最核心的就是你自己要鼓励整个流程去接触AI,能参与的都要参与进来。像飞书、钉钉都有这方面的流程,你也可以自己通过不同的技术方案去解决一部分问题,只要用起来,都能逐步的不由自主的进入迭代流程。
接下来,流程再造节省了人,替代一部分岗位;然后你要不要裁人?你不裁人你怎么办呢?你就鼓励他们内部创业;在管理上切入阿米巴模式,尝试公司更加的扁平化管理。
然后很重要的一点就是设立一些AI的流程改造岗,你可能要有专门的人去负责这个流程改造,也可以请一些专家,比如可以请我们给你做点咨询服务没问题的,这个黄婆卖瓜自卖自夸一下。
图片
然后很重要的一点是,还是开源节流,你怎么去赋能业务?这是个思考题:AI人工智能在业务中如何赋能每一个流程?
现在这个时代,省钱和赚钱都要两手抓,这里面我们目前摸索出来的一些思路就是,你用自己的AI改造流程去做成一些作品获取流量,比如你要去在抖音上把你的这个用AI生成的结果去做一些流量的获取。然后想办法把流量导回来到业务上去。

图片

本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。 欢迎转发给你的朋友,让更多人受益