点击可放大。本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。 欢迎转发给你的朋友,让更多人受益
简要文本实录:
好,大家好,咱们今天讲的东西就是给大家讲一下大模型今年的一个趋势,包括了我个人一年以来的学习的一个情况。这里面给了大家一个非常庞大的思维导图,理清这个脉络是需要花点时间的。
海外发展脉络
前面会比较快速的理一下这个脉络,今年的这个AI浪潮实际上是由OpenAI把这个浪潮带起来的。CHATGPT是在去年的12月发布,也就是3.5的这个版本。这个版本打败了所有的nlp框架的东西,就是所有的几乎一夜之间,所有原来做NLP框架的都发现自己之前的全部干掉了。
第二个是他证明这个东西就是美国佬这大数据量的训练,大规模的训练,超大算力的训练,最后能力就会提升,这个模型能力就会提升。
GPT4是今年 4月份发布的,有人怀疑他是多专家的结构,比3.5的逻辑能力大幅的提升。这个大家用过都知道。它支持插件系统,插件系统包括了你可以放文档,可以有人设。另外就是你可以接一些外部的agent, 让他去实现那个叫autogen的能力。就是让这个大模型自动的去跑一些流程。
这个自动跑流程是我们今年以来一直在关注的一个非常强的能力。因为它只要模型能力不断的提升,这个工作流的覆盖率迟早会形成一个能够把人给替代掉的,或者把某些岗位给替代掉的能力。这是我们非常关注的一个点。
今天到10月份,它的多模态能力得到了提升。就是我们我看到的是4.5,现在我们实际上很多在用的是4.5。4.5是可以你上传一个图片给他,也可以扔一段视频给他。你甚至可以给他一个你写的画的草图,他会帮你生成一段网站的代码。他还有一个新的版本,应该是支持这个内置的agent,就GPTS. 这个新生态因为他们内讧了,现在推迟了,推出来。因为明年他推出来以后,应该也是个很火的东西,这块就不多讲了,
开源产品体系主要是facebook来主导的,facebook就因为打不赢这种巨头,他们就把他们自己模型扔出来开源了。他们这个公司有个好玩的东西,他把所有东西他之前做在元宇宙的领域做了的所有东西都扔出来了。
那么开源以后这些大家就llama 2月份发布的,然后llama2 7月份发布的。然后下面ALPACA\ VICUNA 这些都是社区微调的代表,不多展开。
国内发展脉络
国内这个领域有大概现在有非常多,国内最高的时候有100家,现在至少有个四五十家在搞大模型家。但是我认为最后能活存下来的可能也就二三十家左右,也就是这些巨头能够活存下来一部分。就因为持续迭代对企业投入的这个研发是极其继续烧钱的。
国内的传统大厂就不用说多讲了,大家也用过文心、阿里、华为、讯飞、华为,这些除了阿里之外都不开源。阿里是因为大模型打不赢人家,所以他做了一堆的小模型扔出来也是像meta一样的思路,就是造福大家了。
国内的开源的也有一些像百川,像清华,其中清华是最目前做的最广最多的,就是一个清华顶了半个国内的AI研发。所以我们很多开源的方案也是基于清华去辅助的。
这里面有一个某个企业帮我们做的一个测评,就用清华的模型来做这种客服,就是基于公司内部文档的一个问答。基于GLM优化的模型,准确率大概在七成左右。相对比之下,GPT4基于文档的回答准确度对比大概是在6成多。也就是中文领域一些具体的应用上,GLM并不那么差。
这里面还有个零一万物,李开复搞的。目前可能是这里面中文最好的一个。我们测的时候基本上是把他的文本生成率当成GPT3.5来用的。
其他技术趋势方面,大家可以看下图:
总结一下就是。目前中美的顶级模型差距维持在1年左右;开源模型领域海外比我们的繁荣,因为他们开源的程度比我们高很多,模型的多样性比我们强很多,你可以理解为两个生态系统。在我们这边的主要是以大厂来主导的。他们那边的是有很多微小的个体来主导的,所以他们的生物多样性比我们强;而我们基本是目标先守住中文大模型这块的主阵地。
MAAS和商业逻辑
接下来我们讲一个核心的观点,MAAS这个是李彦宏这个提法,以前我们叫saas,叫software as a service就是软件即服务。现在是maas. MODEL as a service.
模型是服务,就是你的服务是由你的模型决定的,模型是你的核心竞争力,是你服务的核心;然后我自己总结的就是工作流和业务流是次级核心竞争力;也就是你如何去实现各种优化。
在商业上,刚才教授讲的,如何把这些东西都结合在场景上。用场景给消费者定价。所以你如果要想在这里面依靠模型,依靠这个趋势赚到钱,你一定要理解这个MAAS模型是竞争力。
企业如何利用LLM提升效率?
本思维导图PDF高清版本请关注公众号后在公众号对话框发送“大模型趋势”获取。 欢迎转发给你的朋友,让更多人受益