世界头条:LLM/AIGC带来的创新机会
时间:2023-06-23 16:18:15来源:人人都是产品经理

2023年6月10日~11日,人人都是产品经理举办的【2023数字化产品经理大会·深圳站】完美落幕。远望资本创始合伙人@程浩老师,为我们带来《LLM/AIGC带来的创新机会》为题的分享。


(相关资料图)

ChatGPT的出现仿佛平地一声惊雷,无异于第四次工业革命。大模型对于人类的价值远超互联网的价值,互联网是搜索信息,大模型是理解信息。举个例子,图书馆有成千上万的书,互联网能帮我们做的是找到这本书,而大模型可以帮你理解、看懂、消化这本书。

而未来大模型对人类工作的替代会从初级白领开始,比如帮忙订酒店机票的助理,发展到后面可能也会取代高级白领,比如律师、医生等。

这就带来一个问题:未来,知识不是必选项。纯知识性的、重复性的工作将会被取代,留下来的岗位,都是在做创新的岗位。这也将会对国内的教育体系造成冲击。

接下来讲什么是LLM。这是一种压缩技术,提示语(Prompt)是解压缩。涌现是解压缩中,随机组合出现新的内容。它就相当于基因突变,但大部分基因突变都是错误的,涌现是好的基因突变。

泛化是LLM核心能力。什么是泛化?以前我在百度时,做问答的、客服的、新闻的都有自己的大模型和算法,但他们都只在垂直领域达到了59分,还不能商业化。而ChatGPT这个通用的模型,在每一个垂直领域都达到了80分,具有很好的泛化能力。

训练大语言模型模型,需要三个步骤。第一步是预训练,去互联网找很多语料,无监督学习。接下来第二步就是指令微调,给Q&A,预训练做得好,指令微调的成本越低。第三步是reinforcement learning。根据用户反馈不断调整,你问AI一个问题,AI给你回答,你可以告诉他是对的,给他正向回馈;也可以告诉他是错的,要他进行修正,让AI不断优化。还包括对齐,比如对其价值观,不能有地域歧视、残疾人歧视等等。

这三个步骤中,预训练的成本是最高的,没有上亿都不要搞预训练。很多创业公司都是先找好一个预训练模型,再进行后面两个步骤。

从大模型角度来说,数据质量是最重要的,其次是数据多样性,然后是数据规模,再是模型,最后才是模型参数。这也解释了为什么英文状态下的大模型效果会更好,因为不管是从数据质量还是数量或者多样性上,英文都是远超其他语言的。

如今,千亿参数可能是极限,未来的趋势是小型化,比如把大语言模型集成到手机里。

未来,还有一个趋势是从GUI(图形界面)到NLUI(自然语言交互)。现在打车还需要用滴滴,订外卖还要用美团,未来可以直接拿手机说打车去机场,订票去上海。

现在几乎每个企业都有自己的数据库,未来大语言模型也会像数据库一样,成为企业的重要基础措施。

未来大语言模型会让那些行业受益呢?主要是以文字语言交互为主导的行业,对纯数字化行业影响不大。

在C端领域,受益的可能是写作、问答、总结、法律、招聘、售前、客服、营销等这些以文字交互为主的行业。

那么,想要做大语言模型,是用开源模型还是闭源模型呢?像ChatGPT、文心一言这些都是闭源模型,但开源模型的趋势正愈演愈烈。

创业公司选择开源还是闭源呢?各有优势。开源你只需要买TOKEN就好了,再加上 Prompt engineering和向量数据库等。闭源的优势在于,保护数据隐私,并且可以不断用数据填充完善自己的模型。

C端有做开源的也有闭源的,但是B端几乎都是开源的。在做demo的时候,通常会用闭源的,效果最好,还不用买云计算资源,等到要形成行业壁垒了,再改回到开源模型。

那么,大语言模型,也就是通用模型,它的泛化能力足够好之后,是不是不需要垂直模型了?

不是的。通用模型很难替代垂直模型。

因为80%的有价值的行业知识和数据都在企业防火墙内,通用模型没办法接触到这些数据,自然也就没办法推导出答案。并且,通用模型具有一定的模糊性,所以它更适合一些容错率高的、低价值的行业。垂直模型更适合容错率低的、高价值的行业。

比如炒股票、自动驾驶这类需要精确、可控的事情显然不能用通用模型,但是聊天、写作就可以。

大语言模型有四个架构,最底层的是Infrastructure,例如算法、算力,这些和创业公司都没关系,都是巨头在参与。

第二层是large language models,比如ChatGPT、文心一言、通义千问都是属于第二层的。

第三层是LLMOPs,这层实际上是工具层,像向量数据库就是典型的LLMOPs。

第四层是应用APP。

最下面两层没有上亿的资金很难做出来,适合大公司去做,上面两层比较适合创业公司,尤其是应用层,可应用的行业太多了。

那么,创业公司能不能做通用大语言模型呢?很难。

首先,缺乏先发优势。创业公司能突破大公司的包围,核心原因就是你跑得快,有先发优势。要么是大公司没看上、没看懂或者走错方向了,所以创业公司能冲出来。但在大语言模型这块,这些情况都不成立,每个大公司都无比重视。

第二,没有Dummy Period。现在做大模型已经成为了共识,但是创业公司要想跑出来,那就得留有一定的非共识期来发育。

第三,缺乏场景。大公司都有很好的落地场景,比如百度可以把问答和搜索引擎结合,腾讯的语言模型可以和微信结合。但是创业公司有什么可落地的场景呢?

在垂直领域,创业的机会还是挺多的。我分成B端、C端、国内、国外四个方面来讲。

在国内做TO C的好处是什么呢?高爆发。在国内几个月做成几百万DAU是非常有可能的。但问题是什么呢?第一,壁垒低。你能做的,竞争对手也能做。第二,C端的流量红利没了。想想大家手机的首页APP已经有多久没更新过就知道了,几年都不会下载一个新应用。第三,巨头抄袭。你做了一个APP,那字节跳动、腾讯跟你做一个类似的,你怎么办?第四,合规成本高。做C端的大语言模型,用户问的问题是千奇百怪的,指不定哪个问题就违规了。第五,只能用国内的大模型。

在国内做TO B的好处是离钱近,壁垒相对高一些。但问题是,天花板低。在中国做TO B最大的痛苦就是企业的付费能力不好,这是受限于国内B端市场的规模。中国的IT Spending只有美国的六分之一,国内上市SaaS公司的人均产值只有30—60万人民币。所以在中国做企业服务就比较辛苦,核心原因就是民企没钱。

在国际做C端的好处是增长快,问题同样是壁垒低,而且市场已经是红海了。并且,即使是海外AIGC独角兽也面临巨头竞争。

在国际做B端的好处是海外企业付费好,天花板高。有垂直壁垒,巨头不会进入,而且国外的大模型相对更成熟。但问题是团队得懂海外的企业服务市场。

最后,我们在创业的时候,是AIGC+还是+AIGC呢?这两者的区别是你是用AIGC原生还是用AIGC赋能。比如要做一个客服系统,一个团队是之前就做AI的,先做好了问答机器人,再去添加客服系统的其他功能;另一个团队是本来就是做客服SaaS的,只不过之前的SaaS不是智能的而是人在后面回答,现在要把AI的自动回答功能加到已有的客服系统里去。

如何判断你更适合哪一种?第一个判断依据,如果公司70%的价值链都是AI,那么很显然就适合AIGC+的赛道。如果本身是SaaS,而AI只占到10%,那显然更适合+AIGC。第二个判断依据,看AI本身的技术壁垒怎么样。如果你选择AIGC+的赛道,那就必须补充业务工作流,完善价值链。未来,AIGC+和+AIGC一定会相互渗透的。

本文为直播专场分享整理内容,由人人都是产品经理运营 @Darcy 整理发布。未经许可,禁止转载,谢谢合作。

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。息存储空间服务。储空间服务。

标签:

最新
  • 世界头条:LLM/AIGC带来的创新机会

    2023年6月10日~11日,人人都是产品经理举办的【2023数字化产品经理大会

  • 儋州有发展吗,兆南熙园养优势讲解 热门

    儋州有发展吗,兆南熙园养优势讲解海南房价猛烈上涨,兆南熙园房价能涨

  • 线圈上市公司有哪些(2023/6/21)

    线圈上市公司有哪些(2023 6 21),线圈上市公司有哪些(2023 6 21)1、

  • 今日要闻!海南考生,这份普通高中学业水平合格性考试考前温馨提示请查收→

    商报全媒体讯(椰网 海拔新闻记者许文玉)近日,海南省考试局发布2023年

  • 安阳公交集团公司举办2023年安全生产月主题演讲比赛

    安阳公交集团公司举办2023年安全生产月主题演讲比赛,张洁,演讲比赛,安

  • 不止封杀老头乐!北京拟禁售加装车篷改装座位电动车:很危险

    快科技6月22日消息,此前北京已经宣布封杀“老头乐”,自2024年1月1日

  • 环球今头条!6月22日生意社MTBE基准价为7000.00元/吨

    6月22日,生意社MTBE基准价为7000 00元 吨,与本月初(7362 50元 吨)相

  • 全球最资讯丨沿途风景很美的句子

    1,趁我们都还年轻,多走几步路,多欣赏下沿途的风景,不要急于抵达目

  • 科思创或被阿布扎比国家石油公司以785亿人民币收购_天天滚动

    科思创或被阿布扎比国家石油公司以785亿人民币收购盖世汽车讯据外媒报

  • 韩国机上擅开应急舱门的乘客被检方逮捕起诉_全球观热点

    中新网6月21日电据韩联社报道,上月在一架准备降落韩国大邱机场的飞机

  • 天天观速讯丨液冷概念股震荡走高

    液冷概念股震荡走高,飞龙股份(002536)7天5板,英特科技(301399)涨超10

  • 快报:旋风管家第二季在线观看樱花动漫(旋风管家第五季)

    1、一周一集。TVB在星期六早上广播。时间是9点到10点。好像现在网上连

  • 南财基金通·混合型基金收益排行榜(6月16日) |世界热门

    南方财经6月19日电,根据南财基金通数据:2023年6月16日当日收益较高的

  • 某个旅人的日记_关于某个旅人的日记概略

    1、某个旅人的日记或る旅人の日记(又名:奇幻的异世界托鲁塔利亚的游

  • 假冒记者敲诈勒索超11万元,山西10名被告人均获刑

    庭审现场。山西省高级人民法院供图记者6月16日从山西省高级人民法院获

  • 天天新资讯:港股异动 | 蔚来-SW(09866)涨超7% ET5旅行版今日开启交付 系列有望贡献销量三成

    智通财经APP获悉蔚来SW09866再涨超7本周累涨逾20截至发稿涨705报767港

  • 旅游
    • 世界快播:烟台市莱山区院格庄中学开展垃圾分类宣传教育活动

    • 大连荣合地产底价5911万元竞得长兴岛近6万平米宅地使用权_焦点热讯

    • 制订计划和制定计划 制定计划还是制订计划_环球今日报

    • 我国首艘智能“海上油气加工厂”交付