王小川:大模型已有国产替代性 明年会有应用突破

最新信息

王小川:大模型已有国产替代性 明年会有应用突破
2023-12-28 19:22:00
2023年是三年新冠疫情防控转段后经济恢复发展的一年,我国经济回升向好,高质量发展扎实推进。
  随着全球经济的深度调整,2024年的中国经济站在了一个新的历史起点。中央经济工作会议定下了稳中求进的总基调,并指出,进一步推动经济回升向好需要克服一些困难和挑战。
  在中央经济工作会议等一系列工作的部署下,经济预期能否抬升?中国宏观经济政策出台如何有力更有效?明年乃至更长时间中国能否实现可持续增长?企业家们信心如何?
  值此新旧交替之际,贝壳财经推出年度专题报道“看2024”,携手中国知名经济学家、学者和企业家,建言中国经济,助力中国经济复苏与繁荣。
  今年中央经济工作会议为2024年中国经济发展指明方向,其中,“科技创新”被列为明年经济工作“头号任务”——要以科技创新推动产业创新,特别是以颠覆性技术和前沿技术催生新产业、新模式、新动能,发展新质生产力。
  作为今年全球科技前沿的生成式预训练大模型(下称:大模型),在我国经历了怎样的“从追赶到并跑”的研发之路?明年又将如何走向商业化应用,带动模式和产业的升级,形成新质生产力?
  为此,新京报贝壳财经记者采访百川智能创始人、首席执行官王小川。 “过去一年面对大模型的飞速发展,中国公司经历了恐慌期、投入期和迭代期,到目前为止,在某些方面尤其是开源模型领域,我们的产品是能够替代国外产品的。”王小川说。在他看来,国内很多大模型在技术层面已经对齐了GPT-3.5(生成式预训练模型),今年中国公司将更多精力放在了大模型本身,明年会开始在应用层面进行突破。
  对于用户期待的AI-native(人工智能原生)超级应用。王小川判断,这个应用不应该是新工具,而是新物种,是人类的伙伴,因此对超级应用的定义、方法论都应该有别于此前的要求。他透露,百川智能正在研发几款超级应用,主要针对健康、快乐、个人助理方向,计划于明年推出。
  对于提供面向企业级的服务,他认为让大模型的成本下降是前提。因此,应该从定制化逐渐走向产品化,“大模型+搜索增强”是他目前看好的方向,百川智能于近期推出的Baichuan2-Turbo系列API(应用程序编程接口)正是采用这个技术路径。
  王小川预计,未来能做ToB(面向企业级的)的参数较大的模型,同时还能做ToC(面向消费者)的超级应用公司不会有很多家,最后国内这样的玩家在五家左右。
  大模型变革,中国公司有弯道超车机会
  贝壳财经:中央经济工作会议提到推动经济实现质的有效提升和量的合理增长,百川智能在这方面有何具体计划和策略?
  王小川:大模型是工业革命一样的变革,不仅将重塑现有行业,还将基于通用智能创造出前所未有的价值。大模型既是经济质的有效提升的催化剂,也是经济量的合理增长的助推剂,将成为引领下一个经济增长周期的核心力量。
  百川智能将持续加大在大模型基础技术上的投入,积极探索更多技术突破。还将更好地助力产业生态建设,推动国内大模型生态更丰富、更多元、更完善。最大限度地为中国经济发展贡献自己的力量。
  贝壳财经:今年是中国大模型的元年,技术迭代非常迅速,这一年经历了哪些重要节点?
  王小川:现在总体来讲,可分成三个阶段:第一个阶段是恐慌期,OpenAI(美国的人工智能企业)有了ChatGPT(一款大语言模型)后,美国的数据飞轮先跑起来了,大家开始讨论是不是通用人工智能时代要来了?第二个阶段,大家开始火热地工作,不断有人关注到这个领域,我也在这个阶段做了百川智能。第三个阶段,学术进展很快,我们的技术人员每天都要跟进最新的论文和资讯,不断迭代、改进,行业的发展速度其实超出了外界、媒体和资本圈的看法,目前还在快速迭代中。
  贝壳财经:从技术角度看发生哪些变化?
  王小川:有两个特点。第一,开始大家觉得美国跑得很快,后来国内不同公司的模型开始出现,在有些场景里,国内的大模型比GPT-3.5甚至GPT-4还会好一点。尤其在开源的模型里,我们在某些方面是能代替美国产品的。百川智能跑得也很快,6月份发布了第一款模型,7月份发布第二款,8月份发布500亿参数模型,一直在往前进行中。
  第二,现在大家追赶的核心,还是集中在文本领域,文字代表了智力化水平。我们认为在追赶智力的过程中,把文本放在第一位的公司,是长远的。今天如果哪家公司考虑音频、图像、视频等,反而不是在追赶智力的道路上,因为OpenAI到GPT-4阶段才开始做多模态这件事。
  我预计,中国公司未来有弯道超车机会,所以我认为文本的追赶是最应该关注的事情,包括长窗口、大参数量级等。而多模态是离应用最近的一件事,往应用走的时候,反而多模态是可以用更小(参数量级)的模型来推动。
  从追赶到并跑,明年应用层面将有所突破
  贝壳财经:你提到我国大模型在某些方面可以替代国外产品,在技术、应用层面,取得了哪些实质性进展?
  王小川:在技术层面,现在我国可以和LLaMa-2(Meta AI发布的开源大模型)对标的大模型越来越多了,我们希望在开源领域做到引领,现在至少已经能对齐了。这是今年9月份(Baichuan2)就已经做到的事情,我们希望在开源领域,把中国开源模型的能力立住。到年底,我觉得对齐GPT -3.5的能力是有的。我们跟美国还有距离,但不是0和100的区别,不管在开源、闭源领域,中国(大模型)都有一定的国产替代性。
  在应用领域,今年是中国大模型发展的元年,明年中国各家公司都会有相应的成绩出来。今年大家太需要把精力放在模型本身,我认为应用在现在还是在初期,明年就会差不多了。
  贝壳财经:从年初开始,国内“百模大战”已有约一年时间,是否出现了行业洗牌?
  王小川:说实话,我没有太关注这件事。我觉得现在既能做ToB(面向企业级的)参数比较大的模型,还能做ToC(面向消费者)超级应用的公司没几家,最后能剩下的玩家也就五家左右。
  B端服务会是一个漫长的过程,我们对C端产品也非常看重。我们在C端正在研发几款关键的超级应用,预计明年推出,主要针对健康、快乐、个人助理方向。
  贝壳财经:AI-native(人工智能原生)的超级应用是什么样的?
  王小川:以前我们更多的是造工具,不管是造火车、计算器,还是电脑,我们希望它能用精确的方式互动,提高工作、生活效率。如今,我们造的是一个新物种,是一个人类的伙伴,对伙伴的要求和对工具的要求是不一样的,人类要接受它的缺点、优点。所以我认为,在大模型时代里,我们对它(超级应用)的定义、方法论要有别于之前。
  贝壳财经:在ToC领域比较看好健康、快乐、个人助理方向,ToB哪些行业会比较先落地?
  王小川:最好把ToB业务行业化、场景化。有两个最贴切的方向,一个是有大量文本数据需要处理的,需要把文字的行业Know How(技术诀窍)进行归纳总结的场景。另一个是需要跟客户沟通,回答对方问题的,比如客服的场景。这两个场景比较能集中发挥大模型无限供给能力。
  让企业客户“直接吃猪肉”,要从定制化转向产品化
  贝壳财经:年初很多企业希望下场做大模型,或者精调自己的行业大模型,现在为什么大都转向与通用大模型厂商合作?
  王小川:有个很简单的比喻,假设我们都是养猪的,有些没吃过猪肉的人,之前会考虑自己也要养猪,现在他们直接吃猪肉就行了。能让企业客户“直接吃猪肉”,要建立在成本下降的前提下,要从定制化转向产品化。之前,企业自己做行业大模型,需要招聘AI(人工智能)算法人员,购买GPU(图形处理器)芯片,用一两个月时间训练大模型,花费少则几十万元,多则几百万元。使用百川智能的“大模型+搜索增强”服务后,企业不再需要这些额外成本,用原有技术就可以定制一个自己的大模型。
  贝壳财经:如何解决大模型出现幻觉、时效性差、专业知识不足等问题?
  王小川:“大模型+搜索增强”是大模型时代的新计算机,大模型类似于计算机的CPU(中央处理器),通过预训练将知识内化在模型内部,然后根据用户的Prompt(提示词)生成结果。上下文窗口可以看作计算机的内存,存储了当下正在处理的文本,互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。
  业内大部分企业探索了长上下文窗口和向量数据库两种较好的路径。百川智能将向量数据库升级为搜索增强知识库,通过搜索增强技术,提升大模型获取外部知识的能力,并把搜索增强知识库和超长上下文窗口结合,让模型连接全部企业知识库以及全网信息。
  百川智能的长上下文窗口能力在行业内处于领先的水准。我们在10月30日发布的Baichuan-192K大模型的上下文窗口长度为当时全球最长,能够一次性输入35万汉字。12月19日,我们将业内领先的超长上下文窗口和搜索增强知识库融合,对行业开放了基于搜索增强的Baichuan2-Turbo系列API(应用程序接口),包括Baichuan2-Turbo-192K 和Baichuan2-Turbo两个版本。开放之后,所有API用户都能上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。这能替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求。
  贝壳财经:有观点认为这次大模型热和2016年的AI热很像,会最终走向偃旗息鼓,你怎么看?
  王小川:这次跟上次不一样,上一波由于模型能力不够通用,主要在做图像处理。这带来两个问题:其一,大家都挤在同一个赛道里,集中跑去做安防,不能赋能千行百业。而且当时的技术也不像今天这样,可以通过微调、精调或者搜索增强,进一步降低企业的使用成本。
  其二,由于赛道很窄,每个项目都很重。现在美国证明大模型在很多行业都可以做,而且现在的实施成本会比2016年低很多,所以这一波我觉得是可行的。
  同题问答
  贝壳财经:中央经济工作会议强调了科技创新在推动高质量发展中的重要性。你所在的人工智能领域又是科技创新最为日新月异的行业,2024年你有哪些科技创新的计划或策略?
  王小川:中央经济工作会议强调,要大力推进新型工业化,发展数字经济,加快推动人工智能发展。
  大模型是人工智能领域的颠覆式变革,不仅对人工智能产业的创新发展非常重要,其技术外溢效应还将覆盖千行百业,对高质量发展有良好的助力作用。
  百川智能致力于通过语言AI的突破,构建中国最优秀的大模型底座,希望通过大模型技术突破和应用创新更好地赋能各行业的智能化转型,充分发挥人工智能在助力高质量发展中的积极作用。
(文章来源:新京报)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

王小川:大模型已有国产替代性 明年会有应用突破

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml