小i机器人CEO袁辉:大模型竞赛是一场马拉松 当下不存在“重复造轮子”

最新信息

小i机器人CEO袁辉:大模型竞赛是一场马拉松 当下不存在“重复造轮子”
2023-07-01 16:40:00
K图 AIXI_0
  ChatGPT发布以来,国内涌现了大模型创业热潮。
  据机构不完全统计,目前中国10亿参数规模以上的大模型已发布79个。
  专注于智能机器人技术研究和开发的小i机器人也官宣进入大模型竞争。
  6月29日,小i机器人发布的产品为小i“华藏”大模型,据称,其特点是“可控、可定制、可交付”。按其规划,将于3个月实现模态多样化,构建华藏生态体系;在6个月实现语种全覆盖,落地国际市场应用;在12个月,实现面向全球生态开源,颠覆传统商业模式等。
  众所周知,当下制约大模型发展的因素之一就是算力,而在发布会上,小i机器人特别介绍了其大模型产品的最低算力成本为10万元人民币。
  对算力成本“明码标价”让“华藏”的发布颇有看点。不过,在当下这个大模型产品如雨后春笋般诞生的市场,观众也不免有这样的疑问:相比其他大厂,小i机器人的大模型有何壁垒?未来的大模型产品究竟会朝哪个方向发展?
  发布会后,小i集团董事局主席兼CEO袁辉接受了包括21世纪经济报道记者在内的媒体采访,解答有关大模型发展的各种疑问。
  “单纯强调参数规模没意义”
  GPT-3发布时,其庞大的参数量让市场侧目,据介绍,其拥有超过1750亿参数,是当时世界上最大的语言模型。一般认为,模型的思维推理能力与模型参数大小有正相关趋势。
  此后,国内大厂的大模型纷纷发布,多个产品公布的参数已接近或超越GPT-3水平,达到千亿级参数,百度“文心一言”大模型则达到2600亿参数。
  不过,在小i“华藏”大模型的发布中,记者并未发现其公布其参数量。在袁辉看来,“单纯地强调参数规模没有意义。”
  其在受访时表示,“GPT4已经不宣布参数规模了,因为GPT4相比GPT3.5迭代效率已大幅度锐减。今天我们也都不谈论‘华藏’模型所谓的参数规模,即便是一千亿、一万亿的参数,只是一个单一维度,只有算法+数据+算力+参数规模,才是大模型能力形成的结果。”
  参数之外,袁辉多强调的是“华藏”可控、可定制、可交付的特点。
  小i机器人对此的解释是,“可控”即在意识形态、法律法规、算力算法、文化价值观、伦理道德等方面做到可控,包含国家层面的数据安全可控,以及企业层面的内容输出可控等。“可定制”主要体现为根据客户的需求进行定制,包括模型定制,内容定制,组件定制,场景定制等。“可交付”表现为大模型具有低算力成本、低部署成本、低训练成本等特点。
  在解释“可交付”特点的过程中,当袁辉宣布“华藏”最低的算力成本为10万元时,受到了来自现场观众的欢呼。袁辉表示,“‘华藏’有非常低的训练成本,有低成本的算力,最终可以去实现真正可交付落地的能力。”
  与众多大模型一样,“华藏”基于自然语言处理技术,可以自动学习语言规则和语义,从而生成高质量的自然语言文本,比如可以撰写高考作文、可以解答数学方程、可以撰写唐诗。另外通过组件的扩展,还可以提供政企客户中业务场景的动态数据查询、分析和总结等。
  同时,“华藏”的定位是通用大模型,可以适用于金融、政府、医疗、建筑、文旅等多元领域的应用场景,如智能服务、数智营销、数据洞察、自动生产、经营风控、组织管理等。
  “我们要做中国通用的、基础的大模型平台,并不是在某一行业或场景做垂直应用的大模型平台,这固然也很重要。但中国如果没有通用的基础大模型平台,仍然只能做一个个应用厂商。”袁辉说。
  “大模型竞赛是一场马拉松”
  随着大厂纷纷涌入大模型赛道,市场也有这样的疑问:是不是大家都在“重复造轮子”,即存在重复建设?
  在发布会上,多位人工智能专家也谈及这个话题。上海市智慧城市发展研究院院长盛雪锋表示,不如让“让子弹再飞一会儿”。他认为,“如果将当下大模型领域的竞争类比移动互联网时代,后者的决胜期也不在第一年。当下全球涌现了170多个大模型,中国有100多个,大家都在‘造轮子’。但如果从一个大的时代看,这种说法可能过于着急了,我们其实需要更多地打磨基础内容。”
  同时,他也呼吁大家不要“各自造轮”,“可以相对形成一些合力,造一个更大的、可以一起用的轮子。” 在商业落地上,他建议企业、政府和行业协会一起共建更加优质的语料库,建议更多垂直行业可以更开放地适用大模型。
  作为参与者,袁辉如何看待这个问题?
  在受访时,他对此表达了否定。他认为,100多个大模型对中国来说还是一个小数,大模型底座和基座最终将由中国人完成,所以更多家企业参与都不为过。
  “而且在这100多家中,大部分正在开发垂类应用,成千上万的垂类模型,基于这个基座都会重新刷新,所以不存在重复造轮的问题。就算这100家全部做底座、基座,在这个阶段也不是坏事,因为最终要有人跑出来,何况现在的情况还不是。”
  他在回复21世纪经济报道记者有关“如何看待国内涌现的大模型创业潮”的提问时,将当下大模型的竞争比喻成一场马拉松。
  “无数人拿到了马拉松竞赛的资格,因为它是一个大众的运动,现在发令枪响了,乌泱泱的人都开始跑了,很快就会显示出哪些是群众演员、哪些是真正的参赛者。马拉松前面一公里根本看不到谁像赢家,但过了十公里之后就会看到第一梯队已经形成。”他说,“GPT发布后,全球的开源社区都在尽量地降低大模型成本,同时也有很多开源的成果,这些成果很容易让普通参赛者申请到,大家都可以勇于参与。但大模型真正的成功在于构建一个新的商业生态,秀几个demo毫无意义,冠军只有一个。”
  袁辉也坦言大模型面临的挑战,比如算力短缺。“宏观上看,全世界每家公司都面临算力短缺的问题。为什么说大模型的竞争现在基本上不是创业公司能参与的赛道了?因为它是一个军备竞赛,很多公司在资源不足的情况下,根本无法参与基础大模型竞争。我们迫切需要算力,希望算力有更大规模提升。”
  但不得不承认的是,算力短缺或还会持续一段时间。“会持续相当的时间。”袁辉说,“第一算力本身有提升的问题,第二是算力性能问题,第三是规模问题,第四是能源问题。今天算力很大的瓶颈,其实是能源问题:电力不够、清洁能源不够。从能源的角度来讲,如何更有效地匹配、发挥效率,也恰恰需要人工智能进行调优迭代。”
(文章来源:21世纪经济报道)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

小i机器人CEO袁辉:大模型竞赛是一场马拉松 当下不存在“重复造轮子”

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml