小i机器人CEO袁辉：大模型竞赛是一场马拉松当下不存在“重复造轮子”

最新信息

2023-07-01 16:40:00

　　ChatGPT发布以来，国内涌现了大模型创业热潮。
　　据机构不完全统计，目前中国10亿参数规模以上的大模型已发布79个。
　　专注于智能机器人技术研究和开发的小i机器人也官宣进入大模型竞争。
　　6月29日，小i机器人发布的产品为小i“华藏”大模型，据称，其特点是“可控、可定制、可交付”。按其规划，将于3个月实现模态多样化，构建华藏生态体系；在6个月实现语种全覆盖，落地国际市场应用；在12个月，实现面向全球生态开源，颠覆传统商业模式等。
　　众所周知，当下制约大模型发展的因素之一就是算力，而在发布会上，小i机器人特别介绍了其大模型产品的最低算力成本为10万元人民币。
　　对算力成本“明码标价”让“华藏”的发布颇有看点。不过，在当下这个大模型产品如雨后春笋般诞生的市场，观众也不免有这样的疑问：相比其他大厂，小i机器人的大模型有何壁垒？未来的大模型产品究竟会朝哪个方向发展？
　　发布会后，小i集团董事局主席兼CEO袁辉接受了包括21世纪经济报道记者在内的媒体采访，解答有关大模型发展的各种疑问。
　　“单纯强调参数规模没意义”
　　GPT-3发布时，其庞大的参数量让市场侧目，据介绍，其拥有超过1750亿参数，是当时世界上最大的语言模型。一般认为，模型的思维推理能力与模型参数大小有正相关趋势。
　　此后，国内大厂的大模型纷纷发布，多个产品公布的参数已接近或超越GPT-3水平，达到千亿级参数，百度“文心一言”大模型则达到2600亿参数。
　　不过，在小i“华藏”大模型的发布中，记者并未发现其公布其参数量。在袁辉看来，“单纯地强调参数规模没有意义。”
　　其在受访时表示，“GPT4已经不宣布参数规模了，因为GPT4相比GPT3.5迭代效率已大幅度锐减。今天我们也都不谈论‘华藏’模型所谓的参数规模，即便是一千亿、一万亿的参数，只是一个单一维度，只有算法+数据+算力+参数规模，才是大模型能力形成的结果。”
　　参数之外，袁辉多强调的是“华藏”可控、可定制、可交付的特点。
　　小i机器人对此的解释是，“可控”即在意识形态、法律法规、算力算法、文化价值观、伦理道德等方面做到可控，包含国家层面的数据安全可控，以及企业层面的内容输出可控等。“可定制”主要体现为根据客户的需求进行定制，包括模型定制，内容定制，组件定制，场景定制等。“可交付”表现为大模型具有低算力成本、低部署成本、低训练成本等特点。
　　在解释“可交付”特点的过程中，当袁辉宣布“华藏”最低的算力成本为10万元时，受到了来自现场观众的欢呼。袁辉表示，“‘华藏’有非常低的训练成本，有低成本的算力，最终可以去实现真正可交付落地的能力。”
　　与众多大模型一样，“华藏”基于自然语言处理技术，可以自动学习语言规则和语义，从而生成高质量的自然语言文本，比如可以撰写高考作文、可以解答数学方程、可以撰写唐诗。另外通过组件的扩展，还可以提供政企客户中业务场景的动态数据查询、分析和总结等。
　　同时，“华藏”的定位是通用大模型，可以适用于金融、政府、医疗、建筑、文旅等多元领域的应用场景，如智能服务、数智营销、数据洞察、自动生产、经营风控、组织管理等。
　　“我们要做中国通用的、基础的大模型平台，并不是在某一行业或场景做垂直应用的大模型平台，这固然也很重要。但中国如果没有通用的基础大模型平台，仍然只能做一个个应用厂商。”袁辉说。
　　“大模型竞赛是一场马拉松”
　　随着大厂纷纷涌入大模型赛道，市场也有这样的疑问：是不是大家都在“重复造轮子”，即存在重复建设？
　　在发布会上，多位人工智能专家也谈及这个话题。上海市智慧城市发展研究院院长盛雪锋表示，不如让“让子弹再飞一会儿”。他认为，“如果将当下大模型领域的竞争类比移动互联网时代，后者的决胜期也不在第一年。当下全球涌现了170多个大模型，中国有100多个，大家都在‘造轮子’。但如果从一个大的时代看，这种说法可能过于着急了，我们其实需要更多地打磨基础内容。”
　　同时，他也呼吁大家不要“各自造轮”，“可以相对形成一些合力，造一个更大的、可以一起用的轮子。” 在商业落地上，他建议企业、政府和行业协会一起共建更加优质的语料库，建议更多垂直行业可以更开放地适用大模型。
　　作为参与者，袁辉如何看待这个问题？
　　在受访时，他对此表达了否定。他认为，100多个大模型对中国来说还是一个小数，大模型底座和基座最终将由中国人完成，所以更多家企业参与都不为过。
　　“而且在这100多家中，大部分正在开发垂类应用，成千上万的垂类模型，基于这个基座都会重新刷新，所以不存在重复造轮的问题。就算这100家全部做底座、基座，在这个阶段也不是坏事，因为最终要有人跑出来，何况现在的情况还不是。”
　　他在回复21世纪经济报道记者有关“如何看待国内涌现的大模型创业潮”的提问时，将当下大模型的竞争比喻成一场马拉松。
　　“无数人拿到了马拉松竞赛的资格，因为它是一个大众的运动，现在发令枪响了，乌泱泱的人都开始跑了，很快就会显示出哪些是群众演员、哪些是真正的参赛者。马拉松前面一公里根本看不到谁像赢家，但过了十公里之后就会看到第一梯队已经形成。”他说，“GPT发布后，全球的开源社区都在尽量地降低大模型成本，同时也有很多开源的成果，这些成果很容易让普通参赛者申请到，大家都可以勇于参与。但大模型真正的成功在于构建一个新的商业生态，秀几个demo毫无意义，冠军只有一个。”
　　袁辉也坦言大模型面临的挑战，比如算力短缺。“宏观上看，全世界每家公司都面临算力短缺的问题。为什么说大模型的竞争现在基本上不是创业公司能参与的赛道了？因为它是一个军备竞赛，很多公司在资源不足的情况下，根本无法参与基础大模型竞争。我们迫切需要算力，希望算力有更大规模提升。”
　　但不得不承认的是，算力短缺或还会持续一段时间。“会持续相当的时间。”袁辉说，“第一算力本身有提升的问题，第二是算力性能问题，第三是规模问题，第四是能源问题。今天算力很大的瓶颈，其实是能源问题：电力不够、清洁能源不够。从能源的角度来讲，如何更有效地匹配、发挥效率，也恰恰需要人工智能进行调优迭代。”
（文章来源：21世纪经济报道）

免责申明： 本站部分内容转载自国内知名媒体，如有侵权请联系客服删除。

小i机器人CEO袁辉：大模型竞赛是一场马拉松 当下不存在“重复造轮子”

最新信息

小i机器人CEO袁辉：大模型竞赛是一场马拉松 当下不存在“重复造轮子”

小i机器人CEO袁辉：大模型竞赛是一场马拉松当下不存在“重复造轮子”

小i机器人CEO袁辉：大模型竞赛是一场马拉松当下不存在“重复造轮子”