灵魂拷问“京东言犀大模型” 究竟有啥不一样?

最新信息

灵魂拷问“京东言犀大模型” 究竟有啥不一样?
2023-07-13 22:47:00
K图 JD_0]
K图 09618_0
K图 89618_0
  继百度文心、阿里通义之后,姗姗来迟的京东言犀大模型可谓吊足了大家的胃口。
  在13日的2023京东全球科技探索者大会上,京东言犀大模型如约亮相。而与现有的千亿级通用大模型不同,言犀大模型成为京东“大模型基础设施能力”打造的样板间,其“源于产业,服务产业”的发展路径让大模型背后的“AI开发计算平台”更加引人瞩目。
  问:京东大模型这么晚才发卖什么关子?
  答:不能在“最后一公里”掉链子
  从2021年构建天琴超算集群开始训练大模型,到2022年百亿级大模型的雏形初成,京东集团技术委员会主席、京东云事业部总裁曹鹏一直被追问:“京东怎么还不发大模型?”
  对此,曹鹏的回答是——大模型不应该只是拿来聊天写诗作画的玩具,对话类的通用大模型不应该是全部,而这正解释了京东千亿级大模型“言犀”诞生的初衷。
  于京东而言,创造产业价值是大模型的目标。
  “大模型真正实现自己的价值,一定是在产业应用中。”京东集团CEO许冉亲自为京东大模型定调。她表示,大模型的价值=算法×算力×数据×产业厚度的平方。“如果大模型研发只在前三个指标发力,忽视了产业厚度,就好比电商在物流最后一公里掉链子,产品和服务满足不了消费者需求,再多努力也没用。对大模型来说,这产业落地的最后一公里,看起来并不遥远,却是能用和不能用的区别。”
  许冉坦言,过去的人工智能技术发展,曾经数次达到应用爆发的边缘,但最终往往昙花一现。技术没有在产业端形成扎实的应用,是重要的原因之一。“创造明确的价值应当是技术的目标。我们笃信:当产业效率和产业的边界拓展,得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。”她说。
  据介绍,与通用大模型相比,京东言犀大模型源于产业、服务产业,融合了70%通用数据与30%数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
  “供应链产业链上的大模型更有价值,因为供应链的链条越长,带来的数据相关性更高,相关性高的训练数据越多,模型越大,才越有可能产生产业端的智能涌现。同时这些模型更能切实解决实际场景中的问题,带来更好的经济和社会价值,也有助于模型获取更多的资源持续发展。”曹鹏坦言,言犀在训练时除了使用通用语料数据之外,还大量使用了京东各种场景积累的优质数据,可以说天然具有产业基因,能够更好地适配实体场景,解决真实的产业问题。
  而在言犀之外,京东更像是在通过大模型秀技术肌肉。早在2017年初,京东推出“技术、技术、技术”口号,开始人工智能的布局与落地。在2020年的JDD大会上,京东对外发布言犀智能应用平台。2021年,京东就推出十亿级模型K-PLUG,2022年推出百亿级模型Vega。
  7月13日,京东推出言犀大模型的同时,还发布了一套大模型的完整工具,包括支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。
  “京东的大模型技术演进,遵循了京东的技术追求:成本、效率、体验、可信、普惠、突破。成本、效率和体验是从京东的经营理念传承而来,也是零售的第一性原理。可信、普惠和突破则是技术服务于产业和社会的承诺。”许冉表示,“从产业切入大模型,这条路虽然难走,却如同从北坡攀登珠峰,有更波澜壮阔的风景,有巨大的探索价值。”
  问:如何深入产业、服务产业?
  答:三步走,刚刚走到第二步
  “言之有物,心有灵犀”,这是京东赋予“言犀大模型”的内涵。
  按照京东大模型的“三步走”策略:目前,京东云已经基于内部实践构建了通用大模型;到今年年底,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。
  京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬表示,京东的数据是“鲜活的”,京东平台每年产生数百亿的交互数据,这保证了模型的持续迭代和优化。
  “某种意义上,我们的大模型相当于既做了通识教育,又读了四年专业性的本科教育。”何晓冬表示,“目前大模型发展已经处于‘百花争艳’的状态,站在这个时间点,我们应该思考的不是技术追赶,而是产业突破。”据介绍,京东计划进一步将大模型聚焦于行业应用,包括在零售、物流、政务、金融等行业引入更多的行业知识,使大模型更好地沉淀并服务于行业需求。
  在大会现场,京东演示了多个将通用大模型转化为可用的“产业大模型”的实践案例。
  以大健康产业为例,通常,客户完成这套流程,从数据准备、模型训练到模型部署,需要10余名科学家花费一周时间。但利用言犀AI开发计算平台,只需要1至2名算法人员,在数分钟就能完成。通过平台模型加速工具的优化,还能节省90%的推理成本。
  京东健康发布的京医千询大模型,就是建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程医疗服务提供坚实的技术底座。
  此外,在金融财富管理场景中,目前京东机构基金代销系统中已经上线言犀有方模块,给机构客户提供更便捷的基金筛选和投研分析功能。
  问:大模型背后还有“野心”?
  答:解耦、输出,让AI成为新型基础设施
  在京东大模型的背后,言犀AI开发计算平台成为最受业界关注的产品。记者从京东方面了解到,为了降低企业享受大模型技术红利的门槛,京东把大模型的底层能力解耦出来,包括但不局限于算力、算法和数据,由此打造的“言犀AI开发计算平台”目前已启动预约注册,8月将正式对外使用。平台不仅提供京东自研的言犀大模型,也支持行业各类开源通用模型。这意味着,依托该平台,垂类行业大模型的开发门槛进一步降低,通用大模型的“长尾效应”有望被进一步释放。
  据曹鹏介绍,言犀AI开发计算平台沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,通过算法工具集成到平台,并部署了京东技术团队开发出的100多种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。不到一周时间,用户即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1至2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。
  此外,京东丰富的业务场景,可以为平台上的基础大模型提供具体的行业应用场景,促进入驻企业加速基于大模型的商业化落地。
  在高性能HPC方面,言犀大模型开发计算平台可提供GPU、CPU、IPU等各类型算力资源,可以针对推理速度、推理成本以及模型大小不同的业务需求,提供定制化解决方案。同时,平台还能为入驻企业提供大模型开发应用的各种硬件资源的支持。
  在大会现场,京东还宣布携手零售和金融行业伙伴,在零售场景探索供应链优化、顾客体验、营销降本增效等方面,以及金融场景探索金融客服、智能投顾、产品营销等方面,共建零售和金融行业的大模型创新应用。
  正如许冉所说:“京东发展大模型的旅程,注定会与产业伙伴携手同行。”唯有这样,才能让技术走出实验室和公司的围墙,真正推动社会和生产力变革,在产业场景发挥更大价值。
(文章来源:上海证券报·中国证券网)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

灵魂拷问“京东言犀大模型” 究竟有啥不一样?

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml