暂无
据天眼查,2023年上半年与大模型直接相关的融资事件超20起,国内已发布的各类大模型数量超过100个,呈现出“百模大战”的态势。
手机行业已经开始应用大模型。大模型在端侧以及云侧能力的加持,正在推动着手机加速体验上的革新。甚至有媒体表示,大模型与手机系统的深度融合,将会让手机成为一个新的物种。”
与手机行业相比,在新能源汽车行业,大模型“上车”也已成为趋势,同样一片火爆。
这是因为,作为一个较为垂直的领域,大模型在新能源汽车方面的应用更多。智能驾驶、智能座舱,乃至由此引发的商业模式改变,以及汽车研发,都有大模型应用的场景,这将助力汽车从交通工具属性快速升级为智能终端属性。
近期,广汽集团近日宣布正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,吉利汽车也表示首个全栈自研的全场景AI大模型将搭载在吉利银河L6上。而且,汽车供应链企业也纷纷涉足大模型,如商汤发布的日日新大模型;毫末智行发布了自动驾驶生成式大模型 DriveGPT——雪湖·海若,等等。
一些车企,不仅在技术上应用大模型,在商标上也已注册“GPT”相关标识。譬如,奇瑞新能源汽车注册了“ICAR GPT”商标,长城汽车注册了“长城汽车SPACEGPT”等商标,蔚来汽车、小鹏汽车也申请注册了GPT相关商标。
对于大模型在汽车行业的作用,业内人士更多地将其定位为“基础设施”。
近期,中国电动汽车百人会副理事长兼秘书长张永伟在《我国智能汽车发展的几个战略性问题》一文中提出,智能化阶段将需要更多的新型基础设施,其中就包括大模型。他指出,要依托智算中心打造汽车行业大模型。
一、大模型“上车”
目前所指的大模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。
此前的传统机器学习模型,规模较小,只能处理少量的数据,譬如,只能处理一种数据模态,例如文本、图像或音频。深度学习模型则可以包含数百万个参数,处理海量数据。而大模型可以达到百亿级别的参数,需要使用超级计算机进行训练。
又因为大模型能够更加准确地表达数据分布和学习到更复杂的特征,从而能提高决策的准确率。
Transformer架构是当前大模型领域主流的算法架构基础,由此形成了GPT和BERT两条主要的技术路线。在GPT3.0发布后,GPT逐渐成为大模型的主流路线。当前几乎所有参数规模超过千亿的大模型都采取GPT模式。
大模型将会在跨模态应用中发挥更加重要的作用,特别是在大场景下的表现能力十分突出。正在经历智能化、制造革新的“车”,就有不少可以展开无限想象的大模型应用场景。
具体来看,在新能源汽车领域,智能座舱是大模型最为便捷的应用场景。大模型在车内AI交流对话领域里的运用,可改变过去车载AI语音的智能程度普遍较弱,体验不好的情况。
如果说以前车主和AI助手之间是“命令关系”,车主布置任务,AI助手被动执行;那么,大模型的赋能下,两者之间将变成 “陪伴关系”,AI助手能主动和车主沟通,向人输出内容。譬如,如今的车载ChatGPT语音助手已经可以处理完整的对话,比如追问,并能保持对前后文的理解,形成较为良好的语音交互体验。
广汽方面已宣布,其AI大模型平台能更好地理解用户意图,实现更深层次的个性化和“类人”的交互,而且是个“移动百科”,上知天文下知地理。不仅有“超智慧”,而且有“高情商”,能改变了机械式的语音交互,将“一问一答”的形式升级为无门槛、直觉式的自然对话。
讯飞方面也宣布,其“星火认知”大模型与智慧座舱结合后,可以实现车内跨业务、跨场景人车自由交流。
二、或改变汽车业
如果延伸到整个产业层面,可预料大模型或将改变整个新能源汽车产业。
大模型不仅能改变智能座舱,提高其体验感,而且对目前如火如荼的智能驾驶也起到促进作用。对此,中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强就表示,大模型在处理文本、获取和加工数据、建立场景的训练和迭代方面的优势,将会对人机交互智能化和智能驾驶方面起到加速推动作用。
大模型能处理海量数据,且能提高模型的准确率和性能,这对智能驾驶作用很大。智能汽车本来就一个天然的数据制造者,路网、路况、环境、驾乘行为都是海量的数据,通过大模型对这些数据进行处理和多维度维度分析能力,不仅可以持续优化模型,而且可以提高智能驾驶的准确性和可靠性。
以往智能驾驶感知使用的都是各个小模型“堆叠”的方式,识别的原理就是自己先看,然后到知识库里进行比对,如果以前没有学习过,可能无法准确识别。而大模型的自学习算法能力在汽车自动驾驶过程中发挥的关键作用,主要体现在感知和决策层面,能够在处理路面复杂情况时具有推理能力,以及像人一样思考的能力。
因此,业内人士认为,被认为是自动驾驶算法终局的端到端感知决策一体化算法瓶颈,或许在汽车接入大模型之后可以得到有效解决,自动驾驶算法升级指日可待。
大模型对新能源汽车的研发方式和商业模式也会产生全新的影响。
在研发方式方面,由于机器的高效标注能力,使得需要一年时间的数据标注任务,现在只需要短短数小时,研发周期大幅缩短,而且多模态(视觉、语音、手势等)的丰富数据,更可以进一步提升总体的研发效能,降低研发成本。
理想汽车李想曾表示:“过去我们一年要做大概1000万帧的自动驾驶图像的人工标定,所以我们请了很多外包公司进行标定,大概6元到8元钱一张,一年的成本接近一个亿,这仅仅是来做自动驾驶方面的图片标定。但是当我们使用软件2.0的大模型,通过训练的方式进行自动化标定,结果和效果会非常可怕,过去需要用一年做的事情,基本上3个小时就能完成,效率是人的1000倍,这个领域的工作完全不一样了。”
对于汽车研发者来说,如何与大模型的学习能力、泛化能力协同,形成更有效率的研发方式,是当前核心课题之一。未来,大模型极有可能革新造车流程中的设计、工程和制造环节。
就商业模式而言,大模型通过智能座舱“上车”后,车载大模型通过人车互动,对“人”的喜好和习惯会更加了解,这必然会衍生出全新的商业价值。
三、开启百“模”大战
大模型在智能汽车领域的应用,目前已经成为整个泛汽车行业集体关注的焦点,很多车企都开始大模型“上车”的行动,甚至于,有媒体表示,大模型“上车”新竞赛已鸣枪。
近日,广汽集团宣布正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,吉利汽车也表示首个全栈自研的全场景AI大模型将搭载在吉利银河L6上。此前,理想汽车也发布了大模型算法MindGPT。在华为nova11 系列及全场景新品发布会上,余承东则宣布AITO问界M9将搭载AI大模型,同时小艺智慧助手将能够为用户带来业界比较强的车载AI体验。
除了车企,一些汽车供应链公司也开发大模型,譬如商汤发布的日日新大模型;毫末智行发布了大模型 DriveGPT——雪湖·海若。
车企不仅自主研发大模型外,还采取合作的方式来应用大模型。譬如,百度Apollo宣布长城汽车、亿咖通科技(排名不分先后)成为首批文心大模型智舱应用探索伙伴,在智能座舱和自动驾驶方面展开探索。吉利汽车、智己汽车、奇瑞新能源汽车等多家企业也表示,将与阿里云在大模型相关场景上展开技术合作。
车企应用大模型,不仅应用于智能座舱,而且已开始大模型在智能驾驶领域的探索,典型如小鹏汽车联合阿里的大模型打造自动驾驶AI智算中心“扶摇”,用于自动驾驶模型训练。小鹏汽车CEO何小鹏表示,“扶摇”是目前我国汽车行业最大的自动驾驶智算中心,为小鹏在全场景智能辅助驾驶系统的训练奠定了算力基础。毫末智行发布的“雪湖·海若”,就是业内首个自动驾驶生成式大模型。
车企对大模型的热衷,甚至于体现在商标注册上,譬如,奇瑞新能源汽车注册了“ICAR GPT”商标,长城汽车注册了“长城汽车SPACEGPT”等商标,蔚来汽车、小鹏汽车也申请注册了GPT相关商标。
在智能化下半场,有人将智能汽车看成一个“大号的手机”,因此车企在大模型领域的动作,可看成对新一代智能终端“入口”的争夺。不过,已有人表示,车企如此一窝蜂布局大模型,热度太过,有蹭热度的嫌疑。
目前大模型的热度已环比降低。根据网络分析公司Similarweb最新发布数据,6月ChatGPT全球访问量出现了推出以来的首次环比负增长,降幅达9.7%,而且1-5月,其环比增幅也逐渐下降。
四、定位“基础设施”
大模型过热的情况,不仅局限于汽车行业,近日北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军表示:“目前制约国内大模型行业发展的一点就是‘太热’”。
《中国人工智能大模型地图研究报告》显示,截至今年5月28日,中国10亿参数规模以上的大模型已发布79个。这是因为行业低水平重复与碎片化现象比较严重,这种现象会造成资源分散,很难形成重大影响的系统性突破。因此,黄铁军认为,业界应避免重复性发力,集中力量办大事。
百度创始人李彦宏早就公开表示:“创业公司重新做一个ChatGPT其实没有多大意义。我觉得基于这种大语言模型开发应用机会很大,没有必要再重新发明一遍轮子,有了轮子之后,做汽车、飞机,价值可能比轮子大多了。”
业内人士则表示,经过优胜劣汰,未来全球可能只有极少数的两三个大模型生态。
因此,应从基础设施的角度来看待大模型。金沙江创投董事总经理朱啸虎在朋友圈写道:“不要迷信通用大模型,因为明年GPT-3.5就成commodity(通用基础设施),而三年后,GPT-4也会是。”
对于汽车行业来说,大模型也只会成为行业基础设施。近期,中国电动汽车百人会副理事长兼秘书长张永伟在《我国智能汽车发展的几个战略性问题》一文中提出,智能化阶段将需要更多的新型基础设施,其中就包括大模型。他指出,要依托智算中心打造汽车行业大模型。
总之,大模型目前在智能座舱方面获得了较好的商业落地,使得智能座舱也将成为新能源汽车的一个重要卖点。未来,在智能驾驶层面,大模型的赋能将促进其快速发展;而大模型促进汽车研发,甚至引发全新的商业模式,都是可预料的。但是,这一切,或都建立在大模型“基础设施”这一定位上的。一窝蜂地搞大模型,甚至蹭热度,可能造车低水平重复、资源浪费。