文|星晖编|石灿很久不见这般热闹的春天。随着ChatGPT的威名席成交量全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。有趣的是,在这些大模
文|星晖
编|石灿
很久不见这般热闹的春天。
随着ChatGPT的威名席成交量全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。
有趣的是,在这些大模型产品初入历史舞台之时,带给世人的第一印像其实不是以亿为单位的参数规模,也不是那些遍布英文缩写的模型特徵。
事实上,人们第一眼见到的只是名字。具体来说,是一个又一个奇特甚至稍显玄奥的词组。
文心一言、通义千问、日日新、知海图、天工、星火……数不清的互联网新词跃出水面,于众声喧哗间搅动产业风云。
在普罗大众真正体味到科技革命之前,先行的名称已经开启了一场无声的较量。
刺猬公社制
图源网络
从命名角度看,“知海图”带有鲜明的企业文化烙印,它既呈现出知识图谱的功能面貌,又像借助海图遨游知识汪洋,如同古时远征。再回看发现大会上知乎CTO李大海的发言,他用“船长”一词称呼周源,更是让这关于大航海的比喻平添声色。
4、混元——腾讯
腾讯系的AI大模型名为“混元”。
4月21日,腾讯对外披露混元AI大模型的研发进展,宣布混元在五大跨模态视频检索数据集榜单中先后取得第一名的傲人成绩。据悉,混元基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
太极、混元,这些词彙放在一起体系分明。道家有云,混元即无极,无极生太极,太极生两仪,两仪生四象,四像生八卦,八卦衍万物……
从万物衍生的学说中,腾讯找到了自家AI大模型的文化锚点。
5、玉言/子曰——网易
2023年1月,网易伏羲中文预训练大模型“玉言”系列登顶中文语言理解测评基準CLUE分类任务榜单,在多项任务上超过人类水平。据悉,其自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等多个领域。
在汉语中,“玉言”是指对别人所说话的敬称,常见于成语“金口玉言”。网易伏羲以此命名大模型,与自然语言处理的核心任务相契合,且不失古韵。
另外,天眼查App显示,网易有道申请注册多个“有道子曰”商标。有消息称,网易有道自研的教育场景下类ChatGPT模型将于近期推出,模型名称为“子曰”。
结合“AI英语口语老师”和“中文作文批改”等内测项目来看,“子曰”意在还原古代学子对先贤、老师的尊称,专门适配教育场景,技术上是大模型垂直应用的一次探索,命名亦是如此。
6、言犀——京东
4月8日,京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上表示,京东计划在今年发布新一代产业大模型言犀。言犀将是京东版ChatGPT,预训练参数规模达到千亿级,人工审核通过率超过95%,生成文字超30亿。
事实上,“言犀”对京东来说不算是新词。早在2020年11月的京东全球科技浏览器大会上,“言犀”就曾作为京东智能客服品牌名称被正式发布。
彼时,京东将“言犀”一词解读为“言下之意,心有灵犀”——对于智能客服来说,这或许就是沟通交易所的理想境界。而如今升级壮大的言犀产业大模型,想必也会延续当初这份“心有灵犀”的憧憬。
7、天工——崑仑万维
4月17日,崑仑万维正式发布大语言模型“天工”,并宣布启动邀请测试。
天工由崑仑万维与奇点智源联合研发,通过自然语言与用户进行问答式交互,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。其算力基于国内最大的GPU集群之一,採用了千亿预训练基座模型和千亿RLHF模型。
“天工”一词与“人工”相对,指向天然形成的工巧。成语“巧夺天工”多用以形容技艺高超、胜过天然。放在现代大语言模型的语境里,天工便是对AI智能的极致褒扬,以人力造物媲美天然智巧。看得出,崑仑万维对自家旗下的双千亿模型满怀信心。
8、星火——科大讯飞
4月24日,科大讯飞宣布讯飞星火认知大模型将在5月6日举行成果发布会。
官方信息披露,通过海量文本、代码和知识的学习,星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,号称“懂你所言,答你所问,创你所需,解你所难,学你所教”。
与这一串排比相呼应的,是微渺的“星火”一词。 “星火”本意是大火的火星或一瞬即逝的光,容易联想到的成语是“星火燎原”,指起初力量弱小但生命力旺盛的事物会迅速发展壮大。
科大讯飞以此命名大模型,应当是取其燎原壮大之势,与当今AI智能的高速迭代互文。毕竟,你我都正见证大火燃起。
9、书生/日日新——商汤科技
3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”。
书生大模型的初版由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月共同发布,并持续联合研发。官网信息显示,最新的书生2.5致力于构造多模态多任务通用模型,可接收处理各种不同模态的输入,并採用统一的模型架构和参数处理各种不同的任务。
书生2.5处理複杂任务,图源商汤科技官网书生2.5处理複杂任务,图源商汤科技官网
看完那豪华的联合研发阵容,“书生”这个名字也就不显得突兀了,它首先恰如其分地展示了模型背后的学院派背景。其次,书生作为中国传统文化中最典型的学子形象,在“寒窗苦读”的叙事里意味着长久苦读、不断进益,这和AI模型不断进化的历程相吻合。
4月10日,在书生2.5发布还不到一个月的时候,商汤科技再度公布了“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
针对这个名称,商汤科技联合创始人徐立表示:“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为’日日新SenseNova’,寓意’苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”
“日日新”显然延续了“书生”举一反三、持续学习的特质,并进一步强调了自我革新的价值。面临全球AI竞争加剧的大环境,恐怕的确只有日新月异的进步速度,才能在群雄并起时杀出血路。
10、紫东太初——中科院自动化研究所
2021年7月,虚拟人“小初”在世界人工智能大会亮相,展示了图(视觉)、文(文本)、音(语音)三种模态的智能转换和生成。这样的表现得益于跨模态通用人工智能平台“紫东太初”,由中国科学院自动化研究所研发。
图源网络
紫东太初是全球首个图文音三模态预训练模型,同时具备跨模态理解与跨模态生成能力。中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。
起步早、技术硬的紫东太初,顶着一个硬核程度不遑多让的名字。所谓“太初”,是哲学概念中的起始状态。追溯古籍,《列子·天瑞》说:“太初者,气之始也。”《庄子·知北游》里写:“外不观乎Cosmos,内不知乎大初。”前者在讲天地未分前的混沌之气,后者谈的是道之本源,若是拿来注解大模型的开拓性或蓝图,似乎都说得通。
在接受观察者网採访时,中科院自动化研究所所长徐波曾回应过关于“紫东太初”名称内涵的提问,他说道:“相当于人工智能走向人类智能的一个混沌初开之际,也是感知智能走向通用智能重要的第一步。”
11、悟道——智源研究院
2021年6月,智源研究院学术副院长唐杰正式发布了“悟道2.0”人工智能模型。
当时,悟道2.0以1.75 万亿的参数量打破了谷歌Switch Transformer预训练模型创造的1.6 万亿参数记录,一举创下全球最大预训练语言模型纪录。这之后,悟道大模型持续发展,奠定了智源研究院在中国人工智能领域的重要地位。
“悟道”作为名称,字面上是指领会道理。关键在于,“道”之一字具备丰厚的文化底蕴,既是中国人文智慧的结晶,也是极深奥的考题,千百年来不知曾有多少人苦苦求索一生。
在新时代,让AI悟道,去理解人力难尽之谜,是一场关于人工智能的、真正浪漫的想像。
12、雪湖·海若——毫末智行
4月11日,北京自动驾驶企业毫末智行发布了首个自动驾驶生成式大模型DriveGPT,中文名叫做“雪湖·海若”。据介绍,雪湖·海若未来将逐步应用到城市智能辅助驾驶、捷径推荐、智能陪练以及脱困场景中。
乍一看,人们可能不会想到,这个名字实际上和公司名渊源颇深。 “海若”一词出自《庄子·秋水》,河伯请教北海若如何区分事物大小,北海若的回答中有这样一句话:“知天地之为稊米也,知毫末之为丘山也”。
以此为引子,毫末智行把大模型的中文名定为“雪湖·海若”,大略是要表达多智包容之意。看似晦涩的名字背后,愿景倒并不复杂。
B、旧时姓名
第二个大流派很直接,不需要考据字词出处,因为命名直接取用了中国人民无比熟悉的名讳。传奇与史话中的古老代称被重新拾起,冠以21世纪的摩登内涵。
13、盘古——华为
2021年4月,华为云CEO余承东在HDC华为开发者大会上公布了华为云盘古系列AI大数据模型。
两年过去,乘着ChatGPT的东风,耕耘已久的“盘古”重回大众视野。有网友注意到,在华为云官网,NLP大模型、CV大模型等盘古系列AI大模型均呈现即将上线的状态。
盘古的故事不需赘述,其创世神地位给AI技术的革命性再添一笔注脚。与此同时,华为云旗下还有开天aPaaS服务,命名思路与盘古一脉相承,开天闢地的豪气溢于言表。
14、曹植——达观数据
3月,人工智能企业达观数据对外宣布,该公司研发团队正在积极探索大语言模型(LLM)的实践,研发国产版GPT“曹植”系统。
据官网介绍,“曹植”是垂直、专用、自主可控的国产版ChatGPT模型,能够实现专业领域的AIGC智能化应用,且可内置在各类业务系统中提供专用服务。
中国人对三国时期文学家曹植的认知,与他“七步成诗”的典故紧密相关,这大概也正是达观数据如此命名的缘由。想像一下,当AI大模型以空前高效的姿态生成内容,那绝世才学岂不就是当代的“七步成诗”?
图源达观数据官网
15、孟子——澜舟科技
3月14日,认知智能公司澜舟科技宣布完成Pre-A+轮融资。澜舟科技创始人周明在北京创新工场总部宣布,澜舟科技推出孟子对话大模型(MChat)。
据官网介绍,孟子对话大模型(MChat)是一个面向对话场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务。
在澜舟科技成立一周年之际,周明曾写过一封公开信,其中解释了“孟子”命名的来由。他说:“《孟子》有云:’以力服人者,非心服也,力不赡也。’这恰好代表了我们认为’模型不能一味追求大’的观点和轻量化模型的技术追求。”
简而言之,“孟子”是澜舟科技探索轻量化模型的一面旗帜,先人之言迴响至今。
16、凤凰——香港中文大学
凤凰(Phoenix)大语言模型来自香港中文大学(深圳)和深圳市大数据研究院的王本友教授团队。
研发团队将多语言的大模型命名为“凤凰”,即百鸟之王。在中国传统文化中,凤凰是祥瑞尊贵的神兽,有百鸟朝凤之荣光。同时,紫金凤凰本就是香港中文大学(深圳)的校徽图腾,能够代表开发团队的背景信息。
作为大模型的凤凰应对解读多种语言,就如同神鸟聆听百雀争鸣,想来也是一幅妙趣横生的图景。
C、功能本位
第三大流派主打一个“朴实无华”,用最简单的字眼让人听懂掌声。对它们最好的解释,也许就是不做解释。
17、360智脑——360
4月9日,360官方正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将于4月中旬面向企业用户开放内测。未来,360智脑计划与浏览器、数字助理、智能营销等场景应用结合。
在360创始人周鸿祎口中,360智脑还是“刚出生的孩子”,不过名字本身倒是清晰展示了其未来愿景,让每个人都能领悟360的雄心。
18、行业精灵——云从科技
3月30日晚间,云从科技发布公告称拟定增募资不超过36.35亿元,用于“行业精灵”大模型研发项目。该项目主要依托公司算法研发能力和大模型理论基础,用于行业大模型的理论研究与构建以及行业大模型下游场景的应用研发。
云从科技指出,公司主要提供高效人机协同操作系统和行业解决方案,助推人工智能产业化进程和各行业智慧化转型升级。在命名上,“行业精灵”可谓开门见山,使人容易理解其发力方向,乾脆地与用户向大模型错开了赛道。
D、灵光一现
最后一类国产大模型的命名十分特别,它们另闢蹊径地融入了一些外延知识,绝不肯落入窠臼。初看者一头雾水,懂梗的人则会心一笑。
19、MOSS——复旦大学
MOSS是来自複旦大学的对话式大型语言模型。 2月20日,复旦大学自然语言处理实验室透露,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。
儘管“MOSS”这个名字由英文字母构成,但它其实发源于正当红的中国流行文化。在国产科幻电影系列《流浪地球》中,MOSS是一个相当令人难忘的特殊角色——一台属于“550系列”的超级量子计算机550W。
《流浪地球》系列电影中的MOSS,图源网络
电影故事里,550W将自己命名为颠倒过来的MOSS,象徵着人造智能体的自主崛起。这种极端理性、趋向完美的艺术形象,正呼应了现代人对AI技术的想像,因而MOSS之名一经发布,就让复旦大模型打破次元壁,引发了热烈反响。
20、序列猴子——出门问问
4月20日,人工智能公司出门问问在北京举办2023 AIGC战略发布会。会上出门问问宣布内测探索大模型“序列猴子”。作为一款具备多模态生成能力的大语言模型,序列猴子支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
“序列猴子”这个名字的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理——如果一群猴子随机地敲打一台打字机,最终一定会产生完整的莎士比亚作品。
这一定理基于概率论和组合数学,阐释了概率的统一性。对应到大模型身上,就是指海量文本经过算法训练、算力消化,以求练成本领超凡的“序列猴子”。
如此说来,“序列猴子”这个有无限意味的名字,大概是对AI智能涌现的另一种趣味诠释。
E、他山之石
在英文世界里,与AI相连的热门称谓同样是新闻报导的高频词。最前沿的产品正定义着我们对AI服务的认知,它们的代号是迥异于中文的另一种答成交量。
21、ChatGPT——OpenAI
首先,当然是那个人人都挂在嘴边的名字:“ChatGPT”。
它由美国OpenAI研发推出,发布于2022年11月30日,定位为优化对话的语言模型。 2023年一月末,ChatGPT的月活用户突破1亿,成为有史以来增长最快的消费者应用程序。
至于ChatGPT具体能做什么,恐怕已经不需要任何人再做赘述。
如今我们回看它的名字,能感觉到一份异常的简洁。 “ChatGPT”可以拆分为两个部分,前一半“Chat(聊天)”直截了当地点明基本应用场景,后一半“GPT”是“Generative Pretrained Transformer(生成式预训练变换器模型)”的缩写,指代实现方式。
22、TruthGPT——(X.AI)
相似的,马斯克最近宣布的项目名称叫做“TruthGPT”。
作为互联网科技圈的红人,马斯克并非ChatGPT的拥护者,至少今天不是。他认为如日中天的OpenAI已然背离初衷,ChatGPT有很大的风险被用于製造虚假信息、操纵舆论及其他滥用或失控行为。
不仅如此,马斯克还对福克斯新闻表示,ChatGPT缺乏对Cosmos本质的理解,也缺乏对真理的追求。于是马斯克近日宣布将推出名为“TruthGPT”的人工智能平台,旨在“寻求真理、尝试理解Cosmos本质”,显然是要与ChatGPT同台对抗。
事实上,马斯克已经在美国内华达州成立了一家名为X.AI的人工智能公司,马斯克自己担任唯一的公司董事。而“TruthGPT”的名称足够直白,一方面呼应马斯克“寻求真理”的口号,另一方面则作为抨击ChatGPT虚假信息的猛烈砲弹。
23、Bard——谷歌
相比于OpenAI给ChatGPT的粗暴命名,谷歌好歹为自家聊天机器人设计了一个带有人格化色彩的称谓:Bard。
Bard背后的技术支撑是谷歌的应用语言模型LaMDA,实操中的功能面貌与ChatGPT大同小异。 3月21日,谷歌开始向公众开放Bard的访问权限,目前服务仍在不断更新完善。
倘若译作人名,“Bard”是亲切的巴德。从字面意义上看,“Bard”则代表Bard。需要指出的是,谷歌并不承认Bard 是搜索引擎的替代品,而是多次强调将其当作一种补充。 Bard真正的定位应当是Collaborator,即协作者。
24、New Bing/ Copilot——微软
在ChatGPT掀起热潮后,微软宣布新版必应搜索将搭载ChatGPT,改善用户的搜索体验,是为New Bing。
3月中旬,微软再出杀招,Copilot惊艳四座。这是一款适用于Microsoft 365的AI服务产品,搭载GPT4模型,能够实现多样的办公需求,例如按指令生成PPT、调整表单、生成会议纪要等等,一时间令无数打工人心神往之。
Copilot宣传图,图源网络
Microsoft 365 Copilot,揭开了AI变革生产力的序幕。而它的名称其实相当老实本分,Copilot可以翻译为副驾驶,表明AI只是用户副座的贴心助手,掌握方向盘始终是人类自己。
这种隐含的他者立场,在ChatGPT遭受全球各地监管审视的今天,显得尤其值得玩味。
饿了么广告语,图源网络饿了么广告语,图源网络
在如今的大模型竞争中,互联网公司们依然是活跃选手。 GPT命名之道,其实是过往话题的延续:什么样的名字才是好名字?怎样评判好名字?
资深品牌架构师、对外经贸大学讲师杨泽告诉刺猬公社(ID:ciweigongshe):“其实互联网公司跟传统行业一些命名运营的方式,逻辑上没有太大的差别。”
如果从类别上看,互联网公司的命名方式主要可以划分为两大类。一类方式是围绕企业名称或主品牌名称进行延展,比如百度地图、百度贴吧、百度网盘等等。这样命名的前提,是用户已经普遍对“百度”这一品牌建立了认知。
第二类方式则是相对独立的命名。这样取名不具备明显的标籤,建立认知有一定难度,好处则是能做到业务剥离,降低牵连影响,“它这种运营逻辑,更像联合利华、宝洁,每条产品线会有自己的名字,每个产品线进行独立运营。”
但无论是哪一种命名方向,完美的名称恐怕总是不存在的,或者说高下本身就难以区分。因为即使是那些如今公认的成功案例,许多也都存在着隐秘的缺陷。
就以备受好评的“饿了么”为例,杨泽解释道:“现在美团一直在强调什么都做,饿了么(延展业务)就难一些,因为它过于聚焦’饿’的场景,这是品牌名称形成的,早期的时候可能让人感觉印像很深刻,但是到现在我们发现它名字的延展性是有问题的。”
当饿么了试图解决与果腹无关的问题时,这个过去独树一帜的名字反倒成了製约它的短板。而对于如今优雅耐看的“百度”来说,“众里寻他千百度”固然高妙,却一点也不直接,因而曾给这家公司带来不少麻烦。
“’百度’是有门槛的,实际上它解决用户什么问题,这件事在品牌名称来讲是不清晰的。当时为了建立搜索引擎的认知,他们的CMO和团队一直在推’百度一下,你就知道’,要花更大努力才让这个东西深入人心。”
直到经历了“你就知道”与收购导航网站两大节点,百度才在推广层面真正深入人心。这个案例也恰恰证明,好的品牌名称与业务总是共同发展、相互成就的。
图源网络
品牌的本质是共识,而共识并不是脱离产品先行的。儘管好名字可以降低用户的认知成本,但其影响力终究要受到市场发展阶段的影响。
据杨泽观察,“一般在一些充分竞争的市场里,一个好的名字优势会很大。但是在一个新兴的、比较空白的市场,其实好的名字并不会给你带来太多优势。”
在新兴领域,共识的形成需要时间,它是在产品服务解决问题的进程中不断建立的。例如今天的大模型竞争,ChatGPT用一个最朴素的名字横空出世,拿出最颠覆性的体验凭空创造共识。
对于本土大模型而言,用心命名则是为了不下牌桌,是要在心智卡位的阶段保有一个姓名,“逻辑可能就类似于以前抢地名一样。”
在这样心智卡位的过程中,我们常常看见风潮。
品牌内部,如阿里系的动物园式命名,围绕着天猫形成所谓“传承有序”,最终凝结成约定俗成的企业命名文化,同时用噱头博取不小的外界关注。
到了品牌外部,便是今时今日的大模型林立局面,为什么许多产品不约而同地走向“古风”?这其实是先行者留下的路径效应,当文心与更早的先行者们确定了卡位思路后,后来者也有意跟随入局,降低认知成本。
名字如何,在共识仍未被产品圈定的当下还不够重要。真正的胜负手,仍在本土大模型的性能之战。说到底,“营销是美容产品之一,你有再多的’0’,没有前面的’1’也是没用的。”
想来,在每时每刻处理无尽数据的大模型眼里,这个关乎数字的比喻,应当再容易理解不过。
资讯来源:由0x资讯编译自8BTC。版权归作者所有,未经许可,不得转载
原创文章,作者:币圈吴彦祖,如若转载,请注明出处:https://www.kaixuan.pro/news/463880/