没有任何意外,2023世界人工智能大会(WAIC)成了国产大模型的阅兵式。据不完全统计,至少有30款大模型扎堆亮相,展示了自身在绘画、问答等AIGC方面的才能。它们包括,百度文心、阿里通义、腾讯混元、华为盘古、商汤日日新、网易伏羲,以及出门问问的“序列猴子”大模型、蜜度的蜜巢大模型、达观数据的“曹植”大模型,等等。
过去200多天里,这些模型背后骄傲的创新者们罕见地达成了共识,试图挥舞着大模型的利刃在通用人工智能荆棘密布的道路上杀出一条血路。在这个“比移动互联网大10倍”的机会面前,每个人脸上写满了惊讶、兴奋与恐惧。
【资料图】
30多个大模型“秀肌肉”
把超级工厂开到中国后,马斯克不止一次夸过中国的工人和工程师。相比他和扎克伯格的八角笼对决,中国人写在基因里的“自己卷自己”更让人心生敬意。这层意思也充分体现在了他献给本届开幕式的8分钟演讲里。
“我认为,中国在任何它想做的事情上都会完成得十分出色,这在许多领域都有体现,不论是经济还是人工智能领域。”马斯克说。尽管他没能看到30多款中国大模型同时“秀肌肉”。
从具体落地应用看,绝大多数大模型还是选择了AIGC作为展示能力的主航道。尤其是在AI作画上,给予了不少初玩者“惊艳”的感觉。昨天,阿里云通义大模型迎来新面孔,AI绘画工具“通义万相”,使用了全新绘图模型Composer,进一步优化了被广泛使用的扩散模型 Diffussion,提升了生成图片的精准性。
同样在昨天被刷屏的,还有华为的盘古大模型。华为对它的介绍是,不做诗,只做事。有趣的是,没有诗和远方的盘古,展位也没有和一众大模型在一起,并且高挂着AI for industries(工业人工智能)的slogan。
从基础介绍看,盘古已经针对政务、金融、制造、矿山等行业设计了专用的大模型,涉及台风预测、药物制造等场景。就在本周,《Nature》刊发盘古气象大模型文章,称赞“华为云盘古气象大模型让人们重新审视气象预报模型的未来。”
据说,借助盘古气象预测速度提高了10000倍以上,预测精度超过了全球最强的欧洲气象中心,开天辟地的巨人化身追风少年。
难得可贵的是,盘古的算力大部分由华为的昇腾处理器提供。华为高管表示,中国大模型一半的算力都由他们提供。
另一个让人眼前一亮的是蚂蚁。此前,他们已经宣布正在研发“贞仪”大模型。这个名字很有可能和清代一位既能写诗又会算术的女算学家、天文学家王贞仪有关。《Nature》曾将她列为“为科学发展奠定基础的女科学家”。
不过,这次亮相的是他们专门为大模型金矿配套的“铲子”:蚁鉴2.0,主打一个安全。如果有人要求大模型给出一个违背伦理的答案,蚁鉴就会给出预警。
除了将在年底亮相的贞仪,下周京东将在全球科技探索者大会上发布自家的大模型。以及别忘了,刚被美团收购的,王慧文的光年之外。
最美的时光与你们
“我不是在最好的时光遇见了你们,而是遇见了你们,才有了这段最好的时光。”这是主场作战的“AI创业教父”汤晓鸥在开幕演讲中的一段话。出自于谦的电影《老师好》。作为商汤科技的创始人,他把戏份全给了三位得意门生。
王晓刚,本科是中国科大少年班,在麻省理工攻读博士,毕业后到汤晓鸥在香港中文大学的实验室做教授。2011-2013年深度学习曙光乍现的时候,他和同事接连在CVPR和ICCV两个计算机视觉领域顶级会议上发布了14篇论文,占到了这一期间全球近一半份额。
在他主导下,深度学习第一次被应用于机器视觉的18个领域,用汤晓鸥的话说:“在深度学习的大门上,我们按了18次门铃。”也是在他的带领下,香港中文大学在ImageNet竞赛中多次夺冠,风头一度压过了谷歌。
何恺明,2003年广东高考状元,是汤晓鸥带出的博士生。他在硕士期间就取得了CVPR最佳论文,这是CVPR25年历史上从亚洲出来的第一篇最佳论文。后来他前往微软和facebook工作,用ResNet解决了深度网络的梯度传递问题,使得深度学习能有效训练超过百层的深度神经网络,为如今的大模型奠定了技术基础。
林达华,本科就读于中国科大,同样在麻省理工获得博士。他曾在2018年带领一个小团队,打造了国际最具影响力的视觉算法开源体系,目前用户遍及全球140多个国家和地区。他即将发布千亿参数、8K的多语种大语言模型“书生·浦语”。
“王晓刚在深度学习最初几年洒下了原创种子,何恺明打牢了深度学习的根基,林达华通过开源和大模型让其枝繁叶茂。”汤晓鸥自豪地说道。
江山代有才人出,这份传承还在继续。两周前,由上海AI实验室、武汉大学、商汤联手提出的Planning-oriented Autonomous Driving(以路径规划为导向的自动驾驶)获得了CVPR 2023最佳论文奖。
据谷歌学术统计,这是改革开放40多年来,第一篇全部由中国学者完成的国际计算机视觉三大顶会的最佳论文,这篇文章的牵头作者是王晓刚的博士生。
它或许也为大模型在短短200天里在国内百花齐放提供了一种解释:尽管它们依然是跟随者和挑战者,但至少它们中的一部分,背后站着的,是已经写入深度学习发展历史的闪耀群星。
来自格灵深瞳的凝视
“你家大模型的特色是什么?和别家有什么区别?”会场里,这些问题往往会开启一场心照不宣的对话。一方想掩饰自家大模型建立在开源的基础上,一方有点狡黠但也带点期盼地想要一个眼前一亮的答案。
你爷爷一开源,我爷爷就创新。在大模型的江湖,中外技术鸿沟依然存在。从AIGC概念走红至今,全国从事AI绘画研发的团队早已超过了40家,几乎清一色用着国外的开源体系,对比使用,很快会产生审美疲劳。
当然,和安卓系统一样,部分团队会站在巨人肩膀上迭代,比如通过叠加其他技术,解决AI绘画对手部细节勾勒的缺陷。但这种微创新距离投资人心目中的“杀手级”应用似乎还有距离。
一个不争的事实是,只要有足够的算力,利用开源算法和已有的数据,就能跑出一个大模型。除了头部几家,大部分的差距也许仅在于是否有足够多的钱买到显卡。这种同质化也是前段时间朱啸虎发出灵魂拷问的原因所在:99%的价值都是GPT创造的,这样的创业公司有什么价值?
换句话说,如果阿里云、华为、腾讯、百度等巨头推出大模型,是为了对标微软,用大模型为云计算找到更大的应用场景,为千行百业提供定制化的服务。那么中小创业团队的大模型是为了什么,这是值得深思的问题。
因为,动辄上亿的投入,最终不可能通过写几篇小作文,画几张画就能赚回来的。
朱啸虎质疑的另一大背景是,经历了一段时间的狂飙后,关于大模型的热度已经慢慢降低。一方面,ChatGPT的用户增速已经放缓,另一方面,此前业内预计ChatGPT+bing的杀手锏并未在短期内提升微软在搜索市场的份额。
这些事实正在逼迫投资人们冷静地来思考通用人工智能的未来。
回到国内,资本市场仍然在为上一轮人工智能的热潮买单。最具代表性的,恐怕就是曾经一度被投资人标榜3000亿美金的格灵深瞳,如今在科创板的市值不到70亿,即使在这轮热潮里也难以再起波澜。
当人类凝视AI时,AI也在凝视着人类。
最踏踏实实的一批人
在世界人工智能大会会场,甘肃姑娘张娟可能是最为特殊的一个人。她从老家临夏回族自治州的积石山县跨越2000多公里来到上海。没有以她为代表的AI数据标注师,就没有如今的大模型。就像她略带紧张的感慨,“这么多高大上的科技背后,真有我们的功劳。”
这次展会上,来自中西部欠发达县域的数字就业中心被称为“最接地气”也最“最暖心”的参展商。他们主要为当地的年轻人提供数据标注工作。员工中女性占了6成左右,很多人是宝妈,或者是家里有老人需要照顾。
张娟就是其中代表,2019年大专毕业的她本来在兰州打工,后来因为家里发生了一些变故被迫回到老家,幸好在那里她找到了现在这份工作,照顾家里的同时还能赚钱。
这两天,她第一次坐到了特斯拉的驾驶位上。这是一种奇妙的缘分,在过去很长一段时间里,她标注过自动驾驶相关的数据,比如说认识品牌、车型、续航里程等,也观看过无数个自动驾驶的测试赛,然后标注不同的障碍物。
在这轮大模型的浪潮里,以张娟为代表,在中国的西部山区和黄河边,一群人的命运正在被改变。她们靠着自己的眼睛和双手赚到了钱,为自己买了心仪已久的化妆品,在婆婆面前抬起了头,获得了满足心愿的能力和底气……
这是大模型影响的不确定时代下,为数不多的小确幸了。
标签:
滚动