当前位置: CNMO > 人工智能 > 人工智能新闻 > 人工智能深度 > 正文

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

CNMO 【原创】 作者:杜跃 2024-06-04 17:59
评论(0
分享

  【CNMO】6月4日,#斯坦福抄袭中国大模型# 的话题以迅雷不及掩耳之势冲上了热搜,引发了一场关于AI的激烈讨论。斯坦福团队就此问题进行了道歉,中国大模型公司面壁智能CEO李大海也进行了回应:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”、“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  AI是当下不可逆的趋势,也是人人所向往的方向,即使是斯坦福这样的大学也不能“独善其身”,但是竞争归竞争,用真实的研究、科技去切磋才是君子之道,而非套壳博眼球,以自以为是的小聪明吃国际大亏,AI时代的商战并不能一“抄”了之。与斯坦福大学抄袭中国大模型事件相呼应的,还有近日曝出的丰田、本田、马自达等5日本车企被曝存在舞弊行为,在车辆安全性能测试中,丰田曾提交虚假数据,还曾不当改装测试车辆,造假行为涉及两款卡罗拉车型和一款雅力士车型。当天,丰田、本田、马自达企业高管分别召开记者会,就此事道歉。

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  如果抄袭、舞弊等行为的犯错成本仅仅是道歉就能覆盖,那么各行各业都将止步不前,创新在它们面前变得一文不值!虽然总有人说这个世界就是一个巨大的草台班子,但是草台班子也有草台班子的规矩和原则,并非草台班子无英雄,也并非草台班子就能恣意妄为。当代表正义的摩利斯克之剑真正悬在头顶之际,一切也都晚了,他重不如自重!

  就斯坦福抄袭中国大模型这件事,起因是5月29日的时候,一个来自斯坦福的AI团队在网上宣传500美元就能训练出一个SOTA多模态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus性能更强,引发了不少开发者群体的关注。单单如此可能吸引力也并不够大,因为中间还存在信任问题,于是乎斯坦福等就成为了强有力的背书。该团队两位成员不光是来自斯坦福的本科生,还发表过多篇机器学习领域论文,甚至有过包括AWS、Space X等名企的实习经历,多重光环加身,也让外界对他们所做的模型多了几分信任。

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  当该模型得到越来越多人关注时,只要有漏洞就必然会被发现。期间,一位用户在社交平台X与HuggineFace上质疑了Llama3-V是否套壳了中国大模型面壁智能推出的开源端侧多模态MiniCPM-Llama3-V 2.5。当时Llama3-V回应称只是使用了MiniCPM-Llama3-V 2.5的分词器,并在其发布前就已经在做了。细品就会发现,回应也有漏洞,面壁智能还没有发布该分词器,他们就在做了,显然牛头对不上马嘴。之后质疑声音越来越大,包括多处细节都展现出了完全相同的情况,包括面壁智能CEO李大海列举的尚未公开的清华简识别能力,很难不让人认为就是抄袭。然而开发团队依旧在嘴硬并不承认,并且隐藏了HuggineFace上的Llama3-V模型,理由是为了修复模型的推理问题。

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  面壁智能创始团队来自清华大学自然语言处理实验室(THUNLP),知名领域科学家担任公司技术顾问,团队在大模型前沿领域深耕厚植,科研和技术实力处于国内领先水平。团队曾最早提出知识指导的预训练模型ERNIE,曾开源发布多个有学术与业界影响力的大模型,包括国内首个中文大模型CPM-1、国内首个法律领域大模型Lawformer等。CPM大模型是面壁团队根据多年的大模型训练经验自研的百亿参数预训练语言大模型,支持多语言能力和简易结构化输入输出,通过团队自研的高效微调技术,能快速适配各种下游任务,满足各种场景的需求。

  其实在国内,面壁智能的大模型也只是诸多大模型当中的一个缩影,我国高度重视人工智能产业的发展,已经将人工智能列为国家战略,并且出台了一系列政策扶持人工智能发展。在此指引下,我们能够看到国内大模型呈现出了百花齐放的现象,科大讯飞星火认知大模型、百度文心大模型、阿里巴巴通义千问、腾讯元宝大模型、百川智能、华为盘古大模型、智谱清言等等。可以说,很多公司都在搭建自己的大模型,在这场关乎未来生死的大战中,大家都在积极研发技术、储备弹药,并且打出了非常出色的差异化牌,成为了当前全球AI潮流之下的中坚力量。

  而且,在当前与大家关系异常密切的手机、PC等领域,AI都在成为其内核,大模型上车也成为了一个新的潮流。尤其是进入今年以来,AI手机、AI PC早已经不再是概念,而是有了真真切切的产品落地。各大品牌的产品基本都已经融入了端侧或者云侧大模型,或者是从打造人工智能体着手进行布局,为用户提供更加高效且实用的AI能力。而AI PC则是AI产品的重点风口,它作为大多数的生产力工具,凭借着独特的产品特性与AI相结合将迸发出更多元的火花,届时AI大模型也将从消费端赋能千行百业,让更多人在一台PC上就能体验AI的智能与便利。

  在行业不断探索垂域大模型之际,终端产品也成为了百模大战或者说百模集中的练兵场,不同大模型共同为用户提供服务。在这里可以举两个最典型的例子,一个是荣耀Magic6系列手机的AI,另一个是新款华为MateBook X Pro笔记本上的AI。

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  早先,荣耀便发起了荣耀百模生态计划,旨在以MagicOS为中国百大模型提供入口,将各类垂域模型融合于一身,从而为用户的不同需求提供更加专业的解决方案。以高德地图为例,在接入高德地图大模型后,YOYO助手能够高效对话高德地图,理解更加复杂的路线,为用户带来个性化的导航体验。

斯坦福抄袭中国大模型 AI时代的商战也不能一“抄”了之

  而新款华为MateBook X Pro则是在电脑管家内置AI空间功能,精选了100+智能体,包括讯飞星火、文心一言、智谱清言等行业大模型在这里都能见到。华为希望通过行业模型的融合,为用户不管是学习还是办公,不管是编程开发还是文案创作,都能提供最专业的答案。而华为自研的盘古大模型则是运用到了AI概要上,可以帮助用户从音视频或实时纪要中快速精准提炼关键点。不难看出,不管是华为还是荣耀亦或是国内的其他品牌,对于AI大模型的发展都有一个非常清晰的认知,那就是既要有自身大模型做护城河,也要联合国内百大模型共同驶向AI大航海时代。

写在最后

  在这场全球浩浩荡荡的AI竞赛当中,或许ChatGPT、Sora引得无数人顶礼膜拜,但是我们自身的AI也一直在努力追赶并且进行超越。当斯坦福抄袭中国大模型的事件曝出来之后,其实我们也应该看到两面性,一方面是我们的AI引起了别人的关注甚至是重视,这代表了我们的AI水平走在了前列;另一方面是时刻警惕抄袭事件发生,开源与抄袭始终是两个概念,希望厂商们都能够共建开放、合作、有信任的AI环境,促进行业的健康发展。

分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
潮机范儿

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号