13311025687

经验共享,记录互联网发展脚步

在开拓网络市场的路上,我们与您一路同行!

我们与GPT之间的差距究竟在哪里?

作者:千景纵横 日期:2023-04-13 人气:95

域包括上游的底层框架与工具、中游的行业服务、下游的包括文字、图像、视频、音频、游戏等应用场景,创业方向也从C端的娱乐游戏拓宽至工业、金融、医疗、教育等2B领域。不同应用场景已出现了一批代表性的玩家。 


一、国内创业公司AIGC相关布局 


在底层大模型上,中国互联网科技巨头的动作则最受瞩目,包括百度、华为、腾讯在内大厂均有自然语言大模型布局。 


3月16日,百度履行承诺,发布基于文心大模型的生成式AI产品文心一言,27日又面对企业发布了智能云AI底座文心千帆。 


3月27日,华为云官网显示,旗下的盘古系列AI大模型即将上线,涉及NLP(自然语言)大模型、CV(计算机视觉)大模型和科学计算大模型(气象大模型)。 


3月30日,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发AIGC以及大模型相关技术,并向澎湃新闻表示,正在研发类ChatGPT的对话机器人,对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,汤道生说:“都会有。” 


二、国内AI“三算”与海外存差距 


人工智能在当下的中国展现出全面开花的热闹。而资金雄厚、人才济济的大厂被视作最能与OpenAI比肩的选手。但最早发布产品的百度,其文心一言在文本、代码生成上尚不及ChatGPT的体验,图片生成的效果则被Midjourney拉开了距离。 


赛道火热,产品不佳。中国的人工智能发展进入至暗时刻。缺的不仅是有实力的大模型,还有与之直接相关的人才和AI“三算”,即算力、算法、算据。 


先是业内曝出,百度文心大模型团队内的研发人员近期受到了其他公司的疯狂追捧,有3年左右相关经验的员工,可以直接给到原先年薪的两倍。而有涉及海内外人才市场的猎头称,诸多互联网大厂的第一诉求就是想找OpenAI项目里的华人。猎聘大数据研究院的统计数据也显示,近一年,AIGC相关新发岗位同比增长了42.5%。 


1.抢人大战不仅在国内上演。 


由于一大批硅谷AI大牛排着队挤进OpenAI,谷歌一度遭遇AI人才流出。据外媒体统计,近几个月OpenAI已经雇用了超过12名谷歌的AI人才。 


但从公开消息看,到目前为止,还没有哪位OpenAI背景的华人专家流入中国大厂。 


AI人才紧俏,以芯片为核心硬件基础的算力一直被视为“卡脖子”的状态,而国产大模型的算据也与GPT-4存在肉眼可见的差距,预训练等大模型算法的距离直接以“肉眼可见”的产品拉胯摆在了用户面前。 


在算据上,国产大模型也与GPT-4存在差距。 


在自然语言大模型中,参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多,意味着模型能够处理更多的数据,学习更多的知识。国外有研究人员将GPT参数规模与大脑神经元做类比,GPT-3的规模与刺猬大脑类似,GPT-4拥有100万亿个参数,基本达到人类大脑的规模。 


2.大模型参数对比 


再看国产大模型,即使是排名靠前的M6大模型,其参数规模也仍与GPT-4相差一个数量级,更多的大模型仍在“原始阶段”。 


GPT-4百万亿的参数需要强大的算力来完成训练。算力,同样是AI的核心竞争要素,核心的核心是芯片。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ 


在AI芯片竞争方面,英伟达处于垄断地位,该公司推出的A100与H100是目前性能最强的数据中心专用GPU,市面上几乎没有可替代的方案。ChatGPT的训练用的正是英伟达顶配版A100。 


然而,在中美竞争下,A100与H100已被限制出口中国,中国厂商只能用阉割版A800芯片,数据传输速度被降低了30%,影响着AI集群的训练速度和效果。而国产优质芯片,虽能够为预训练大模型提供算力支撑,但仍存在明显差距。 


3.芯片性能对比 


以OpenAI为例,该公司使用了数万块英伟达A100进行海量数据训练和推理。如果以1万枚英伟达A800 GPU为标准,仅GPU采购成本就超10亿美元。 


如此现状下,国内的大模型研发机构面临两种选择,“烧钱”购买更多的芯片,等待国产芯片的算力突破。但现在的竞争态势下,等已经等不起了。 


高昂的前期投入成本绝非普通创业公司可以负担,还要具备绝对顶尖的研发技术。很显然,AI大模型仍是巨头的游戏。但掌握先发优势的OpenAI以“日更”速度向前跃进,互联网巨头与资本面临着一场“烧钱”硬仗。 


三、OpenAI抢跑,中企如何赶超? 


回顾ChatGPT的迭代,OpenAI至少进行了三次技术路线的“自我革命”。 


从2018年GPT-1的推出到今年的GPT-4,OpenAI用了近5年。而百度在自然语言大模型的研发上用了10年。 


连李彦宏也认为,中国基本不会再出现一个OpenAI,“没有必要再重新发明一遍轮子”,在他看来,“大模型时代,最大的创业机会在应用,”他的判断基于上一次的移动互联网变革,“操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。”他指出,未来10年,应用领域可能诞生10倍价值的机会。 


周鸿祎也在公开场所表示,目前中国发展GPT技术,首先要占据应用场景,同步全力发展核心算法技术。为什么要同步?如果等算法赶上GPT-4再上马,市场就错过了。 


另辟赛道,在现有大模型的基础上创新产品应用可能是大部分企业的超车机会。 


就像移动互联网时代,尽管中国没有自己的操作系统,但仍有Tiktok这样的超级应用在海外市场杀出一片天。应用先行的优势是能快速的将AI生产力转化为商业价值,这是在移动互联网时代中国互联网企业探索出的超车捷径,也是在激烈的AI竞争中,大部分中企们赶超ChatGPT最经济、最现实的路径。 


但由于GPT-3之后,OpenAI的所有模型就没有再开源,GPT-4的运行机制是什么,国内企业仍无从得知。 


面对竞争对手全面的科技封锁,中国人工智能想要长期发展就不能没有“根”。旷视科技CEO印奇认为,中国攻坚AI大模型目前最重要的是要先能把GPT-3.5复现出来,”这是所有事情的起点”。 


无论如何,发展好自身的硬实力,不在关键技术上被“卡脖子”,将是AI时代下中企们无法逃避的“必修课”。 


针对国产AI大模型,周鸿祎指出:“发展大语言模型,别人已经指明了技术路线,剩下的就是长期主义指导下的时间问题,”他认为,“中国有能力发展自己的GPT,差距大概2年。” 


百度有文心大模型,阿里有M6,华为的盘古大模型箭在弦上,腾讯的混元大模型也在不断迭代。当李开复、王慧文等一众互联网大佬也亲赴大模型战场时,底层的重要价值已经不言而喻了。 


就像《三体》故事里的明喻一般,“基础科学”一旦被“智子”锁死,人类便永远失去探索宇宙真相的机会。底层大模型就是那个基础科学,在人工智能上,中国想要超越,不光需要资本、巨头,更需要的是能顶得住研发压力的“面壁人”。北京千景纵横科技有限公司,众志汇聚,放眼未来;精诚团结,面向市场。


北京千景纵横科技有限公司成立于2011年,坐落北京中关村科技园区-专注高端网站建设(品牌展示型、官方门户型、电子商务型、营销型网站Html5响应式)、微信小程序APP开发、云服务器部署和运维,为企事业单位的互联网应用提供一站式服务。


标签:千景纵横  千景网络  北京网站建设  北京网站设计  北京小程序开发  官网制作  门户网站开发  商城网站建设



扫二维码与项目经理沟通

我们在微信上24小时期待你的声音
解答:网站建设、UI设计、APP开发、小程序开发

北京千景纵横科技有限公司成立于2008年,坐落北京中关村科技园区-专注高端网站建设(品牌展示型、官方门户型、电子商务型、营销型网站、Html5响应式)、手机端应用手机站、微网站、APP应用、云服务器部署和运维,为企事业单位的互联网应用提供一站式服务。


北京市海淀区上地七街国际创业园东区2号楼9层
四川省成都市高新区萃华路国际科技节能大厦A座11层

Copyright © 2023 北京千景纵横科技有限公司  备案号:京ICP备14059922号-1

关注我们

联系千景高端建站顾问

免费获得专属策划方案