绿茶通用站群绿茶通用站群

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源之争延续到大模型时代。在寻(xún)找“新大陆”的路上,开(kāi)源与闭(bì)源的辩(biàn)论,就像是一(yī)场关于AI未来的“航海策略”讨论。

开源(yuán)一派认为,开源(yuán)能(néng)够促进全球科研(yán)人员和(hé)开发者的协作(zuò),加速(sù)AI技术 的迭代与创新。同时,开源让更多人参与到模型的改进和优化中,通过集体智慧解(jiě)决复(fù)杂(zá)的技(jì)术难题。

闭源的倡导者则看重其在商业化、技术保(bǎo)护和产品差异(yì)化方面的优(yōu)势。闭源模型使得企业(yè)能够控制产品的(de)开发节 奏和市场策略,保护其(qí)商(shāng)业利益。此外,闭源(yuán)也有助(zhù)于企业维护其技术优势,避免 竞争对(duì)手模仿(fǎng)或超越。

Llama 3的发布让开源大模型(xíng)在与闭源的竞争中再度“扳回一城”。从(cóng)测试结果(guǒ)来看,Llama 3的成绩大幅超越了Llama 2,也胜(shèng)过了GPT-3.5。

在AI这场没有硝烟的“航海竞赛”中(zhōng),大模型(xíng)已(yǐ)然成为眼(yǎn)前的灯塔。未知的是(shì),这座灯塔(tǎ)究竟(jìng)是向(xiàng)所有(yǒu)航海者开放其光芒,还是仅为(wèi)特定的船(chuán)只照亮前行的(de)航道。

开(kāi)源在开发者和研究人员中极 受欢迎

Meta正沿着开 源路径继续(xù)前进。

近日(rì),Meta推出开源大模型Llama 3系列,发布8B和70B两个版本。Meta创始人兼首(shǒu)席执行官扎克伯格在同一天宣布,基于(yú)Llama 3,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站。

与Llama 2相比,Llama 3进行了几项关键的改进:使用具128K token(输入数据的最小单元)词汇(huì)表的tokenizer(编译器),可以更有效地编码语言,从而显著提升模型性能;在8B和70B模型中都采(cǎi)用分组查询注意(yì)力(GQA),以(yǐ)提高Llama 3模型的推理效率;在(zài)8192个token的序(xù)列上训(xùn)练模型(xíng),使用掩码来确保自注意力(Self-Attention)不(bù)会跨越文档边(biān)界 。

据Meta介绍,Llama 3已经在多种行业基准测试上展现了(le)最先(xiān)进的性能,提供了包括改进的推理能力在(zài)内的新(xīn)功能(néng),是 目(mù)前市(shì)辛苦生活作文场上最好的开源(yuán)大模型。

此外,Llama 3发布后,微软Azure、谷(gǔ)歌云、百度(dù)智能云等陆续宣布其平台上线(xiàn)Llama 3。百(bǎi)度方面此前对《每日经济新闻》记(jì)者表(biǎo)示,百度智能云千帆大模型平台在国内首(shǒu)家推出(chū)针 对Llama 3全(quán)系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型。

工业和信息化部工业文化(huà)发展中心AI应用工作组执行(xíng)组长、行行AI董事长李明顺在接受《每日(rì)经济新闻》记者采访时表示,Meta的Llama 3发布可能会带(dài)来更多AI应用落(luò)地机会和场景,它通过(guò)提供更大词汇量的Token词典、更(gèng)长的输入上下文长度以及优化的模(mó)型(xíng)结构,增强了模型的编码效率和(hé)推理效率。“现在,比起Llama 2,Llama 3在代码能力(lì)和逻辑推理能力(lì)上有(yǒu)显著提升,这可能会促进相关AI应用的性能(提(tí)升(shēng)),尤其是在需要复杂逻辑和代码理解(jiě)的场景(jǐng)中去落地。”

OpenAI在(zài)GPT-2之后调转船头走(zǒu)向 闭源,Meta则成为开 源界的引领者之一。

从2020年发布GPT-3,到引发轰动的GPT-3.5,以及2023年3月发布(bù)的GPT-4,都是闭源模型。此前,马斯克起诉OpenAI时(shí)曾直言:“如果OpenAI改名为ClosedAI,我就撤销诉讼。”

李明顺认为(wèi),OpenAI的转变可能与其商业战略和市(shì)场定位有关。“初期开源有助于快速吸引关注和社区参与,但随着公司的发展,我估(gū)计阿尔特曼(Sam Altman)的野心和 商业梦想越来越膨胀了,闭源可以更好地让它融资,包(bāo)括和微(wēi)软合(hé)作,保护(hù)领(lǐng)先的技术(shù)优势。”他表示,从OpenAI的转 变中可以(yǐ)看出(chū),开(kāi)源与闭源的选择并非(fēi)固定(dìng)不变(biàn),而是(shì)需要根据公司(sī)战略目标、市场环境和产品(pǐn)发展阶段灵活调整。天下没什(shén)么 事情是绝对的,很多开源公(gōng)司也是拿着次优(yōu)代码开源,独家秘方闭源(yuán)。

在追逐AGI(通(tōng)用人工智能)这(zhè)颗明珠的道路上,迄今为止,Meta依旧持续沿着开源的路径前行。

2024年初,扎克伯格在Meta第四季度及2023全年财报电话会议上表示:“长期以来,我们的策略是构建并开放源(yuán)代码通用基础设施,同时保留我们的具(jù)体产品实现为(wèi)专有技术。”

他认(rèn)为,开源带(dài)来了几个战略好(hǎo)处。首先,开源软件通 常更加(jiā)安全可靠(kào),并且因(yīn)为社(shè)区(qū)的持续反馈、审查和(hé)开发,更(gèng)加高效。其次,开源软件经常成为行业标准,“当企业(yè)开始基于我们的技术栈建立标准(zhǔn)时,这(zhè)使得将创新融入我们的产品变得更(gèng)加容易。这(zhè)种微 妙(miào)的优势,能够迅速(sù)学习和改进,是(shì)巨大(dà)的竞(jìng)争优势,而成为行业标准正是这一能力(lì)的关键(jiàn)”。第(dì)三,开源在开发者和研究人员中极受欢迎。

开源与闭(bì)源并(bìng)不 矛盾

开源还是(shì)闭源,也许(xǔ)是全球人(rén)工智能信徒(tú)长久(jiǔ)的辩题(tí)。在Llama 3诞生前几(jǐ)天,国内(nèi)同样在进行一场“辩(biàn)论”。

4月(yuè)11日,百度董事长兼首席执行官李彦宏在其内部(bù)讲 话中直言,大模型开源的意义不大,闭源模型在能力上会持续领先,而不是(shì)一时领先,做模(mó)型的创(chuàng)业公司既做模型又做应用的“双轮驱动(dòng)”不是一个好的模式。在一周后的Create 2024百度(dù)AI开发者大会(huì)上,李彦宏(hóng)再度提到,大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的(de),所以开源模型会越来(lái)越落后。

360公司创始人周鸿祎(yī)则持 不同的观(guān)点。他表示:“网上有(yǒu)些名人胡说八道(dào),大家也别(bié)被他们忽悠(yōu),说开源不如闭源好(hǎo)。一句话,今天(tiān)没有开源就没有Linux(操作系统内核(hé)),没有(yǒu)Linux就(jiù)没有(yǒu)互联(lián)网,就连说这话的公司自己都借(jiè)助了(le)开源的力量(liàng)才(cái)成长到 今天。”

这段发言被解读为对(duì)李彦宏观点的回怼,周鸿祎(yī)随后澄清(qīng)道:“我(wǒ)一直是(shì)开源的信徒,但是我说开源好 ,是(4月(yuè))13日在哈佛讲(jiǎng)的,李厂长(指李彦宏)说闭(bì)源(yuán)好,是(4月)16日在北京讲的。”

生数(shù)科技联(lián)合创始人兼 CEO唐家渝(yú)站在闭(bì)源的一边。在 4月18日举行(xíng)的“2024中国生成式AI大会”上,唐家渝表示(shì):“在我 们(men)看(kàn)来,开(kāi)源(yuán)、闭源都(dōu)有(yǒu)各自可(kě)以做的商业生态,但是从(cóng)模型能力的提升辛苦生活作文来说,或者持(chí)续走到前列来说,闭源还是会走(zǒu)到开源的(de)前面。”

昆仑(lún)万维(wéi)董事长方汉的观点是,开源模型与闭源模型之间 的(de)差距正(zhèng)在不断缩小。4月16日,方(fāng)汉在接受《每(měi)日经(jīng)济新闻》记(jì)者在内的媒体采访时表示,闭源(yuán)模(mó)型的确是第(dì)一(yī),但是(shì)开源大模(mó)型在(zài)2023年到今年这一(yī)年间,从落后(hòu)两年 以上,已经(jīng)进化到落后(hòu)4~6个月以上(shàng)。

此外,方汉认(rèn)为,在(zài)应用侧,闭源(yuán)对于产品特性和长尾(wěi)需求的(de)满足都落后于开源大(dà)模型,开源大模型是一 种生态构(gòu)建器,更利于满(mǎn)足(zú)用户的长尾(wěi)需求(qiú)。开源大模型和闭源大模型是一个生态的组成部分,不是谁压倒谁,大家都有自己的生存空间,也都有更好(hǎo)的明天。

不过,从商(shāng)业化上来讲,闭源和开(kāi)源也许并不矛(máo)盾。启明(míng)创投合伙人周志峰就认为,开源闭源在过去(qù)几个大浪潮(cháo)当中没有很大的冲突,不(bù)太理(lǐ)解为什么很(hěn)多人把闭源、开源在AI时代看(kàn)成对立的。

李明顺的观点则是,在当(dāng)前强应用导(dǎo)向的背景下,开(kāi)源模式具有显著优势,能够吸(xī)引全球范围内最(zuì)广泛的人参(cān)与,从(cóng)而使其创新(xīn)性保(bǎo)持在较高水平(píng)。

相较之下,尽管一些闭源大模型在技术上具有领(lǐng)先地位,但其成本 太高。不过他也(yě)强调,开源与(yǔ)闭源在不(bù)同公司和应用场景中可以相互转换。一(yī)些基于开源的产品在发掘到独特(tè)优势后,可能会通过闭(bì)源策略建立竞争(zhēng)壁(bì)垒。同时,一些闭(bì)源公司也会不断(duàn)将其部分产品开源。这两个应该是共存的,未来开(kāi)源可(kě)能(néng)用户量级上更大,但是行业(yè)内,商业(yè)化做得比较好的公司,往往还是闭源的多一点。

在开源与闭源的辩论中,也许答案并非非此即彼。AI的未来可能既不是完全开放的(de)“自由港”,也不是彻(chè)底封闭的“孤(gū)岛”,而是一个既包含开(kāi)放协作也包含封闭竞争的混合 生态。在这个生(shēng)态(tài)系统中(zhōng),开放(fàng)与封闭不是(shì)对(duì)立的(de)两(liǎng)极,而是一枚硬币的两面。

未经允许不得转载:绿茶通用站群 辛苦生活作文

评论

5+2=