资讯
HOME
资讯
正文内容
nes mini nand 下载 Llama 31提前泄密,将GPT-4o踹下宝座?更快,价格便宜10倍
发布时间 : 2024-11-24
作者 : 小编
访问数量 : 23
扫码分享至微信

Llama 31提前泄密,将GPT-4o踹下宝座?更快,价格便宜10倍

文|常敏潇 袁滢靓

编辑|邓咏仪

若是说成为开源模型天花板,是Llama大模型的运,那“惨遭泄露”,就是Llama要渡的劫。

2023年3月,Llama 2就因提前泄露,Meta不得不以开源的方式发布模型。

如今,历史再次重演。

太平洋时间7月12日,一名Meta员工透露,Meta计划于当地时间2024年7月23日发布迄今为止Llama最大的参数规模版本:Llama 3.1 405B。他透露,405B将会是Llama系列中首个多模态模型。

然而,就在太平洋时间7月22日,预定发布时间的前一日,Llama3.1的模型和基准测试结果就在Reddit等技术社区上泄露,Llama 3.1的磁力链接(用于下载文档的程序)已经在HuggingFace等社区中流传。

从泄露的结果中看,Llama 3.1的性能,足以媲美OpenAI的GPT-4o!

有AI博主盛赞,Llama 3.1的发布,将又是扭转AI界命运的一天:

△来源:X

泄露的基准测试结果显示,Llama 3.1共有8B、70B、405B三种规模。参数量最小的70B模型 ,许多方面的性能也与GPT-4o不相上下。

△上图为Llama 3.1 各版本与 OpenAI GPT-4o、Llama 3 8B/70B 的对比,其中,规模居中的70B版本,也在诸多方面超过了 GPT-4o。图源:X用户@mattshumer_

有网友指出,如果依据这个基准,Llama 3.1 405B ≈ GPT-4o,Llama 3.1 70B 则将成为能击败了OpenAI的首个轻量级模型、GPT-4o mini。

△图源:X用户@corbtt

不过,不少已经下载模型“尝鲜”的网友发现,泄露版的Llama 3.1 405B,所有文件大小竟然约有820GB,所需内存是保留完整精度的Llama 2(约280GB)的近3倍。

这意味着,若非家里有矿,买得起足够多GPU,个人开发者很难用自己的电脑把Llama 3.1跑起来。部分网友猜测,Llama 3.1并非面向个人,而是面向机构和企业。

还未官宣的Llama 3.1也被泼了盆冷水。不少网友倒苦水:Llama 3.1对GPU的要求太高了,不如隔壁OpenAI家的GPT-4o mini物美价廉。

△X上的网友评论。图源:X用户@_Talesh

功能迭代,指标优化,计算资源减少

根据泄露的模型信息,Llama 3.1相较于2024年4月19日发布Llama 3,在功能上有了更多的迭代,包括更长的上下文窗口、多语言输入和输出以及开发人员与第三方工具的可能集成。

数据训练:Llama 3.1使用了公开来源的 15T+ tokens进行训练,微调数据包括公开可用的指令调优数据集(与 Llama-3 不同!)以及超过 2500 万个合成生成的示例。

多语言对话:Llama 3.1支持8种语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。虽然很遗憾没有中文,但开发人员可以针对 8 种支持语言以外的语言对 Llama 3.1 模型进行微调。

上下文窗口:每个版本的上下文长度从8k扩展至128k,大致相当于模型一次能够记住、理解和处理9.6万字,几乎是一整本原版《哈利·波特》。

许多网友跃跃欲试,让Llama 3.1与模型“前辈们”一同竞技,发现不仅是指标有了显著提升,计算资源也节省不少。

基于网友的测试,与Llama 3相比,Llama 3.1的能力有显著提升。其中human_eval和truthfulqa_mc1两项能力进步明显,意味着生成编程代码的能力更强、生成问题答案时更具真实性。

同时,Llama 3的instruct(指令)模型相较于base(基座)模型,在提示学习、语境学习、高效参数微调等指标提升明显。

这是合理的,因为base模型通常未经特定任务微调,而instruct模型经过专门训练后,能遵循指令或完成特定任务。通常,instruct模型的指标表现更出色。

这让人更加期待Llama3.1的正式发布。目前泄露的Llama3.1模型测试,结果仅仅针对base模型,而instruct模型表现可能会更佳!

△图源:X用户@thenameless7741

△图源:X用户@thenameless7741

令人惊讶的是,基准测试结果中,Llama 3.1 70B模型打平甚至击败 GPT-4o,Llama 3.1 8B模型则与Llama 3 70B模型性能接近。有网友猜测,这可能采用了模型蒸馏技术,即8B和70B的模型是由405B最大规模的模型简化得出,让大模型变“小”。

模型蒸馏技术可以看作学生向老师学习。大而强的模型(老师模型)是老师,较小且简单的模型(学生模型)是学生。学生模型通过“模仿”老师模型来学习,使输出尽可能接近老师模型的输出,从而学到相似的知识和能力。

经过蒸馏训练后的学生模型,可以减少模型大小和计算资源需求,同时又能保持较高的性能表现和相当的精度。

△图源:Reddit

不是谁都跑得动,但推理价格很划算

Llama 3.1到底会不会如愿开源,还是个未知数。但即便开源,想要用得起Llama 3.1,家里仍然得有矿。

想要跑得动Llama 3.1,最基础的入门券,就是足够的GPU。

泄露文件显示,Llama 3.1 405B在H100-80GB类型硬件上的训练时间为30.84M GPU小时。这意味着,假设每小时只用一张H100-80GB,运行Llama 3.1 405B就要花30.84M小时——等模型跑起来,要过3500年!

△图源:Reddit

如果想要私有化部署,企业要想在一个月内顺利运行Llama 3.1 405B,就要储备起码43000块H100-80GB。按照4万美金的H100单价算,使用Llama 3.1 405B的算力入场券,就高达17亿美金,折合人民币125亿元。

不过好消息是,Llama 3.1的推理成本,可能会更便宜。

据Artificial Analysis预测,吞吐1百万Tokens所需的成本,Llama 3.1 405B将比质量相似的前沿模型(GPT-4o 和 Claude 3.5 Sonnet)便宜,更具性价比。

△图源:X用户@ArtificialAnlys

除此之外,有网友通过源文件代码猜测,Llama 3.1 405B可能会成为会员产品,用户使用时需要付费。不过,真实情况如何,还需等待官方发布。

△图源:X用户@testingcatalog

(36氪作者周鑫雨对本文亦有贡献)

欢迎交流

欢迎交流

笔记本无线网卡有哪几种 有必要升级吗

无线网卡是很多朋友购买笔记本时容易忽视的部分,相比较处理器、内存、显卡和硬盘,无线网卡几乎不可选,而且很少有厂商提到自家产品采用的无线网卡型号。大家可能遇到过这种情况:为什么手机可以连接到5Ghz,而自己的笔记本却只能搜索到2.4Ghz的信号;玩游戏时ping值不稳定,而舍友却没有问题。以上这些情况就与无线网卡有关。

笔记本无线网卡

下面我们重点聊一下笔记本中常见的无线网卡类型,比较古老及各种USB外接无线网卡不在讨论之列。

· 无线网卡的接口

目前常见的无线网卡接口有两种,一种是mini PCI-E,另一种NGFF(也就是M.2)。mini PCI-E出现在在比较老的笔记本中,而近几年的笔记本基本都采用的为NGFF。常见mini PCI-E无线网卡的长宽为27mm×30mm,常见NGFF无线网卡的长款为22mm×30mm,与2230规格的固态硬盘一致。

mini PCI-E无线网卡

NGFF无线网卡

另外,很多超轻薄笔记本的无线网卡直接封装在了主板上,无法更换。

· 无线网卡的频带

频带这个词可能有点陌生,其实就是大家常说的2.4Ghz、5Ghz。需要注意,这里的5Ghz和大家讨论的5G是两码事,5Ghz指的是运行在5Ghz的无线频段,理论上速度要比2.4Ghz快。

一些型号比较老的笔记本采用了较老的无线网卡,并不支持5Ghz,所以出现了开篇一些朋友遇到的问题:笔记本搜不到5Ghz WiFi,但手机可以搜到。想要让老设备连接上5Ghz,只能换无线网卡。

2.4Ghz和5Ghz的优缺点

目前绝大多数新笔记本都会同时支持2.4Ghz和5Ghz WiFi,2.4Ghz的缺点在于信号频宽较窄,设备比较多,比如家电、无线鼠标都是通过2.4Ghz连接,所以信号较为复杂,存在干扰。但由于其频率较低,传播距离更远,穿墙性能更强。

5Ghz由于频带较宽,而且干扰少,所以网速比较稳定、快速。由于5Ghz的频率较高,传播距离并不是很远,其覆盖范围和穿墙能力都不如2.4Ghz。

· 无线网卡的最高速度和TX/RX rate

一般情况下,无线网卡厂商都在会官网上标注清楚一款无线网卡的最高速度,这个最高速度并不代表你能够达到的网速,只代表这款无线网卡的速度上限。目前常见的最高速度有四种,分别为300Mbps、433Mbps、867Mbps和1.73Gbps。数值越大,代表最高速度越高。其中300Mbps基本和宽带概念差不多,最高网速大约为37.5MB/s(300÷8)。如果家里是500M的宽带,那么只支持300Mbps的无线网卡明显拖后腿。

英特尔无线网卡规格示例

TX/RX rate稍微“冷门”点,TX指的是发送,RX指的是接收。笔记本无线网卡常见的TX/RX rate有1×1和2×2两种,2×2意思是发送和接收天线各有两个,天线越多,理论传输速度越快。

· 无线网卡有必要升级吗

除了以上关于无线网卡的基本知识外,还有像802.11ac标准、MU-MIMO技术等,这些都是无线网卡中非常重要的部分,但由于比较复杂,而且普通消费者在更换网卡的时候,很少需要考虑这些,所以再此就不提了。

如果正常使用没有问题,看过文章之后才发现无线网卡的定位较为低端,那么完全没有必要更换网卡。以下几种情况可以考虑升级无线网卡:

1、必须要连接5Ghz WiFi。一些无线路由器的2.4Ghz信号非常差,如果遇到这种情况,恰巧笔记本只支持2.4Ghz WiFi,可以考虑更换无线网卡;

2、游戏中ping值太高。一些定位较为低端的产品,在游戏过程中会出现ping不稳定的情况。如果确实不是无线路由器的问题,那么可以更换定位更高的无线网卡;

3、下载速度完全达不到宽带上限。这种情况是因为网卡的最高速率低于宽带,所以更换无线网卡是比较好的选择。

关于如何判断一款无线网卡是好是坏,如何选择无线网卡,我会在后续文章中详解。

相关问答

kaiyunapp官网入口 下载 (官方)APP 下载 安装/网站网页通用版入口

飞利浦喷雾仪和睫毛膏差不多大,轻盈而且很小巧到可以随身携带~就算是mini手包都能放得下,设计很符合日常使用,能够做到随时给肌肤补水,喷出来的水雾...

ipad mini2 怎么 下载 安装微信 怎么安装微信 具体是安装微信的...

首先你要把ipad链接单wifi,然后在appstore上下载微信,正常情况下下载的都是最新版本,如果不是,系统会提醒更新,直接更新就好了下载平行空间硬件问题,找店家退...

kaiyun888 下载 安装(官方)手机APP 下载 IOS//网页通用版入口

Divoom.点音玛奇朵粉嫩的机身,还有个敲可爱的小盒子装着,打键盘还有“哒哒哒”的声音,还有像素动画。下载它们官方的APP还可以听电台、设闹钟、选动...

ipadmini2可以 下载 pp助手吗-ZOL问答

欢迎关注PP助手!很高兴为您解答:请尝试修改DNS地址为8.8.8.8和8.8.4.4后再进行下载安装。如果您仍有PP助手产品问题,欢迎继续反馈,我们会第一时间...

kaiyun 下载 app下载安装(官方)最新下载IOS/安卓版/手机版APP_微思

💪kaiyun下载app下载安装手机版🎃支持:64/128bit🤡是一款体积小巧、操作简单、功能全面、操作简单的出色下载工具。这款软件支持将淘宝、天猫、京东、阿里巴巴...

iPad mini 2怎么 下载 微信,如何下载微信?iPad mini 2下载安装微信方法?

这个只需要利用iPad自带的一个下载软件就可以了,登录进去之后直接输入微信,然后点击下载就可以。这个只需要利用iPad自带的一个下载软件就可以了,登录进去之...

盯盯拍视频怎么 下载 ?

下载盯盯拍的片段其实很简单。首先,我们需要打开盯盯拍的App,并进入到需要下载的视频,然后点击底部的“分享”按钮。接着,在分享弹窗中会出现“复制链接”...

苹果平板电脑如何 下载 PP助手 - 懂得

下载步骤如下:工具:iPadmini41、打开iPad桌面,点击Safari浏览器进入,如图所示;2、进入后在上面的搜索框中搜索z.25pp.com-pp助手,然后单击进入如图...

mini 前缀的单词有哪些?五个以上加中文意思_作业帮

以mini前缀的单词有哪些?五个以上加中文意思登录注册?题目作业帮用户数学2017-09-23文字搜索太麻烦,试试下载APP拍照搜题问老师广告其他类似问题举例英语的前...

es 开头的英语单词有哪些?_作业帮

[最佳回答]es好像不是前缀,你看一下我给的几个单词,没有哪个能把es和后面的分开,去掉后后面的意义完全变了,或者根本没意义.常用前缀:aero-空气天空太空ant...

 很色漫画  徐春 
王经理: 180-0000-0000(微信同号)
10086@qq.com
北京海淀区西三旗街道国际大厦08A座
©2024  上海羊羽卓进出口贸易有限公司  版权所有.All Rights Reserved.  |  程序由Z-BlogPHP强力驱动
网站首页
电话咨询
微信号

QQ

在线咨询真诚为您提供专业解答服务

热线

188-0000-0000
专属服务热线

微信

二维码扫一扫微信交流
顶部