ag百家乐苹果版下载大模子推理是更大的“电老虎”, 不外照看东谈主员找到了顺服它的智力

点击次数：123 发布日期：2024-09-14 11:03

ag百家乐苹果版下载

AI大模子的磨真金不怕火阶段往往被以为是动力糜掷最高的阶段。在此阶段，磨真金不怕火诸如GPT系列的大模子需要多数的数据集进行磨真金不怕火，并通过更始其参数来使展望输出与标的输出尽可能一致。

固然大模子磨真金不怕火阶段的能耗很高，但有笔据标明，大模子推理调用频率远高于磨真金不怕火，导致推理阶段的能耗可能更高，成为更大的“电老虎”。

大模子推理能耗更高

跟着大模子的快速发展，与之有关的动力糜掷也在快速增长。在磨真金不怕火阶段，大模子即是“电老虎”。

Hugging Face曾清醒其BLOOM 大模子在磨真金不怕火技能糜掷了433兆瓦时（MWh）的电力。而其他大模子，如GPT-3、Gopher和OPT，在磨真金不怕火技能鉴别糜掷了1287、1066和324 MWh的电力。这些模子皆在TB级别的数据上进行磨真金不怕火，并具有1750亿个或更多参数。

这些动力糜掷的数据看起来确乎很惊东谈主，然而大模子磨真金不怕火往往只需要几个月的时分，唯有连合磨真金不怕火技能对动力的糜掷比较大。一朝模子磨真金不怕火完了，则会参预部署应用阶段，也就所谓的推理阶段。

相干词照看标明，推理阶段，即模子在骨子应用中生成输出（举例，ChatGPT的恢复用户查询），也可能糜掷多数的动力，以致可能高于磨真金不怕火阶段。

2023年2月，半导体分析机构SemiAnalysis曾臆度，OpenAI需要3617台NVIDIA的HGX A100工作器（共28936个GPU）来撑合手ChatGPT，这意味着每天的能耗为564 MWh，用于经管约2亿个用户肯求。比较GPT-3磨真金不怕火阶段臆度使用的1287 MWh，推理阶段的动力需求清醒要高得多。

SemiAnalysis相通预估，要是将肖似ChatGPT的AI整合到每一次谷歌搜索中，可能需要512,821台NVIDIA的HGX A100工作器，要是按照每台工作6.5 kW 功率谋划，每天能耗要达到80 GWh，年动力糜掷量达到 29.2 TWh。

这些预估数据标明，这种谷歌搜索全面转向AI搜索，可能会使谷歌年用电量加多到与总计这个词爱尔兰的用电量零碎。

大模子推理经过中动力糜掷影响身分

目下，这些大模子运转在各个畛域宽泛应用，ag百家乐解密一个日益进攻的问题也浮出水面：这些大模子在骨子推理经过中需要糜掷若干动力？其动力本钱是否可合手续？

最近，麻省理工学院（MIT）等机构的照看东谈主员进行了一项潜入的照看，旨在量化分析大谈话模子推理的动力本钱。

照看以Meta AI的LLaMA模子为对象，在不同的硬件（NVIDIA V100和A100 GPU）和数据集（Alpaca和GSM8K）上进行了推行。

照看评估了不同大小的LLaMA模子（7B，13B和65B）在最低硬件竖立下的推感性能和能耗。此外，还潜入分析了LLaMA 65B模子在多GPU和多节点环境下的漫衍式推感性能，以及不同的批经管大小和分片数目对动力糜掷的影响。照看的评估见解包括：每秒字数、每秒token数、每秒反应数、GPU期骗率、动力糜掷（焦耳），以及每秒动力糜掷（瓦特）、每个token动力糜掷和每个反应动力糜掷。

照看发现，A100 GPU 在推感性能上清醒优于 V100 GPU，尤其是在较小的 LLaMA 模子（7B 和 13B）上，推理速率进步了 1.25 到 2 倍。但在疏浚的模子大小下，使用 A100 GPU 的能耗也显赫加多，尤其是在 LLaMA 7B 模子上。因此，推理阶段，遴荐GPU类型需要量度性能和能耗。

同期，就像汽车排量越大越耗油一样，模子越大推理也越“耗电”。照看发现，关于 LLaMA 65B 这么的大模子，往往需要进行漫衍式推理，然而跟着分片数目的加多，推理的能耗也随之加多。

那么怎么才能缩短大模子的能耗呢？

照看东谈主员测试了GPU功耗截止（power capping）对LLaMA 65B模子推理时分、能耗和token生成速率的影响。照看发现，通过缩短GPU的功耗上限，不错大幅度减少推理经过中的动力糜掷，但这可能会导致推理时分的稍稍加多。

举例，照看团队将功耗截止从250W降至175W，不错终了平均23.21%的能耗缩短，同期推理时分仅平均加多约6.7%。而要是大幅度缩短功耗截止，举例从250W降至150W，推理时分则显赫加多，平均增幅约 19.49%。

最新照看具有较强的骨子酷好酷好。在骨子部署大模子时，数据中心不错根据不同的责任负载和性能需求，动态更始GPU类型以及适度功耗上限ag百家乐苹果版下载，从而缩短运营本钱和环境影响。

下一篇：AG真人百家乐线路训诫场上的“热气腾腾” 上一篇：AG百家乐是真的么原生鸿蒙AI欺诈再上新! 鸿蒙原生版纳米AI搜索、360AI办公已上架

ag百家乐解密

ag百家乐苹果版下载大模子推理是更大的“电老虎”, 不外照看东谈主员找到了顺服它的智力

推荐资讯

热点资讯

最新资讯

友情链接：

ag百家乐解密

ag百家乐苹果版下载 大模子推理是更大的“电老虎”, 不外照看东谈主员找到了顺服它的智力

推荐资讯

热点资讯

最新资讯

友情链接：

ag百家乐苹果版下载大模子推理是更大的“电老虎”, 不外照看东谈主员找到了顺服它的智力