AG旗舰厅百家乐谷歌最强AI芯片狙击英伟达B200，性能狂飙3600倍！谷歌版MCP一统AI智能体天地

发布日期：2024-09-02 10:57 点击次数：123

新智元报谈AG旗舰厅百家乐

裁剪：裁剪部 ZNHY

【新智元导读】重磅发布第七代TPU Ironwood，专为推理遐想，性能较从初代飙升3600倍，可与英伟达B200一较高下。不仅如斯，谷歌还带来了Veo 2等多款模子全新升级，就连「谷歌版」MCP契约也公布了。

推理时期的首款TPU降生了！

昨晚，一年一度的谷歌云大会上，初度亮相了谷歌第七代TPU——Ironwood，径直叫板Blackwell B200。

它是谷歌迄今为止性能最强、可推广性最高的定制AI加快器，亦然首款专为推理遐想的加快器。

相较于2018年的第一代TPU，Ironwood推感性能飙涨3600倍，效力提高了29倍。

以至，第七代全新TPU的性能是宇宙第一大超算的24倍。谷歌将于本年晚些时候雅致推出TPU v7。

继MPC之后，谷歌大会上初度亮相Agent2Agent（A2A）绽开契约，为智能体提供一个通用语言，不错在不同生态系统换取合营。

还有ADK、Agentspace，为开发者提供了全面构建、操作、接续AI智能体的智商。

此外，谷歌云大会精彩纷呈，Veo 2、Imagen 3、Chirp 3纷繁迭代升级，文本转音乐模子Lyria，Vertex AI成为唯独遮掩视频、图像、语音和音乐的全重生成式AI平台。

下一步，极具性价比Gemini 2.5 Flash也将登录Vertex AI。

推理时期首款TPU出世，失色B200

Ironwood的降生，不仅标记着谷歌在AI硬件又一大打破，还代表着AI基础设施的紧要滚动。

在谷歌看来，当下被迫「反馈式」模子，正滚动为主动「生成式」智能体。

这种滚动的中枢在于，AI不再只是停留在提供原始数据层面，而是约略主动检索信息、生成视力。

这恰是在这个「推理时期」，谷歌对将来AI基础设施的界说：更智能、更主动、更具合营性。

主要特质

· 性能权臣提高，同期谨防功耗效力，使AI责任负载约略更具资本效益地运行。

比较起第六代TPU Trillium，Ironwood在功耗效力（perf/watt）上杀青了2倍的提高；比2018年推出的首款Cloud TPU，更是高出了近30倍。

同期，谷歌先进的液冷惩办决议和优化的芯片遐想，即使在抓续、劳作的AI责任负载下，也能可靠地保管高达范例风冷两倍的性能。

图 3. 功耗效力相较于TPU v2提高了29.3倍

· 高带宽内存（HBM）容量大幅增多

Ironwood芯片搭载了高达192GB的显存，是Trillium的6倍。

如斯一来，便不错处理更大的模子和数据集，同期还减少了正常数据传输的需求，进而提高了性能。

· HBM带宽权臣提高

Ironwood芯片在带宽方面提高到了惊东谈主的7.2 Tbps，是Trillium的4.5倍。

极高的带宽确保了快速的数据拜访，这关于当代AI中常见的内存密集型责任负载至关垂危。

· 芯片间互连（ICI）带宽增强

Ironwood的双向带宽已增多到1.2 Tbps，是Trillium的1.5倍。这种芯片之间更快的通讯，有助于大限度高效的散布式磨砺和推理。

用Ironwood驱动推理时期

Ironwood为条件最严苛的AI责任负载提供了所需的大限度并行处明智商，举例用于磨砺和推理的、具有念念考智商的超大限度茁壮LLM或MoE模子。

关于谷歌Cloud客户，Ironwood可凭据AI责任负载需求提供两种规格——256芯片或9,216芯片。

图 1. FP8浮点运算峰值性能相较于TPU v2提高了3600倍

其中，每个单独的芯片峰值算力达4,614 TFLOPs。

当推广到每个pod 9,216个芯片，共计达到42.5 Exaflop时，Ironwood的算力是宇宙上最大的超等诡计机El Capitan的24倍以上——后者每个pod仅能提供1.7 Exaflops。

不仅如斯，Ironwood还配备了增强版的特意用于处理高档排序和保举任务的加快器——SparseCore。从而为更平凡的责任负载提供加快，包括超越传统AI边界，插手金融和科学边界。

Pathways是由谷歌DeepMind开发的ML运行时，可在多个TPU芯片上杀青高效的散布式诡计。

谷歌Cloud上的Pathways使得超越单个Ironwood Pod变得浮浅径直，约略将数十万个Ironwood芯片组合在沿路，从而快速股东生成式AI诡计的前沿。

图 2. Ironwood原生解救FP8，而v4和v5p的峰值TFlops为模拟值

OpenAI接洽员针对Ironwood与英伟达GB 200作念了性能对比，并示意TPU v7与GB200性能异常，以至后发先至。

全模态AI平台来了，Veo 2再升级

跟着音乐功能的加入，Vertex AI 当今是唯独一个领有涵盖通盘模态——视频、图像、语音和音乐——的生成式媒体模子的平台。

这次放出的紧要更新共有四项：

· 文本转音乐模子Lyria，让客户不错从文本领导词运行，生成完整的、分娩就绪的素材。

· Veo 2的新裁剪和录像机甩手功能，可匡助企业客户精准地优化和再利用视频内容。

· Chirp 3当今包含了Instant Custom Voice，这是一种仅需10秒音频输入即可创建定制语音的新措施。

· Imagen 3校正了图像生成和图像开采智商，用于重建图像中缺失或损坏的部分，并使物体移除裁剪的质地更高。

Lyria：文生音乐模子

Lyria能生成高保真音频，精良捕捉精妙之处，并能在多种音乐家数中提供丰富、细节介意的乐曲。

· 企业不错提高品牌体验

凭据品牌独到的调性，为营销行径、居品发布或千里浸式店内体验快速定制配乐。

通过Lyria，企业不错创建与方针受众产生深度共识的声息，培养表情关系并增强品牌牵挂度。

· 创作家不错简化内容创作经过

关于视频制作、播客和数字内容创作而言，寻找无缺的免版税音乐可能是一个耗时且腾贵的过程。

而Lyria不错在几分钟内生成定制音乐曲目，径直契合您内容的心思、节拍和叙事，从而匡助加快制作责任经过并裁汰授权资本。举例：

创作一首高能的比波普 (Bebop) 调子。优先凸起令东谈主昏倒的萨克斯管和小号独奏，以闪电般的速率交换复杂的乐句。钢琴应提供打击乐式的和弦伴奏，行进贝斯 (walking bass) 和快节拍的饱读点驱动着狂热的能量。基调应是令东谈主奋斗且强烈的。捕捉夜深、烟雾缭绕的爵士俱乐部的嗅觉，展示精采本领和粗疏创作。要让听众无法安坐。

Veo 2：推广裁剪功能

Veo 2则为视频的创建、裁剪和视觉终结添加了一套遒劲的功能集，亚博ag百家乐使其从一个生成用具滚动为一个全面的视频创作和裁剪平台：

· 视频开采 (Inpainting)：无需手动修饰即可得到干净、专科的裁剪终结。

你不错移除视频中不需要的布景图像、徽标或干涉物，使它们在每一帧中齐平滑无缺地销毁，看起来就像从未存在过不异。

· 画面推广 (Outpainting)：推广现存视频素材的画面，将传统视频疗养为针对网页和迁徙平台优化的款式。

你不错简略疗养内容来适当不同的屏幕尺寸和宽高比——举例，将横向视频疗养为用于酬酢媒体短视频的纵向视频。

· 应用复杂的电影拍摄时期：新功能包括带领镜头构图、录像机角度和节拍等。

团队不错简略诈欺复杂的电影拍摄时期，无需复杂的领导词或专科常识。

举例，使用录像机预设向不同标的迁徙录像机、创建延时影相终结或生成无东谈主机作风镜头。

· 通过相接两个现存素材创建连贯的视频。

借助插值（Interpolation）功能，你不错界说视频序列的运行和收尾，让Veo无缝生成相接帧。

这确保了平滑过渡并保抓视觉连气儿性，从而创造出细密且专科的最终制品。

Chirp 3：即时定制语音和转录功能更新

Chirp 3的高清语音（HD voices）功能提供了阑珊35种语言的当然传神语音，并有8种讲话东谈主选项。

除此除外，谷歌还新增了两个功能：

· 即时定制语音（Instant Custom Voice）

只需要10秒的音频输入，即可生成传神的定制语音。这使得企业约略个性化招呼中心、开发无箝制内容，并成立独到的品牌声息——同期保抓一致的品牌形象。

· 带讲话东谈主日记功能的转录（Transcription with Diarization）

这项遒劲的功能不错精准地永诀和识别多东谈主灌音中的单个讲话东谈主，权臣提高转录内容的融会度和可用性，适用于会议纪要、播客分析和多方通话灌音等应用场景。

Imagen 3：校正质地和裁剪功能

手脚谷歌最高质地的文本转图像模子，Imagen 3约略生成具有比之前更好细节、更丰富光照和更少干涉性伪影的图像。

这次，谷歌权臣校正了Imagen 3的图像开采（inpainting）智商，用于重建图像中缺失或损坏的部分。

尤其是在物体移除（object removal）方面，不仅质地更高，并且终结也愈加当然。

MCP之后，谷歌再造A2A契约

智能体不错匡助东谈主们作念许多责任，从订购新电脑，到协助客服东谈主员，再到解救供应链缱绻。

智能体越来越实用的关节在于让它们约略在一个动态的多智能体生态系统中彼此合营，越过零丁的数据系统和应用表率。

为此，谷歌推出了全新的绽开契约——Agent2Agent（A2A），得到了阑珊50家合作伙伴的解救和孝顺。

A2A契约将使AI智能体约略彼此通讯，安全地交换信息，并在各样企业平台或应用表率上融合行径。

它是一个绽开契约，与Anthropic的模子高下文契约（MCP）相反相成。

A2A遐想原则

A2A驯服了五大中枢原则：

·拥抱智能体的智商：A2A勉力于于让智能体以它们当然、非结构化的相貌合营。

·基于现存范例：A2A构建在已有的、平凡使用的范例之上，比如HTTP、SSE、JSON-RPC。

·默许安全：A2A从遐想之初就解救企业级别的认证和授权，与OpenAPI的认证机制保抓一致，确保安全性。

·解救永劫刻运行的任务：遐想A2A时讨论了纯真性，它能胜任从快速任务到需要数小时以至数天的深远接洽等多种场景，尤其是在有东谈主的参与下。

·不限模态：智能体的宇宙不单要文本，因此咱们遐想A2A时解救多种模态，包括音频和视频流，让它愈加各样化。

A2A如何责任

A2A让「客户端」智能体和「云尔」智能体之间的换取变得更顺畅。

客户端智能体负责制定和传达任务，而云尔智能体则负责执行这些任务，尽量提供正确的信息或遴荐正确的行径。这个互动触及几个关节功能：

·智商发现：智能体不错通过JSON款式的「Agent Card」来展示我方的智商。客户端智能体不错凭据这个「柬帖」找到最适当执行某项任务的智能体，并通过A2A与云尔智能体换取。

·任务接续：客户端智能体和云尔智能体之间的交流以完成任务为中枢，观念是餍足用户的需求。

·合营：智能体之间不错彼此发送音书，共享高下文、回报、产物或用户指示。

·用户体验协商：每条音书中包含「parts,」，这是一个完整的内容单位，比如一张生成的图片。

实例：寻找候选东谈主

用户（比如招聘司理）不错让我方的智能体去寻找恰当职位形色的候选东谈主。

这个智能体会与其他专科智能体互动，帮你挖掘潜在候选东谈主。用户收到保举名单后，不错再指引智能体安排后续口试，让找东谈主的过程更顺畅。口试收尾后，还不错让另一个智能体赞理作念布景侦查。

A2A有望开启一个智能体彼此操作的新时期，推动转换，打造更遒劲、更纯确切AI智能体系统。咱们深信，这个契约将为将来铺平谈路，让智能体约略无缝合营，惩办复杂问题，提高咱们的生计。

咱们勉力于于与合作伙伴和社区沿路，公开构建这个契约。咱们会把契约开源，并为孝顺者缔造融会的参与旅途。

谷歌AI代码助手，变身超强智能体

这次大会的另一个更新，等于谷歌的AI编码助手——Gemini Code Assist，仍是在预览中得到了「智能体」智商！

在Cloud Next大会上，谷歌告示：Code Assist当今不错部署新的AI智能体，这些智能体不错执行多个门径，来完成复杂的编程任务。

举例，这些智能体不错从Google Docs中的居品规格创建应用表率，或者将代码从一种语言疗养为另一种语言。

另外，Code Assist当今除了其他编码环境外，还可在Android Studio中使用。

这次升级，亦然谷歌被GitHub Copilot、Cursor和Devin这些竞争者给逼疯了。

肉眼可见，当今AI编程隐含着庞大的掘金市集，各家的竞争也日趋尖锐化。

不外，Code Assist能作念到什么进度，现时还不融会。接洽标明，即使是今天最佳的代码生成AI，也经常会引入安全过失和造作，这是由于编程逻辑相识智商的毛病。

比如对Devin的一项评估就发现，它只完成了20项任务中的3项。

接下来，就让咱们期待Gemini Code Assist在骨子编程环境中的弘扬了。

参考府上：

https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai