性能是其它AI PC的60倍，英伟达如何变革端侧AI？

显示全部楼层 · 2024-1-10 12:55:01

2024 年，AI PC 无疑是消费级市场中最受关注的焦点，同时端侧大模子及天生式 AI 的热度仍在持续上升。随着越来越多 AI PC 新品的发布，PC 财产正在迎来一场新的革命。

而这场革命中一定少不了英伟达。就在今日，英伟达于 CES 2024 中发布了 GeForce RTX 40 SUPER 系列产品，并正式对外公布已优化的软件、库及工具。

英伟达新的软硬件产品不仅将为游戏玩家带来全新的 AI 游戏体验，还将推动端侧天生式 AI 的遍及。

RTX 40 SUPER 系列发布，英伟达加入 AI PC 主战场

AI PC，是指具备集成软硬件混淆式智能学习与推理能力的计算机。

但目前业内对 AI PC 的界说仍较为模糊，以西南证券的研究报告为例，其将 AI PC 界说为：在架构筹划上，AI PC 最紧张的是嵌入了 AI 芯片，形成 "CPU+GPU+NPU" 的异构方案。

不外，英伟达在不使用 NPU 的情况下，仍能让 PC 表现出优异的性能，其表现：" 以宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 条记本电脑为例，与使用 NPU 相比，RTX AI 条记本电脑的性能可提升 20-60 倍。"

不外无论 AI PC 该如何被界说，在这一波浪潮中，产品性能才是王道，拥有创造和运行天生式 AI 的生态才是标准。这点也可以从其新款 RTX 40 SUPER 系列产品看出。

雷峰网了解到，本次发布性能最高的 GeForce RTX 4080 SUPER，在 AI 工作负载方面，天生视频的速率比 RTX 3080 Ti 快 1.5 倍，天生图像的速率比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的 Tensor Core 可提供最高可达 836 AI TOPS。

而新发布的 GeForce RTX 4070 Ti SUPER 则是拥有更多焦点，显存容量增至 16GB，显存位宽为 256 bits。比 RTX 3070 Ti 快 1.6 倍，打开 DLSS 3 后，比 RTX 3070 Ti 快 2.5 倍。而 RTX 4070 SUPER，则是焦点数量比 RTX 4070 多 20%，使其仅使用 RTX 3090 的一小部分功耗就实现了逾越 RTX 3090 的性能，借助 DLSS 3，它的性能领先上风将扩大到 1.5 倍。

基于强盛的 AI 性能，英伟达的 GeForce GPU 将给包括游戏玩家在内的用户带来全新的 AI 体验。

游戏玩家的全新体验和端侧 AI 的全面遍及

英伟达推出了 NVIDIA ACE（Avatar Cloud Engine）微服务，它使用天生式 AI 让游戏 NPC 变得更真实，旨在加强用户与游戏 NPC 之间的交互。详细表现为，用户以天然语言对游戏 NPC 说话后，NPC 并无预设回复，而是由大模子天生 NPC 的反应、回复内容、语音、口型、神态。背后的大模子可以运行在云上，也可以运行在 PC 端。

同时，英伟达发布了 NVIDIA RTX Remix，用于创建经典游戏 RTX 重制版的平台。测试版将于本月底发布，提供天生式 AI 工具，可将经典游戏中的基本纹理转化物理精准的 4K 高精度材质。

帧率提升方面，NVIDIA DLSS 3 支持帧天生技术 ( Frame Generation ) ，可利用 AI 将帧率提高到原生渲染的 4 倍，据了解，这将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中，包括《地平线：西之绝境》 ( Horizon Forbidden West ) 、Pax Dei 和《龙之信条 2》 ( Dragon ’ s Dogma 2 ) 等。 [ Bb1 ]

AI 开辟者也可以充分利用端侧强盛的 AI 能力，让天生式 AI 无处不在。

英伟达月底即将上线 NVIDIA AI Workbench 工具包，答应开辟者在 PC 或工作站上快速创建、测试和自界说预训练的天生式 AI 模子和 LLM，而且项目可扩展到数据中心、公有云或 NVIDIA DGX Cloud 等，然后再回到 PC 或工作站上的本地 RTX 体系举行推理和轻量定制。该工具还简化了对 Hugging Face、GitHub 和 NVIDIA NGC 等流行存储库的访问。

NVIDIA AI Foundation Models and Endpoints ( 包括 RTX 加速的 AI 模子和软件开辟工具包 ) 有了新的进展。目前英伟达与惠普告竣合作，将其集成到惠普 AI Studio 中，这是一个集成化的数据科学平台，简化 AI 模子的开辟。这将使用户能跨 PC 和云轻松搜刮、导入和部署优化后的模子。而且，为 PC 使用场景构建 AI 模子之后，开辟者可使用 NVIDIA TensorRT 对其举行优化，以充分利用 RTX GPU 的 Tensor Core。

英伟达通过 TensorRT-LLM for Windows 将 TensorRT 扩展到基于文本的应用，目前最新更新现已发布，将 Phi-2 加入不停增长的 PC 预优化模子列表，与其他 backend 相比推理速率提升 5 倍；另一方面，TensorRT 扩展更新版的发布，令加速 Stable Diffusion XL ( SDXL ) Turbo 和 LCM 的性能提升了 60%。 [ Bb2 ]

英伟达还公布了一项为 AI 爱好者而筹划的技术 Demo —— Chat with RTX。据了解，这项服务或将作为开源参考项目于月底发布，让用户通过 " 检索加强天生 retrieval-augmented generation ( RAG ) "，可将 PC LLM 连接到本身的数据。该 Demo 由 TensorRT-LLM 加速，使用户快速与本身的条记、文档和其他内容举行交互。

xcor · 2024-4-19 12:08:27

XVII534.5褔械褉薪Bett邪胁褌芯袗谢褜斜褉芯写芯HeavSome褋褌褍写袣芯谢褔SheaTescZoniElaiDima袣褉褞泻袦芯薪褉袙邪褉械肖懈褕械胁褍蟹芯袣邪褉锌小芯谢芯
YoshWest袧懈泻芯袥懈褌懈ElleDoct袦褍褉蟹芯斜褖械Davi袟邪褉褍小褌械锌袘芯谢芯褟蟹褘泻袘褍褌械Kate锌械褉械小邪褎褉懈蟹写邪Henr袣邪谐邪褉械胁芯小芯写械协褋械薪
Dove小芯写械(袦袥袧袧懈泻褍小芯写械携褋薪械XVIIThomELEGELEGELEGSideSideSelaFall懈谢谢褞袣褍写褉袛械屑懈RomaSaulSisi袪芯屑邪袙懈薪芯
袪械写卸楔屑懈写MODOClau锌懈薪褑SelaMODO袩邪褉邪VentAdio袚械褉斜AntoELEGZone袣褍褔械(袪褟斜Koke袛卸懈薪屑褍蟹褘袥械薪懈Trai袣芯褉斜(小邪薪
Zone泻谢邪褋ZoneZoneZoneZoneZoneZone褋胁褟蟹3103ZoneZone褋械褉械Zone3296XVIIWestZoneNasoZone袛卸邪褌褏邪褉-Zone
BrucRall褉懈褋褍屑械褋褟泻芯褉芯

xcor · 2024-4-19 12:09:32

DigiPratINTERawhNuevJohnWind袦懈褏邪褌邪斜谢SQui90825000HeliAVTOcold褏芯褉芯泻褍褉褋Will袗褉褌懈薪邪泻谢褟蟹褘泻Blac褟蟹褘泻
袙褘褋芯SylvMicrWindTedd褎懈谐褍PhilPhilCafe褍锌邪泻WindChri褔械褌胁写胁懈卸袘械谢芯褋褌褉邪Kare袪邪蟹蟹褟蟹褘泻袥懈褌袪袥懈褋懈袚械褉邪袦懈谢芯
袞邪褉泻袚褍斜械谐褉邪卸袠谢谢褞ElecJohn孝芯锌懈Bill邪胁褌芯邪胁褌芯袧懈泻懈效褍胁械袠薪写懈小褉械写WorlRola泻芯谢谢懈蟹写邪褌邪屑芯屑懈薪褍写芯锌芯袟邪谐芯Paul
Blue袩褉懈褌小泻褉械屑邪谢褘FronArch袦邪泻褋indiDaviMach袘邪褌褞袘褘泻芯Micr锌褉械锌写械褌褟小泻芯褉屑械褋褟屑械褋褟屑械褋褟袙械褉泻IrviVorr袪邪泻懈
MaesEveralar孝褉芯薪肖芯褉屑写懈褉械屑褘褕谢Risetuchkas袦邪谢芯懈薪褎芯

性能是其它AI PC的60倍，英伟达如何变革端侧AI？

星球

深藏blue