醋醋百科网

Good Luck To You!

NVIDIA Tensor Core对RTX显卡光线追踪的性能影响

记得有一次跟朋友们聊技术,谈到NVIDIA为什么不在GeForce消费级显卡上砍掉Tensor Core时,我顺手发了一句很大众化的答案:“因为要配合RT光线追踪来用”。如果没记错的化,NV自己就是这样说的,不过如果较真一点,似乎可以引出2个问题:

1秒出图,全球最快的开源Stable Diffusion出炉

机器之心发布

机器之心编辑部

OneFlow 将 Stable Diffusion 的推理性能推向了一个全新的 SOTA。

耕升RTX 4070 SUPER 踏雪Mini显卡评测 高性能ITX神器

近期发售不少游戏大作,而通过我们此前的实机测试来看,70级显卡即可完美驾驭,其中又以后来发布的SUPER系列性价比最高。那么今天给大家带来的则是耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的评测。

踏雪Mini是目前耕升踏雪系列针对双风扇小尺寸显卡推出的型号,整体的设计语言与三风扇踏雪基本相同,但相对更圆润一些,非常符合ITX小巧迷你的设计初衷。

下面就让我们来一起看下耕升GeForce RTX 4070 SUPER 踏雪Mini显卡的外观设计。

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

TensorRT LLM加速Gemma!NVIDIA与谷歌牵手,RTX助推AI聊天

NVIDIA日前在其官方博客中表示,与谷歌合作在所有NVIDIA AI平台上为Gemma推出了优化。Gemma是谷歌最先进的新轻量级2B(20亿)和7B(70亿)参数开放语言模型,可以在任何地方运行,降低了成本,加快了特定领域用例的创新工作。

这两家公司的团队密切合作,主要是使用NVIDIA TensorRT LLM加速谷歌Gemma开源模型的性能。开源模型Gemma采用与Gemini模型相同的底层技术构建,而NVIDIA TensorRT LLM是一个开源库,用于在数据中心的NVIDIA GPU、云服务器以及带有NVIDIA RTX GPU的PC上运行时,可以极大优化大型语言模型推理。这也这使得开发人员能够完全利用全球超过1亿台数量的RTX GPU AI PC完成自己的工作。

CUDA 与 TensorRT 部署实战课程:工业视觉检测中的落地技巧

CUDA 与 TensorRT 部署实战课程:工业视觉检测中的落地技巧


索泰RTX 5070 XGAMING OC显卡评测:极具个性外观之下 仍是游戏利器

一、前言:RTX 5070又多一个新选择

NVIDIA RTX 5070又多一款新产品,索泰GeForce RTX 5070 XGAMING OC显卡也来了。

最适合深度学习的显卡是哪款,哪款性价比最高

选择深度学习显卡时,主要看CUDA核心数、显存(VRAM)、带宽、功耗以及支持的软件生态(如CUDA、cuDNN、TensorRT)。

当前最适合深度学习的显卡:

  1. 高端(适合专业深度学习和大模型训练) NVIDIA H100(最强性能,适合数据中心,价格极高) NVIDIA A100 80GB

用TensorRT-LLM加速大模型推理的5个技巧

用TensorRT-LLM加速大模型推理的5个技巧

最近我在公司折腾大模型推理加速,用了NVIDIA新出的TensorRT-LLM框架。这玩意儿真不是盖的,把原来跑得像蜗牛的模型一下子提速了好几倍。不过要玩转它也没那么容易,踩了不少坑才搞明白。

索泰GeForce RTX 5060 Ti 16G XGAMING显卡评测:2K百帧游戏体验

4 月过半,RTX 5060 Ti 系列显卡终于是姗姗来迟,还在用 50、60 后缀老显卡的玩家估计已经在持币观望了。GeForce RTX 5060 Ti 显卡这次首发了 16GB GDDR7 的大显存版本,算是一步到位了。魔法般的 RTX DLSS 4 技术也极大拔高了大家对 RTX 5060 Ti 性能上限的期待。

那么,RTX 5060 Ti 系列显卡的表现究竟如何呢?IT之家将通过这张索泰 GeForce RTX 5060 Ti 16G XGAMING 显卡给你答案。

<< < 14 15 16 17 18 19 20 21 22 23 > >>
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言