享未来数码网
首页 > 彩电 > 英伟达H100启用TensorRT-LLMAI推理性能飙升

英伟达H100启用TensorRT-LLMAI推理性能飙升

9月9日消息,英伟达公司今日宣布推出了一项名为TensorRT-LLM的创新项目,旨在大幅提升其Hopper系列AI GPU上的语言模型推理性能。根据英伟达的介绍,TensorRT-LLM是一款深度优化的开源库,利用了一系列尖端技术,包括SmoothQuant、FlashAttention和fMHA等,以加速处理大型语言模型,如GPT-3(175 B)、Llama Falcom(180 B)和Bloom等模型。

据悉,TensorRT-LLM的一个显著特点是引入了一种名为In-Flight Batching的调度方案,这使得GPU能够在处理大型计算密集型请求时,同时动态处理多个较小的查询。这一创新性的方案不仅提高了GPU的性能,还使得H100型号的吞吐量提高了2倍。

在性能测试方面,英伟达以A100作为基准,对比了H100和启用了TensorRT-LLM的H100。在GPT-J 6B模型的推理性能测试中,H100相比A100提升了4倍,而启用了TensorRT-LLM的H100性能更是达到了A100的8倍。而在Llama 2模型上,H100相比A100提升了2.6倍,而启用了TensorRT-LLM的H100性能则高达A100的4.6倍。

这一重大突破意味着英伟达将继续领导AI硬件领域的发展,通过优化其GPU性能,为大型语言模型等计算密集型任务提供更快速和高效的计算支持。据了解,这将对人工智能应用在各个领域的发展产生积极影响,为未来的科技创新打开更广阔的可能性。

标签:

上一篇 目录 下一章

猜你喜欢

65寸电视性价比高推荐 微距模式镜头中...
一、微距模式:镜头中的秘密世界 在摄影艺术的众多技巧中,微距模式是一种独特而具有挑战性的技术,它能够捕捉到那些通常被忽略的细节,让我们发现了一个全新的视觉...
长虹电视是不是停产了 2023摄影大...
我是如何成为一名摄影高手的? 在这个春意盎然的季节,我决定参加2023摄影大赛。从小对摄影就充满了兴趣,随着时间的推移,这份热情也越来越深刻。我相信,通过...
32寸电视机液晶屏价格 47幅人文艺术...
在人文艺术摄影的世界里,每一张照片都隐藏着它独特的故事,这些故事可能是关于人物、场景、历史甚至文化的。这些故事不仅仅是为了讲述一个事件或情感,也反映了拍摄...
怀表 一路向西观看1...
是什么让我们选择了一路向西? 在这个世界上,有些地方就像是被神秘力量所选中,吸引着无数人前来探索。今天,我们要讲述的是一个关于时间和空间的奇妙旅程,一路向...

强力推荐