您的位置：首页 >科技 >

H100 推理性能最高提升 8 倍，英伟达发布 TensorRT-LLM 模型

来源：搜狐号-IT之家时间：2023-09-09 15:14:18

(资料图)

IT之家 9 月 9 日消息，英伟达今天宣布推出名为 TensorRT-LLM，是一个深度优化的开源库，能够在 Hopper 等 AI GPU 上加速所有大语音模型的推理性能。

英伟达目前已经和开源社区合作，利用 SmoothQuant、FlashAttention 和 fMHA 等尖端技术，实现 AI 内核来优化其 GPU，可以加速 GPT-3（175 B），Llama Falcom（180 B）和 Bloom 模型。

TensorRT-LLM 的亮点在于引入了名为 In-Flight batching 的调度方案，允许工作独立于其他任务进入和退出 GPU。

该方案允许同一 GPU 在处理大型计算密集型请求时，动态处理多个较小的查询，提高 GPU 的处理性能，可以让 H100 的吞吐量加快 2 倍。

在性能测试中，英伟达以 A100 为基础，对比了 H100 以及启用 TensorRT-LLM 的 H100，在 GPT-J 6B 推理中，H100 推理性能比 A100 提升 4 倍，而启用 TensorRT-LLM 的 H100 性能是 A100 的 8 倍。

在 Llama 2 中，H100 推理性能是 A100 的 2.6 倍；而启用 TensorRT-LLM 的 H100 性能是 A100 的 4.6 倍。

IT之家在此附上报告原文，感兴趣的用户可以深入阅读。

标签：

热门资讯

京东方艺云亮相世界显示产业大会，低碳智慧新品重磅发布 9月7日，世界显示产业大会在成都盛...
驻马店市安全生产综合督查组第三督查组督导西平文旅系统安全生产工作 9月8日上午，驻马店市安全生产综合...
熟龄肌如何选择胶原水光，这样做重塑肌肤，焕发青春气息 随着时间的流逝，肌肤中的胶原蛋白...
威睿公司与威腾电气达成战略合作，推进能源产业高质量发展 近日，威睿公司与江苏威腾能源科技...

观察

图片新闻

三亚学院迎来7000余名新生 三亚新闻网9月9日消息（三亚传媒融...
“最美的背影”纳入天涯区各校“开学第一课” 师生点赞传播校园正能量 金秋开学日，天涯区各校将《三亚日...
海南举办主题宣传推广全国会奖旅游买家“会”聚三亚 三亚新闻网9月9日消息（三亚传媒融...
三亚拟对35条街道进行精品化建设改造 三亚新闻网9月9日消息（三亚传媒融...

精彩新闻

艺术家发布联名信：生成式AI是实用工具，但需制定完善监管 IT之家9月9日消息，一群艺术家联名...
《潜行者 2：切尔诺贝利之心》游戏开发商因电气故障引发火灾 IT之家9月9日消息，根据捷克游戏网...
获近40亿补贴！中国电池制造商国轩高科147亿在美建厂计划敲定 获近40亿补贴！中国电池制造商国轩...
Lisa 法国顶级夜总会将挑战酒杯脱衣舞，疯马秀经理回应 Blackpink作为当下最火的韩女团之...
碳中和周报｜理想汽车计划进军自动驾驶卡车领域工信部：加强新型储能产业发展统... 《科创板日报》9月9日讯（实习记者...
女人最忌讳什么宝石手链 女人最忌讳戴着可疑来历的宝石手链...
手机基带是什么意思 手机基带是指手机的一个重要组成部...
2024年度城乡居保9月起缴费 本报讯为切实做好我市2024年度城乡...
甘肃兰州：今年购买新建商品房可享受50%契税补贴 甘肃省兰州市近日出台《关于进一步...
摩洛哥南部6.8级地震已致至少30人死亡 据摩洛哥媒体报道，摩洛哥南部8日...
新疆阿克苏地区库车市发生3.7级地震 中国地震台网正式测定：09月09日04...
可精准到毫厘！显微镜“手艺人”的“火眼金睛”是如何练成的？ 全国每卖出两台牙科手术显微镜，就...
同比增长40.1%！三亚离岛免税暑期销售逾38亿元 59.4万人次购物 三亚新闻网9月9日消息（三亚传媒融...
海南举办主题宣传推广全国会奖旅游买家“会”聚三亚 三亚新闻网9月9日消息（三亚传媒融...
Mozilla 开放 Thunderbird 升级通道，102 版本用户可升至 115 IT之家9月9日消息，Mozilla于今年7...
三亚拟对35条街道进行精品化建设改造 三亚新闻网9月9日消息（三亚传媒融...
“最美的背影”纳入天涯区各校“开学第一课” 师生点赞传播校园正能量 金秋开学日，天涯区各校将《三亚日...
消息称《足球经理 2024》游戏 11 月 6 日发行，售价 59.99 欧元 IT之家9月9日消息，消息源Billbil-...
哈尔滨多车加油后开出不远就熄火加油站：进水了、已赔付 哈尔滨多车加油后开出不远就熄火加...
达人为 Steam Deck 游戏掌机定制便携式外接键盘 IT之家9月9日消息，硬件黑客Karlis...
三亚学院迎来7000余名新生 三亚新闻网9月9日消息（三亚传媒融...
世界新动态：潢川：乐葡葡萄迎来丰收季 压架骈枝露颗圆，水精落落照晴轩。...
全球头条：2023年息县庆祝第39个教师节表彰大会召开 三尺讲台育英才，一支粉笔谱华章。...
罗山县审计局召开大数据审计工作交流座谈会暨2023年度审计业务工作中期总结推进会 9月7日，罗山县审计局召开大数据审...
商城县观庙镇：“流动堡垒”聚人心党旗他乡一样红_天天快讯 为进一步发挥驻外党支部组织群众、...
今日报丨骄阳不坠青云志磨砺始得玉初成——西平一中教育集团举行2023年军训汇报演出 铿锵有力的口号，矫健有力的步伐，...
光山：“油茶果”绘就乡村振兴新画卷 初秋时节，走进老区光山县的广袤农...
暖心光山孙铁铺派出所连续帮助群众寻回走失耕牛 秋收农忙时节，耕牛是农户必不可少...
手机充电发烫什么原因 手机充电发烫的原因有以下几个可能...
喝牛奶拉稀是什么原因 喝牛奶拉稀的原因可以有多种可能性...
石家庄第一座“青云阙”开启人居新时代 近日发布的《关于优化个人住房贷款...
海南约谈“六水共治”工作考核排名靠后市县 原标题：我省约谈“六水共治”工作...
杭州亚运会主媒体中心启动试运行 9月9日上午，杭州亚运会主媒体中心...
意大利机场地勤人员举行罢工 当地时间8日，意大利机场地勤人员...
机械、汽车等四个重点行业稳增长工作方案出台 工业和信息化部近日举行工业稳增长...
大连：与死神赛跑这个“片警”3天连救2人 3日18时10分左右，刚下班回家的大...
安卓 TV 14 Beta 版代码显示谷歌将推新款 Chromecast IT之家9月9日消息，开发者MishaalR...
B 社回复网友：英特尔 Arc A770 未达《星空》游戏最低要求 IT之家9月9日消息，不少英特尔显卡...
光照均匀不频闪色温自然不刺眼 本报讯（记者吴悠见习记者彭家一）...
消息称三星Galaxy S23 FE手机有黑色、白色、绿色和紫色四种颜色 IT之家9月9日消息，根据荷兰科技媒...
《匹诺曹的谎言》PS4/5 版大小曝光，最快 9 月 14 日预下载 IT之家9月9日消息，PS数据爆料者Pl...
我市6名学生荣获国家级“创新之星” 学生获奖后和家长、老师一起合影。...
沛县竞逐新赛道培育新动能 九月，沛县大地花红果硕，生机勃勃...
提升居民参保意识扩大医保参保覆盖面 “医保夜集市”现场。本报记者秦媛...
“牌子”减下来服务提上去 本报讯（记者吴云）近日，鼓楼区九...
喝牛奶对身体有什么好处和坏处 喝牛奶对身体有很多好处，同时也有...
广东今天部分地区仍有强降雨粤西珠三角等地或有大暴雨 今天（9月9日），广东部分地区仍有...
晒秋丨贵州黔西：天晴好晒秋喜迎丰收景 初秋时节，贵州省毕节市黔西市玉米...
北京今天降雨降温出行请注意防雨慢行车 北京市气象台9月9日6时发布预报，...
一女子滥用职权威胁理发店？山东深夜通报！记者独家对话被威胁店主！ 9月8日晚间，山东临沂郯城县融媒体...