特色与介绍
下一级推理加速已经到来
我们正面向未来砥砺前行。在未来,人工智能将会触及并改善与客户的每一次互动、每一种产品以及每一项服务。认识到未来需要一个能够加速现代人工智能各种应用的计算平台,使企业能够创造新的客户体验,重新构想他们如何满足和超越客户需求,并经济高效地扩展他们基于人工智能的产品和服务。
NVIDIA TESLA T4 GPU 是世界上极其先进的推理加速器。搭载 NVIDIA Turing Tensor Core 的 T4 提供革命性的多精度推理性能,以加速现代人工智能的各种应用。T4 封装在节能的小型 70 瓦 PCIe 中,可针对横向扩展服务器进行优化,并且旨在实时提供极其先进的推理。
极具突破性的推理性能
Tesla T4 引入革命性的 Turing Tensor Core 技术,具备人工智能推理的多精度计算性能。从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,实现性能的重大突破。
先进的实时推理
NVADIA T4响应性是提高用户参与度的关键,范围涉及诸多服务,例如:会话式人工智能、推荐系统和可视化搜索。随着模型准确性和复杂性的提高,目前立即交付正确答案所需的计算能力也在呈指数级提升。英伟达Tesla T4 可提供 优于 40 倍的低延时高吞吐量,进而可以实时满足更多的请求。
T4 推理性能
视频转码性能
随着在线视频的数量呈指数级增长,人们对有效搜索以及从视频中获取洞察力的解决方案的需求也与日俱增。Tesla T4 为人工智能视频应用提供极具突破性的性能,其专用的硬件转码引擎将解码性能提升至上一代 GPU 的两倍。T4 可以解码多达 38 个全高清视频流,从而可以轻松地将可扩展的深度学习集成到视频管线中,以提供创新的智能视频服务。
规格
GPU 架构 | NVIDIA Turing |
TURING TENSOR CORE | 320 |
NVIDIA CUDA 核心 | 2560 |
单精度性能 (FP32) | 8.1 TFLOPS |
混合精度 (FP16/FP32) | 65 TFLOPS |
INT8 精度 | 130 TOPS |
INT4 精度 | 260 TOPS |
互联 | x16 PCIe Gen3 |
內存容量 | 16GB GDDR6 |
內存带宽 | 320+ GB/s |
功率 | 70 瓦 |
与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。
数据源来自:https://www.nvidia.cn/data-center/tesla-t4/