特色与介绍
全球首颗光线追踪绘图处理器
NVIDIA Quadro RTX 8000 使用 NVIDIA Turing 架构及 NVIDIA RTX 平台,为专业工作流程带来计算机绘图领域十余年来最重大的进步。设计师和艺术家现在可以利用硬件加速光线追踪,深度学习,和高级着色的强大功能,大幅提高生产力,并以前所未有的速度创作出色的内容。
英伟达Quadro RTX 8000具有72个用于即时光线追踪的RT核心和用于AI增强工作流程的576个Tensor核心,可实现超过130 TFLOPS的深度学习效能。 NVIDIA QUADRO RTX 8000采用48 GB GDDR6内存,可通过 NVIDIA NVLink 技术扩展至96 GB,可适用于大容量内存需求的高负载工作,例如创造最复杂的模型,建构大量架构数据集,可视化大量数据科学工作负载,使用实时8K电影内容,加快高分辨率之最终渲染速度。 VirtualLink 提供与下一代高分辨率VR 头戴式显示器的连接,使您可以在最引人注目的虚拟环境中查看您的工作。
为专业人士打造
1. NVIDIA NVLink
用高速互连方式连接两个 GPU,将内存容量扩展到 96 GB,并以 100 GB/s 的数据传输率提供更高效能。
2. 次世代内存
配备业界率先采用的 48 GB 超高速 GDDR6 内存,可储存复杂的设计,庞大的建筑数据集,8K 电影内容等。
3. NVIDIA Turing GPU 架构
NVIDIA Turing 配备用于光线追踪的全新 RT 核心,用于人工智能的 576 个Tensor核心,以及用于平行运算的 4608 个 CUDA 核心,是世界上最先进的绘图处理器。
4. VirtualLink
业界首创的 VirtualLink 用来简化现有及下一代的高分辨率 VR 头戴式显示器的连接。
性能特点
Turing 结合了新的硬件光线追踪引擎,是业界第一个支持即时光线追踪的绘图处理器。 单张 Quadro RTX 8000 可以产生复杂的专业模型,包含精确的物理阴影,反射,折射,让使用者可立即查看。nvidia quadro rtx 8000 系统与利用 NVIDIA OptiX, Microsoft DXR 和 Vulcan 光线追踪等 API 的应用程序共同运作,英伟达rtx8000将为真正交互式设计工作流程提供动力,并为空前等级的生产力提供立即回馈。
Turing GPU 为了深度学习矩阵运算而设计,为神经网络训练和推理功能的核心,包括加强的Tensor核心,除了 INT8 和两个新的 INT4 和 INT1 (二进制) 精度模式以外,还可加速 FP16 / FP32 矩阵运算。独立的浮点和整数数据路径,利用运算和地址计算的混合方式,可让工作负载更有效率地执行。
网格着色提供基于运算的几何管线,以加速几何复杂模型和场景的处理和剔除,效能提升可达 2 倍。动态调整着色对 GPU 运算力分配方式提供更细微的控制 (意即更多周期用在场景中细节较多的区域,较少周期用在细节较少的区域),可在相同的画面质量下提高效能,或节省一半的时间产生着色像素并提供相近的画面质量。材质空间着色特别适用于 VR 体验,可以用不同速率处理着色和几何样本,执行起来更有效率。
Turing 架构建立在 SM 大幅强化的 Volta GPU 上,能源效率比上一代的 Pascal 高 50%,在相同的功耗范围内大幅提高效能。
英伟达 rtx8000 (Quadro RTX 8000) 配备业界最高 48GB 最先进的 GDDR6 内存,吞吐量比前一代的 GDDR5x 技术提高 55%,极为适合应付专门处理大型数据集并对延迟敏感的专业应用程序。
英伟达 quadro rtx8000(rtx 8000)符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。
H.264 编码码率/质量改进以调节效能降低码率 (例如,在同样效能等级约为 6%,在降低效能时约为 11%)。编码的比特流及动态向量的绘图内存输出,以加速端对端的 GPU 工作流程的后制处理。4x4 粒度的光流以改进影像画格内插/外推,对象追踪,动作分割,动作识别等。I-画格只针对 H.264 和 HEVC 译码,可以只用 I-画格进行推理,以加速影像监控等用途。VP9 10/12 位译码,支持 VP9 HBD 内容解碼。
英伟达RTX8000像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如 VR 动态追踪
NVIDIA rtx 8000指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。
多 GPU 技术
NVIDIA NVLinkii
用 NVLink 连接两张 Quadro RTX 8000 将有效可用内存加倍,并可利用高达 100GB/s (双向总带宽) 的 GPU 对 GPU 数据传输率将应用程序效能扩张。
NVIDIA RTX 8000(QUADRO RTX 8000)利用多个 GPU 动态扩展绘图效能,加强影像质量,扩大显示空间,并组装一套完全虚拟化的系统。
影像质量
file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml2832\
使用高达 64X FSAA (SLI 模式下 128倍) 大幅降低视觉混迭伪像或「锯齿」以获得优秀的影像质量和极为逼真的场景。
材质来自并成像到 32K x 32K 表面以支持需要最高分辨率和质量的图像处理应用程序。
显示特性
VirtualLink 基于开放式业界标准,可将现有 VR 头盔的分辨率加倍,以支持下一代头戴式显示器更身历其境的体验。VirtualLink 将显示,USB,电源等多条扁平电缆整合为单一连接线,降低设定的复杂程度。
支持最多四个 5K 屏幕 @ 60Hz,或每卡两个 8K 显示器。英伟达 RTX 8000 支持 HDR 色彩,包括 4K @ 120Hz 10/12b HEVC 译码以及高达 4K @ 60Hz 10b HEVC 编码。 每个 DisplayPort 连接头可驱动 4096x2160 @ 120 Hz 的超高分辨率及 30-bit 色彩。
在单一大型显示器或多显示器环境下让终端用户对桌面体验取得前所未有的的控制,以提高生产力。
将桌面和应用程序从单一工作站扩展到最多 4 个 GPU 和 16 个显示器,同时提供完整的效能和影像质量。
file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml2832\
在单一系统的 8 个 GPU 中同步最多 32 个显示器的显示和画面输出 (透过两张 Sync II 适配卡连接),减少建立高阶影像可视化环境所需的机器数量。
file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml2832\
每个框页锁连接器都设计有自动锁定保持机制,以确保与框页锁定扁平电缆的连接,提供强大的连接性和最高的生产力。
为专业应用程序提供流畅与身历其境的 3D 立体体验。
在最大 32K 桌面大小的高分辨率显示器上获得更多 Mosaic 拓扑选择。
稳定控制三维效果,经由专属连接直接将 3D 立体硬件同步到 Quadro 显卡。
软件支持
深度学习框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快训练时间并提高多节点训练效能。GPU 加速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速计算 (HPC) 应用程序提供更高的效能。
原生执行标准程序语言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光线追踪,影片和图像处理,以及流体力学计算等技术。
单一无缝的 49 位虚拟地址空间可让数据在 CPU 和 GPU 完全分配的内存内透明的移动。
GPUDirect for Video 经由避免不必要的系统内存数据复制和 CPU 负担来加速 GPU 和影像 I/O 装置间的沟通。
M将系统正常运作时间最大化,NVIDIA QuadroRTX 8000无缝管理大规模部署并远程控制图形和显示设置,以实现高效率运作。
NVIDIA 包装及配件
NVIDIA Quadro RTX 8000
Quadro RTX 快速入门指南
Quadro 支持手册
1 DisplayPort 转 DVI 转接头
1 DisplayPort 转 HDMI 转接头
1 辅助电源线(8-pin 转双 6-pin 转接头)
规格
GPU 架构 | Turing |
CUDA 平行处理核心 | 4608 |
NVIDIA Tensor核心 | 576 |
NVIDIA RT 核心 | 72 |
内存 | 48 GB GDDR6 |
RTX-OPS | 84T |
光线投射 | 10 Giga Rays/Sec |
最高单精度 (FP32) 效能 | 16.3 TFLOPS |
最高单精度 (FP16) 效能 | 32.6 TFLOPS |
最高整数运算 (INT8) 效能 | 261.0 TOPS |
深度学习 TeraFLOPS1 | 130.5 Tensor TFLOPS |
内存接口 | Bit |
内存带宽 | 672 GB/s |
最大功耗 | 295 W |
总线 | PCI Express 3.0 x16 |
显示接头 | DP 1.4 (4) + VirtualLink (1) |
板型 | 4.4” 高 x 10.5” 长 双槽 |
重量 | 1.002 kg |
散热方案 | 主动式 |
NVIDIA 3D Vision 和 3D Vision Pro | 由 3 pin mini DIN 支持 |
框页锁 (Frame Lock) | 相容 (与 Quadro Sync II) |
NVLink 互连技术 | 100 GB/s |
支持平台
l Microsoft Windows 10 (64 位)
l Microsoft Windows 8 and 8.1 (64 位)
l Microsoft Windows 7 (64 位)
l Linux - 完整 OpenGL 实作,完整 NVIDIA 和 ARB 延伸 (64 位)
3D 绘图架构
l 可扩充式几何坐标 (Scalable geometry) 架构
l 硬件细分曲面引擎 (Hardware tessellation engine)
l NVIDIA GigaThread 引擎及 7 个异步复制引擎
l Shader Model 5.1 (OpenGL 4.5 和 DirectX 12)
l 高达 32K x 32K 纹理及着色处理
l 透明多重取样和超级取样
l 16倍速角度独立式非等方性过滤技术
l 32-bit 纹理过滤及混色技术的浮点能力
l 64倍速全景反锯齿 (FSAA) 技术 / SLI模式可达128倍
l 硬件译码加速支持 MPEG-2, MPEG-4 Part 2 Advanced Simple Profile, H.264, HEVC, MVC, VC1, DivX (version 3.11 及更新版本), 以及 Flash (10.1及更新版本)
l 专属的 H.264 及 HEVC 编码器
l Blu-ray 双串流硬件加速 (支持 HD 子母画面播放)
l NVIDIA GPU Boost (自动提高 GPU 引擎吞吐量以最大化应用程序效能)
NVIDIA CUDA 平行处理架构
l 每个 SM 的新 RT (光线追踪) 核心
l Turing SM 架构 (串流多处理器设计,提供更高处理效率)
l 动态平行运算 (GPU 动态生成新线程而无需返回 CPU)
l 混合式精度 (1, 4, 8, 16, 32 和 64 位) 运算
l API 支持包括:- CUDA C, CUDA C++, DirectCompute 5.0, OpenCL, Java, Python, 和 Fortran
l 错误修正码内存(ECC)
l 可配置多达 96 KB 的内存 (每个 SM 的专属共享内存大小)
进阶显示特性
l 支持四个显示器的任意组合
l 四个 DisplayPort 1.4 输出 (支持分辨率如 3840 x 2160 @ 120 Hz, 5120x2880 @ 60Hz 和 7680 x 4320 @ 60Hz)
l DisplayPort 转 VGA, DisplayPort 转 DVI (single-link 和 dual-link) 和 DisplayPort 转 HDMI 扁平电缆 (支持分辨率依照转接器规格而定)
l DisplayPort 1.4 (SMPTE 2084/2086, BT. 2020) (4K @ 60Hz 10b/12b HEVC 译码, 4K @ 60Hz 10b HEVC 编码) 支持 HDR
l DisplayPort 和 HDMI 连接头支持 HDCP 2.2
l 12 位内部显示管线 (搭配支持的面板,应用程序和连接,硬件支持 12 位扫描输出)
l 支持 NVIDIA 3D Vision 技术,3D DLP,交错,和其他 3D 立体规格
l 支持完整 OpenGL 四缓冲立体技术
l 欠扫描/过扫描补偿和硬件缩放
l NVIDIA nView 多显示器技术
l 利用 NVIDIA SVS 平台,包含 NVIDIA Mosaic, NVIDIA Sync 和 NVIDIA Warp/Blend 技术,支持大规模和超高分辨率可视化
DisplayPort 和 HDMI 数字音效
l 支持以下声音模式:- Dolby Digital (AC3), DTS 5.1, 多声道 (7.1) LPCM, Dolby Digital Plus (DD+),和 MPEG-2/MPEG-4 AAC
l 支持DisplayPort 数据传输率 48 KHz
l 支持16-bit, 20-bit, 以及 24-bit 大小字符组
l Mini-DisplayPort 连接器采用订制卡榫固定装置设计,可牢牢固定显示器连接线。
与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。
数据源来自:https://www.nvidia.cn/