NVIDIA显卡的的CUDA核心是什么?

我在N卡控制面板里看到的CUDA核心显示是16是什么概念?
2025-01-20 06:01:00
推荐回答(4个)
回答1:

CUDA核心,理论上流处理器缩写是SP。但NVIDIA自己称呼他们的SP是CUDA Core。

CUDA Core只是N卡流处理器而已,只是一个流处理器名词。

CUDA是一个统一计算架构,属于软件+硬件架构统称。他不是一个软件也不是一个纯硬件。而是软硬结合的计算体系。

你可以理解为CUDA是一个基于NVIDIA GPU平台上面NV自己定制的特殊计算体系。是NV自己发明的运算算法,在NV平台和软件支持上面才能发挥最高效率。CUDA在NVIDIA定义是一种类C语言,本身兼容C语言。CUDA虽然是一种独立语言提供开发学习,但CUDA本身和C差距不算非常巨大,很多有经验的开发者很快能学会。

CUDA在全球属于NVIDIA私人生态区,他的势力并不比IOS小。甚至在高端计算领域和图形领域。CUDA算的上是权威标准。 Quadro和Tesla这2个统治世界的著名计算平台就是靠着CUDA生态区才能提供客户一体化服务,否则如果大家都像AMD那样只卖个浮点看起来很高的物理节点,那么老黄根本不敢自封视觉运算公司,那不是普通半导体公司搞的授权么?

CUDA是一个计算结构,是一个理念。是一个软硬平台,是一个NV提供综合性服务的东西。他不是一个显卡授权,也不是一个集群。也不是一个驱动。

回答2:

CUDA运算速度只和核心频率有关,而CUDA核心数量则决定了显卡的计算力的强弱(比如一项渲染任务可以拆分为更多份交由不同的CUDA核心进行处理)。
如果仅考虑核心数量和频率,理论上可以写一个kernel,使其在gtx1080上比gtx980ti慢25%。
基本参数:
gtx1080 gtx980ti
#core 2560 2816
base clock 1607 1000

构造一个kernel包含2561个线程,同时使其无法多个线程利用一个core。这样的话,所有线程在980ti上可同时执行,而在1080上要执行两波(对应[1]中的wave)(因为多出了1个线程要等下一波才能执行)。
然后来根据clock来计算执行时间,假设此kernel在980ti上需跑1s,那么在1080上需要多少秒?

所以理论上980ti有可能更快,当然实际性能牵涉到很多因素(如访存带宽, 线程调度等)。

参考作者:爱蓝根
链接:https://www.zhihu.com/question/46400432/answer/105992965
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

回答3:

性能运行

回答4:

CUDA(Compute Unified Device Architecture),显卡厂商NVidia推出的运算平台。 CUDA�6�4是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA�6�4架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA�6�4的处理器上以超高性能运行。 将来还会支持其它语言,包括FORTRAN以及C++。
随着显卡的发展,GPU越来越强大,而且GPU为显示图像做了优化。在计算上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。目前只有G80、G92、G94、G96、GT200、GF100、GF110、GK100平台(即Geforce 8~Gecorce GTX690)的NVidia显卡才能使用CUDA,工具集的核心是一个C语言编译器。G80中拥有128个单独的ALU,因此非常适合并行计算,而且数值计算的速度远远优于CPU。
计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范,NVIDIA�0�3(英伟达�6�4)发明了CUDA(Compute Unified Device Architecture,统一计算设备架构)这一编程模型,是想在应用程序中充分利用CPU和GPU各自的优点。现在,该架构现已应用于GeForce�0�3(精视�6�4)、ION�6�4(翼扬�6�4)、Quadro以及Tesla GPU(图形处理器)上,对应用程序开发人员来说,这是一个巨大的市场。