关于使用DeepSeek EU8M0量表数据格式的中国互联网辩论也导致国内芯片的日常限制增加。这真的很有趣。
上面的照片来自官方的芯片文档NVIDIA Blackwell,引入了MXFP8数据格式,并使用E8M0作为比例因子。这是B200芯片的完整特征。我可以以NVIDIA定义的数据格式破坏NVIDIA吗?因此,NVIDIA确实支持DeepSeek UE8M0 FP8,这在互联网上很受欢迎。
地址:https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-kind-kind-type-type-valid-combommbombationue8m0 fp8不是深的原始原件。至少PTX 8.0/9.0或后部(与Hopper/ADA Architecture GPU兼容)。 NVIDIA与ISA级别的.UE8M0兼容。它是NVIDIA级别数据格式的官方之一。它用于诸如混合精度FP8/FP4的量化之类的方案。 Nvidia Hopper Architecture(H100系列)GPU H100(于2022年推出)。 foR数据中心和AI的培训/推断。这是对GPU架构进行的首次官方支持,这些GPU体系结构混合了GPU FP8(E4M3/E5M2)体系结构,输入.UE8M0作为PTX指令的比例数据类型。 Nvidia Ada Lovelace Architecture(RTX 40)RTX 4090/4080/4070和其他消费图形卡(于2022年底推出),游戏和AI的推理。此外,对.UE8M0和E4M3/E5M2的支持是在基础指令集中继承的。换句话说,从技术上讲:EU8M0已经存在于NVIDIA硬件生态系统中
因此,我个人认为必须以这种方式理解DeepSeek的陈述。这是深v3等效a .1。改善最初仅在硬件/核实施水平中存在的规模表示方法,对实施和培训标准进行建模,并且AD适合下一代国家芯片。
特别声明:本文已由自动媒体的作者收取和发表NetASE,NetEase的平台仅表示作者的意见。 Notease仅提供信息启动平台。
注意:以前的内容(如果有照片或视频,包括视频)已由NetEase Hao的用户收费和发布。我们仅提供媒体平台和信息存储服务。
编辑:Wang Ziyu_nn4690