中国AI初创公司DeepSeek震撼全球
近日,中国一家鲜为人知的AI初创公司DeepSeek凭借其最新发布的R1模型引发了全球科技界的轰动。该模型不仅在性能上比肩甚至超越了OpenAI的GPT-1,更以极低的成本实现了这一突破。
DeepSeek-R1模型在后训练阶段采用了强化学习技术,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能与OpenAI GPT-1正式版不相上下。
值得注意的是,DeepSeek-R1的API定价极具竞争力,仅为OpenAI GPT-1的3.65%,拥有极高的性价比。
更令人惊讶的是,DeepSeek-V3模型在仅使用2048块H800 GPU的情况下完成了6710亿参数模型的训练,训练成本仅为557.6万美元,远低于其他顶级模型。
DeepSeek的出现打破了由美国和OpenAI建立的AI发展规则,其低成本、高性能的模型让AI技术不再局限于少数科技巨头。大模型对算力投入的需求可能会从训练侧向推理侧倾斜,这将对NVIDIA等传统硬件商的市场地位产生影响。
全球科技界对DeepSeek给予了高度评价,认为其可能颠覆NVIDIA在AI硬件领域的垄断地位。AMD也火速为DeepSeek站台,宣布将其DeepSeek-V3模型集成至AMD Instinct GPU上。
有分析人士指出,DeepSeek的成功不仅是一家公司的胜利,更体现了中国AI产业的崛起。中国AI不再满足于跟随美国的脚步,而是勇于探索创新,为全球AI技术的发展注入了新的活力。