全球 AI 竞争进入新一章
全球首富伊隆.马斯克( Elon Musk )旗下的 xAI 人工智慧新创公司在今年 2 月 17 日推出最新 AI 模型 Grok, 标榜是「地表最聪明的AI 」, 采用高达 20 万个辉达( NVIDIA ) H100 绘图晶片( Graphics Processing Unit 、GPU ),标志着其在算力上的巨大投入。以每个 GPU 单价约 2.5 万美元,总成本超过 50 亿美元。
过去几年,人工智慧 Artificial intelligence( AI )发展围绕在模型的计算能力(简称算力)展开,AI 模型采用的 GPU 数量越多、规格越好,其算力和效能越高。因此全球 AI 企业掀起算力竞赛,每年砸下数十亿甚至数百亿美元购置 GPU,兴建运算中心。微软( Microsoft )和 Meta( Facebook )也宣布今年将分别斥资 800 亿和 600 亿美元扩增 AI 基础设施。
然而,就在 xAI 的 Grok3 发布的三个星期前,一间成立于 2023 年 10 月,至今发展不到两年的中国 AI 新创公司「深度求索( DeepSeek )」推出旗下的开源 AI 模型 DeepSeek R1,宣称仅使用 2,048 个辉达较低阶的 H800 晶片(有一说法是使用 5 万个高阶的 A100 晶片),仅花费 578 万美元的推理成本(另一说法是总成本 13 亿美元),却在数学推论、程式码生成等领域,和去年 12 月问世的 OpenAI o1 模型有不相上下的表现,引发市场热议。
虽然 DeepSeek 在成本和规格上有许多争议,但这款低成本高效能的 AI 模型的横空出世,证明 AI 模型的强弱并非单靠算力,藉由优化演算法也能有优异表现。这对动辄需要耗资数十亿甚至上百亿美元来建置算力的美国企业,无异是狠狠敲响「一记警钟」,也为白热化的中美 AI 竞争注入新的变数。
美国算力强大, 在应用端却难施展身手
一直以来,美国靠着在互联网及半导体产业无法无天的高市占率,加上 AI 企业不停砸钱建置算力,在 AI 发展处于领先地位。根据史丹佛大学的数据,2023 年美国私人企业在 AI 产业的投资金额高达 672 亿美元,是中国的 8.7 倍。然而,如此庞大的投资金额至今没有产生相对应的报酬。以 OpenAI 为例,根据《华尔街日报》的报导,公司 2024 年营收约 40 亿美元,亏损达 50 亿美元,并预期 2023 年至 2028 年的累积亏损将达到 440 亿美元。大型云端服务商如谷歌( Google )和亚马逊( Amazon )最近也面临到云端服务营收成长放缓的问题。
除此之外,AI 模型目前仅在内容生成、聊天机器人、和搜寻等初浅应用有所发展,在自动驾驶、医疗诊断等高端应用尚未有明显突破。出于对数据安全的疑虑,隐私权的担忧,和人工智慧的幻觉- 因数据输入的偏差,使 AI 模型导出虚假或不准确的结论,多数的企业也不愿意轻易投入资源发展相关技术和应用。再者,美国AI模型多属于封闭式模型,开发门槛和费用都很高。根据美国软体开发公司 Sphinx Solutions 的数据,依照设计和功能复杂度,开发一款 AI 应用的成本上看 300 万美元。中小企业很容易因为欠缺 AI 技术人员或资金问题而怯步。根据美国人口普查局( Bureau of the Census )今年 2 月的调查,全美仅有 6% 的企业过去两周使用 AI 技术进行产品生产或服务,仅 10% 在未来 6 个月有意愿使用 AI 技术。
即使面对这些争议,美国AI 企业仍然坚持「算力为王」的发展思维,持续砸钱购置 GPU,兴建大型运算中心。根据彭博的数据,微软、亚马逊、Alphabet、和 Meta 四间大型云端服务商 2025 年的总资本支出高达 3,024 亿美元,比去年高出 38%,多数资金将用来盖运算中心。然而,居高不下的庞大资本支出最终是否会侵蚀公司的获利能力,已让投资人感到不安,也对美国 AI 企业是否值得高估值产生质疑。
中国的成本和开源优势, 能否补足硬体短版
不同于美国主攻算力,中国则从成本和应用端着手。一方面是因为美国对半导体晶片和设备设下各种出口管制,中国在算力的成长受到限制,再者企业习于成本导向思考,先开发出高性价比的 AI 模型,透过庞大内需市场加速终端应用发展,再借此切入全球市场。从太阳能、网路通讯、智慧型手机、到电动车,都是依循这般模式,中国甚至成为市场最大玩家。如今人工智慧也不例外。以 DeepSeek 为例,是透过导入知识蒸馏技术( Knowledge Distillation )和多头潜在注意力架构( MLA )等多种创新技术,并专研于某几个领域来实现高效能的运算和成本效益,使其得以以远低于同业的价格来吸引用户。根据 Artificial Analysis 研调机构的比较,DeepSeekR1 效能和 OpenAI o1 模型的效能差异不大,但 DeepSeek R1 每百万 token 输出价格仅 2.2美元,而 OpenAI o1 则要 15 美元。
另外,中国拥有超过 11 亿个网际网路用户以及接近 70% 的 5G 普及率,加上对于资讯隐私权重视程度不高,AI 企业能轻易取得数据来训练模型,而且成本很低。政府还提供各种补助,鼓励终端企业采用 AI 技术,使 AI 企业从市场端获取更多数据来优化模型,形成了一个良性循环。此外,相较于美国 AI 企业多采用封闭式平台以保护自身技术和利润,中国则多选择开源模式,公开技术细节和原始程式码,并允许用户依照自身需求修改模型。此举虽然有技术外流的风险,但能降低用户开发应用的门槛,更重要是能够大幅提升中国AI企业在全球市场的渗透度。根据《路透社》的报导, 不少欧美 AI 新创公司已经从 OpenAI 转向 DeepSeek,因为开发成本和技术门槛更低。这股压力让 OpenAI 首席执行长兼联合创始人山姆.阿特曼( Sam Altman )向媒体坦承,在开源这件事上,他们或许选错边了。
不过,美国在先进晶片和半导体的管制,仍然是中国 AI 发展路上最大的绊脚石。 DeepSeek 执行长梁文峰曾在 2024 年对媒体表示,先进晶片的出货禁令仍是公司发展的最大挑战。政府已投注庞大资源发展先进半导体和晶片,但技术发展无法一蹴可几,短时间内难以自给自足。美国在看到 DeepSeek 的崛起后,是否会祭出更严格的出口管制措施,进一步紧缩对中国晶片和 AI 产业的限制,还需要观察。
AI 竞赛是场马拉松, 不到最后,胜负难分
在 AI 发展路上,算力依然是核心竞争力。美国总统唐纳. 川普( Donald Trump )在今年 1 月 20 日正式回锅白宫隔天,旋即宣布「星际之门计画( The Stargate Project )」,由美国 OpenAI 和软体巨头甲骨文( Oracle )、日本的电信巨头软银集团( SBG )及阿联酋国旗下的 AI 技术投资公司 MGX Fund Management Limited 共同合资设立 Stargate 企业,计划至 2029 年分阶段投入共 5,000 亿美元,大力发展 AI 基础设施。第一期将投资 1,000 亿美元于德州兴建 10 座资料中心,未来将扩充至更多州。
不过,DeepSeek 的出现,代表这场竞争不能单拼算力,还需要在演算法和应用生态等各个层面持续创新,才有机会脱颖而出。这场技术、资本和产业战略的 AI 马拉松竞赛,美国能以算力垄断领先到最后,还是中国能以成本优势以及开发灵活度后发先至,不到最后一刻,谁都不知道最终的赢家会是谁。