
中国のAI企業DeepSeekは、新しいAIモデル「R2」のトレーニングをHuaweiのAscendチップで行う計画が失敗に終わり、Nvidiaへの回帰を余儀なくされました。これにより、R2モデルのリリースが遅延しています。
数ヶ月間、中国政府は技術的進歩と自給自足への道を推し進めてきましたが、現実は厳しいものでした。DeepSeekの今回の問題は、野心と技術的限界がぶつかる典型的な例です。
DeepSeekは1月にR1モデルを成功裏にリリースした後、中国政府からHuaweiのチップを使用するよう圧力を受けていました。しかし、R2モデルのトレーニング中にHuaweiのAIチップで「持続的な技術的問題」に直面し、プロジェクトは停止に追い込まれました。この問題が、5月に予定されていたモデルのローンチが中止された主な理由とされています。
AIのトレーニングと推論には大きな違いがあります。トレーニングは、学生が大学で何年も集中的に学ぶようなもので、膨大な電力と安定性を必要とします。一方、推論は、卒業生に質問をするようなもので、比較的「簡単」な部分です。
DeepSeekは、Huaweiのチップが最終試験には対応できても、過酷な大学のコースにはまだ対応できないことを発見しました。そのため、トレーニングにはNvidiaの強力なシステムに戻るしかありませんでした。DeepSeekのチームは、需要の少ない推論段階でR2モデルをHuaweiチップで動作させようと試みているとのことです。
Huaweiは、DeepSeekのオフィスにエンジニアチームを派遣し、R2モデルを自社チップで動作させようとしましたが、成功しませんでした。業界関係者の間では、これは驚くべきことではないとされています。HuaweiのCEOである任正非氏も、今年初めに米国の「Huaweiの成果を誇張している」と述べ、同社の最高のチップはまだ1世代遅れていると指摘していました。
中国政府は、国内の技術大手に対し、国産ハードウェアを優先するよう積極的に働きかけており、Nvidiaの輸出規制対応H20チップの注文も正当化する必要があるとの報道もあります。これは国内のチャンピオンを育成するための戦略ですが、企業に技術的に劣る選択を強いる可能性があります。