あじさいのたまご
   

中国の人工知能(AI)新興企業ディープシークは、米国の最高性能モデルに匹敵するAIの機能をより低コストで最高性能チップを使わずに達成したと発表した。なぜ、それが可能になったのか。米国内で、その謎解きが始まった。結論は、チャットGPTを模倣したというものだ。米国は、この事態に防御策を取り始めた。

『ウォール・ストリート・ジャーナル』(1月29付)は、「中国ディープシーク、どうやって米国を出し抜いたか」と題する記事を掲載した。

経験は邪魔になると考え、若い中国人技術者を雇用・活用する。さらに、プログラミングを巧妙に簡略化し、米国の規則の抜け穴を利用して先端半導体を入手する。これは中国のAI(人工知能)新興企業ディープシークが採用した手法だ。それによって開発されたAIプログラムは世界を震撼させた。これまでは、優れたAIの開発には高価な最先端コンピューターチップが大量に必要であり、中国企業はそうしたチップを入手できないため競争するのは難しいと考えられていた。ディープシークは才覚によってそうした予想を覆し、ウォール街に1兆ドル(約156兆円)の大損害をもたらすとともに、米テック企業に自社の手法の見直しを迫った。

(1)「ディープシークを率いる梁文鋒氏は、2023年に中国の出版物に掲載されたインタビューで、大半の技術者のポストを埋めているのは、新卒者か実務経験が1~2年の人だと答えた。また、経験が障害になり得ると述べ、「何かをする時、経験のある人はためらいもなく、これはこのやり方でやるべきだと伝えてくるだろうが、経験のない人はそのやり方について、何度も検討を重ね、真剣に考えることを強いられる。そして現在の実際の状況に合った解決法を見つける」と語った。彼らが考え出した手法は現在、シリコンバレーで最も優秀な人々の研究対象になっている」

ディープシークは、AIの専門家でなく未経験者に開発させた。奇想天外な方法で、「抜け道」を探させたのだ。楽して儲かる方法である。

(2)「ディープシークの戦術は、独自の発明や、同社と同様に制限を受けている中国のAI企業が採用している技術を利用して、AIモデルを訓練するのに必要なデータ処理量を減らすというものだった。ディープシークは、質問を受けてから答えにふさわしい本を探し出すよう訓練された。このため半導体への負担は、全ての作業を一度にこなすよう求められる場合よりも小さくなる。米シンクタンク「ランド研究所」でAIを研究しているレナート・ハイム氏によれば、これら全ての点を考慮すると、ディープシークが取ったこうした近道は、AIの訓練に要するコストを競合AIモデルと比べて極めて低くすることに貢献した」

ディープシークは、事前にすべて学習させるのでなく、質問を受けてから答えを探し出す方法を採用した。これだと膨大な事前コストを省ける。

『ウォール・ストリート・ジャーナル』(1月29日付)は、「ディープシークはチャットGPTから『知識蒸留』、米AI責任者」と題する記事を掲載した。

中国の人工知能(AI)スタートアップ企業ディープシークが世界を驚かせた最新のAI4モデルは、米オープンAIのコンテンツを学習させる手法を用いて開発された。第2次トランプ政権でAIの政策責任者を務めるデービッド・サックス氏が指摘した。

(3)「サックス氏は28日、FOXニュースに出演し、ディープシークは「知識蒸留」と呼ばれる手法を採用していると説明した。新しいAIモデルが既存モデルに何百万もの質問を繰り返すことで、既存モデルの知識を学び、推論プロセスを模倣する開発手法だ。シリコンバレーの著名ベンチャーキャピタリストとして知られるサックス氏は、「ディープシークがオープンAIのモデルから知識を蒸留したという確固たる証拠がある」と指摘。「オープンAIがこれを喜んでいるとは思えない」と話した。サックス氏は、今後は米国のAI開発企業が自社のAIモデルを知識蒸留から守るために対策を講じるだろうと述べ、そうした措置で「一部の模倣モデルの開発ペースは確実に減速するはずだ」と語った」

知識蒸留とは、既存モデルに何百万もの質問を繰り返すことで、既存モデルの知識を学び、推論プロセスを模倣する開発手法である。ディープシークは、この知識蒸留を行ったとみられている。その既存モデルが、チャットGPTであったとされている。いかにも、「抜け道探しの中国がやりそうなことだ。「上に政策あれば、下に対策あり」は、中国古来の抜け道探しの王道だ。