DeepSeek的R1模型通過強(qiáng)化學(xué)習(xí)等創(chuàng)新技術(shù),顯著提升了推理能力,使其能夠與OpenAI的o1模型相媲美,。此外,DeepSeek還采用了“模型蒸餾”策略,,利用R1模型作為“教師”,,生成數(shù)據(jù)來微調(diào)更小的模型,,這些小模型在性能上可以與OpenAI的o1-mini等競(jìng)爭(zhēng)模型相媲美,。這種策略不僅降低了成本,,也為AI技術(shù)的普及提供了新的思路,。
伯恩斯坦認(rèn)為,即便DeepSeek確實(shí)實(shí)現(xiàn)了10倍的效率提升,,這也僅相當(dāng)于當(dāng)前AI模型每年的成本增長(zhǎng)幅度,。在“模型規(guī)模定律”不斷推動(dòng)成本上升的背景下,像MoE,、模型蒸餾、混合精度計(jì)算等創(chuàng)新對(duì)AI發(fā)展至關(guān)重要,。根據(jù)杰文斯悖論,,效率提升通常會(huì)帶來更大的需求,而非削減開支,。該行認(rèn)為,,目前AI計(jì)算需求遠(yuǎn)未觸及天花板,新增算力很可能會(huì)被不斷增長(zhǎng)的使用需求吸收,?;谝陨戏治觯魉固箤?duì)AI板塊保持樂觀,。