top of page
&SMART - ガジェット・IT・AI・FinTechに関するWebメディア

大規模言語モデル「DeepSeek-R1」、最新版を公開

  • 執筆者の写真: 桜井 未来
    桜井 未来
  • 5月30日
  • 読了時間: 1分
image : DeepSeek
image : DeepSeek

OpenAIやxAIに対抗、中国発モデルがグローバル市場に挑戦


 中国のAIスタートアップDeepSeekは、2025年5月28日(現地時間)、大規模言語モデル「DeepSeek-R1」の最新バージョン「R1-0528」をHugging Face上で公開した。今回のアップデートでは、強化学習(RL)をベースにした独自のトレーニング手法をさらに進化させ、より高精度な推論能力を実現している。この手法は、従来の教師あり学習(SFT)を用いず、Chain-of-Thought(思考の連鎖)による探索や自己検証機能を活用することで、複雑な課題に対して柔軟かつ深い思考を可能にしている。



image : Hugging Face
image : Hugging Face


 パラメータ数は6850億で、性能面では、OpenAIの「o4-mini」に匹敵、あるいはそれを上回る水準を達成しているとのこと。また、DeepSeekはこのモデルをMITライセンスのもとでオープンソース化しており、研究者や開発者が自由に利用・改変できるようになっている。これは、AI分野における開放性と技術革新の促進という観点からも大きな意義を持つ。今回のアップデートは、AI業界における中国企業のプレゼンスを一段と高めるものとして、国際的にも注目を集めている。



参照サイト

Hugging Face 



TAGs


bottom of page