DeepSeek-Prover

https://arxiv.org/abs/2408.08152 DeepSeek-Prover-V1.5 は、Lean 4 上での定理証明のために開発されたオープンソースの大規模言語モデル (LLM) で、以下の方法で進化しています：

アプローチの革新

全体証明生成とステップ証明の融合
- 従来の「全体証明生成（全ての証明コードを一括生成）」と「ステップ証明生成（1つずつステップを検証）」の利点を統合する「truncate-and-resume 機構」を導入。エラー箇所でコードを分割し、次のステップを生成する。
Monte-Carlo Tree Search (MCTS)
- 証明探索を効率化するため、新たなアルゴリズム「RMaxTS」を導入。エラー箇所での探索と「好奇心報酬」を活用し、解法パスの多様性を促進。

学習手法

評価結果

結論と意義

(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]