-
@ topickapp (IT技術系ニュースサイト)
2025-05-03 09:46:25https://zenn.dev/elyza/articles/bc68f53fc0a83b ELYZA-Thinking-1.0: MCTS を用いた推論パス探索と模倣学習による Reasoning Model の開発 ELYZA社が開発した日本語の論理的思考能力を強化した大規模言語モデル「ELYZA-Thinking-1.0-Qwen-32B」に関する記事です。 モンテカルロ木探索(MCTS)に着想を得たアルゴリズムによる推論パスの探索と、それによる学習データの作成について解説しています。 また、Reasoning Modelと対照的なShortcut Modelについても触れ、それぞれの性能や学習方法について詳しく説明しています。