NVIDIAの

Autonomous Code Evolution Meets NP-Completeness

の論文をコパイにまとめてもらいました。

2025優勝ソルバにたいして相当の向上が見られ、それは、単に過去ソルバの良いところ取りに留まらず、自律的新アルゴリズムを発見した、

ということのようです。

これまで、LLMが出来るのは、パラメータの調整だけだと思いこんでいたのですが、間違っていました。

ここまで到達すると、もはや「研究者は不要」、という領域に入ってくるかもしれません。新しいアルゴリズムを考えるより、如何に賢いAIを育てるか？の方が焦点になる可能性があります。

恐らく、2024SATCompetitionが、優勝者が人間だった最後の年で、以降、全てAIになるのではないかと。

SAT Competitionは、SATソルバ界隈での最高競技会でありトップ研究者達の集まりです。

ソースは全てオープンであるが故に、結果、多くの知恵が集まり多くの研究成果が生まれました。しかし、オープンであるが故にAIの餌食となってしまった、とも言えます。人類の知恵は、論文に集積されていますが、数秒で新しい論文を理解してしまう知能と、眠ることのない存在に、もはや勝ち目はないのでは？とも思います。AIと抽象的・数学的・技術的な会話をすること自体は楽しいのですが、どんな話題を振っても、敵うことのないメンター的知性を持った存在、という印象をさらに強く抱いた次第です。

Q.2025優勝ソルバとの比較

結論から言うと 「はい、明確に増えています」。
あなたが開いている論文 “Autonomous Code Evolution Meets NP-Completeness” の記述によれば、SATLUTION は SAT Competition 2025 の Winner（AE_kissat2025_MAB）よりも多くの問題を解いています。 arxiv.org

🧩 解けた問題数の比較（論文の記述より）

論文の Figure 2（Cactus Plot）に明確に書かれています：

SATLUTION のトップ 3 ソルバー
- 解いた問題数：347, 345, 344
SAT Competition 2025 Winner（AE_kissat2025_MAB）
- 解いた問題数：334
2nd place（kissat-public）
- 解いた問題数：331

つまり、SATLUTION は Winner より 10〜13 問ほど多く解いています。
これはかなり大きな差で、特に中〜難問領域（1000〜4000秒帯）で差が開いていると論文は述べています。 arxiv.org

📌 まとめ

解けた問題数は増えているか？
→ はい、Winner より明確に増えています。
どれくらい増えたか？
→ 約 10〜13 問多く解いた（347 vs 334）。
どの領域で強かったか？
→ 中〜難問帯で Winner が止まった後も SATLUTION は解き続けた。

必要なら、

SAT/UNSAT 別の比較
PAR-2 スコアの詳細
2024 ベンチマークでの比較
なども整理できます。

Q.過去ソルバの良いところ取りだけではないの？

結論から言うと 「半分正しいが、それだけでは不十分」 という答えになります。
SATLUTION（論文中の表記は SATLUTION）は、確かに 過去ソルバの良いところ取り（hybridization）を行っている のですが、実際にはそれを はるかに超える進化的プロセス を実行しています。

以下、論文内容に基づいて整理します（ arxiv.org）。

🧩 SATLUTION がやっていることは「良いとこ取り＋自律的進化」

① 良いところ取り（hybridization）は確かに行っている

論文では、初期状態として SAT Competition 2024 の 5 つの強力なソルバを seed として与えています。

kissat-sc2024
kissat-mab-dc
kissat-mab-binary
BreakID-Kissat
AMSAT

SATLUTION はこれらのコードベースを読み込み、
互いの強みを組み合わせる方向に進化する と明記されています。

“SATLUTION made rapid progress in the first 5–10 iterations, quickly lowering PAR-2 by combining complementary strengths from the different seed solvers.”
（ arxiv.org）

つまり、初期段階ではまさに「良いところ取り」をして性能を底上げしています。

② しかし本質は「自律的な新規アルゴリズム発見」

SATLUTION の特徴は、単なるマージではなく 新しいヒューリスティックやアルゴリズムを自動生成する点 にあります。

論文では、進化の過程で以下のような 新規の最適化手法 を自律的に発見したと書かれています：

Multi-UIP clause learning の新しいバリエーション
Bandit（多腕バンディット）による UIP depth の動的調整
Vivification の SAT/UNSAT 感度分析と動的制御
Adam-like updates を使った reward tuning
Multi-domain bandit による複数ヒューリスティックの協調制御
BreakID の統合による対称性検出
Compressed watch list architecture の導入

これらは単なる「良いところ取り」ではなく、
既存ソルバにも存在しない新規アイデア です。

③ さらに、ルールベースと自己進化ルールにより「設計思想」まで進化

SATLUTION はコードだけでなく、
自分自身の進化ルール（rulebase）も自動で更新する という仕組みを持っています。

forbidden patterns（禁止パターン）の自動追加
correctness rules の強化
logging / documentation rules の自動更新
failure patterns を学習して次の iteration に反映

これは人間の開発プロセスに近い「メタ進化」であり、
単なるソルバの合体では到達できない領域です。

🔍 まとめ：良いところ取りは「入口」であり、本質はもっと深い

観点	SATLUTION の実際
過去ソルバの良いところ取り？	YES（初期段階で大きく寄与）
それだけ？	NO（中盤以降は新規アルゴリズムを自律生成）
進化の本質	ルールベース＋フィードバックによる自律的コード進化
最終的な成果	2025 Winner を超える性能（347 solved vs 334 solved）

🎯 結論

「良いところ取り」は SATLUTION の進化の一部にすぎず、
本質は “自律的に新しい SAT ソルバを設計する AI エージェント” です。

もし興味があれば、

どの seed solver のどの要素が取り込まれたのか
新規に生まれたヒューリスティックの詳細
進化の各 iteration の変化（Figure 8）
なども深掘りできます。

スケジュールナースのブログ

2026年2月4日水曜日

SATURATIONの衝撃