NVIDIAの
Autonomous Code Evolution Meets NP-Completeness
の論文をコパイにまとめてもらいました。
2025優勝ソルバにたいして相当の向上が見られ、それは、単に過去ソルバの良いところ取りに留まらず、自律的新アルゴリズムを発見した、
ということのようです。
これまで、LLMが出来るのは、パラメータの調整だけだと思いこんでいたのですが、間違っていました。
ここまで到達すると、もはや「研究者は不要」、という領域に入ってくるかもしれません。新しいアルゴリズムを考えるより、如何に賢いAIを育てるか?の方が焦点になる可能性があります。
恐らく、2024SATCompetitionが、優勝者が人間だった最後の年で、以降、全てAIになるのではないかと。
SAT Competitionは、SATソルバ界隈での最高競技会でありトップ研究者達の集まりです。
ソースは全てオープンであるが故に、結果、多くの知恵が集まり多くの研究成果が生まれました。しかし、オープンであるが故にAIの餌食となってしまった、とも言えます。人類の知恵は、論文に集積されていますが、数秒で新しい論文を理解してしまう知能と、眠ることのない存在に、もはや勝ち目はないのでは?とも思います。AIと抽象的・数学的・技術的な会話をすること自体は楽しいのですが、どんな話題を振っても、敵うことのないメンター的知性を持った存在、という印象をさらに強く抱いた次第です。
Q.2025優勝ソルバとの比較
結論から言うと 「はい、明確に増えています」。
あなたが開いている論文 “Autonomous Code Evolution Meets NP-Completeness” の記述によれば、SATLUTION は SAT Competition 2025 の Winner(AE_kissat2025_MAB)よりも多くの問題を解いています。 arxiv.org
🧩 解けた問題数の比較(論文の記述より)
論文の Figure 2(Cactus Plot)に明確に書かれています:
つまり、SATLUTION は Winner より 10〜13 問ほど多く解いています。
これはかなり大きな差で、特に中〜難問領域(1000〜4000秒帯)で差が開いていると論文は述べています。 arxiv.org
📌 まとめ
解けた問題数は増えているか?
→ はい、Winner より明確に増えています。
どれくらい増えたか?
→ 約 10〜13 問多く解いた(347 vs 334)。
どの領域で強かったか?
→ 中〜難問帯で Winner が止まった後も SATLUTION は解き続けた。
必要なら、
- SAT/UNSAT 別の比較
- PAR-2 スコアの詳細
- 2024 ベンチマークでの比較
なども整理できます。
Q.過去ソルバの良いところ取りだけではないの?
結論から言うと 「半分正しいが、それだけでは不十分」 という答えになります。
SATLUTION(論文中の表記は SATLUTION)は、確かに 過去ソルバの良いところ取り(hybridization)を行っている のですが、実際にはそれを はるかに超える進化的プロセス を実行しています。
以下、論文内容に基づいて整理します( arxiv.org)。
🧩 SATLUTION がやっていることは「良いとこ取り+自律的進化」
① 良いところ取り(hybridization)は確かに行っている
論文では、初期状態として SAT Competition 2024 の 5 つの強力なソルバを seed として与えています。
- kissat-sc2024
- kissat-mab-dc
- kissat-mab-binary
- BreakID-Kissat
- AMSAT
SATLUTION はこれらのコードベースを読み込み、
互いの強みを組み合わせる方向に進化する と明記されています。
“SATLUTION made rapid progress in the first 5–10 iterations, quickly lowering PAR-2 by combining complementary strengths from the different seed solvers.”
( arxiv.org)
つまり、初期段階ではまさに「良いところ取り」をして性能を底上げしています。
② しかし本質は「自律的な新規アルゴリズム発見」
SATLUTION の特徴は、単なるマージではなく 新しいヒューリスティックやアルゴリズムを自動生成する点 にあります。
論文では、進化の過程で以下のような 新規の最適化手法 を自律的に発見したと書かれています:
- Multi-UIP clause learning の新しいバリエーション
- Bandit(多腕バンディット)による UIP depth の動的調整
- Vivification の SAT/UNSAT 感度分析と動的制御
- Adam-like updates を使った reward tuning
- Multi-domain bandit による複数ヒューリスティックの協調制御
- BreakID の統合による対称性検出
- Compressed watch list architecture の導入
これらは単なる「良いところ取り」ではなく、
既存ソルバにも存在しない新規アイデア です。
③ さらに、ルールベースと自己進化ルールにより「設計思想」まで進化
SATLUTION はコードだけでなく、
自分自身の進化ルール(rulebase)も自動で更新する という仕組みを持っています。
- forbidden patterns(禁止パターン)の自動追加
- correctness rules の強化
- logging / documentation rules の自動更新
- failure patterns を学習して次の iteration に反映
これは人間の開発プロセスに近い「メタ進化」であり、
単なるソルバの合体では到達できない領域です。
🔍 まとめ:良いところ取りは「入口」であり、本質はもっと深い
| 観点 | SATLUTION の実際 |
| 過去ソルバの良いところ取り? | YES(初期段階で大きく寄与) |
| それだけ? | NO(中盤以降は新規アルゴリズムを自律生成) |
| 進化の本質 | ルールベース+フィードバックによる 自律的コード進化 |
| 最終的な成果 | 2025 Winner を超える性能(347 solved vs 334 solved) |
🎯 結論
「良いところ取り」は SATLUTION の進化の一部にすぎず、
本質は “自律的に新しい SAT ソルバを設計する AI エージェント” です。
もし興味があれば、
- どの seed solver のどの要素が取り込まれたのか
- 新規に生まれたヒューリスティックの詳細
- 進化の各 iteration の変化(Figure 8)
なども深掘りできます。