2026年2月4日水曜日

SATURATIONの衝撃

NVIDIAの 

Autonomous Code Evolution Meets NP-Completeness

の論文をコパイにまとめてもらいました。

2025優勝ソルバにたいして相当の向上が見られ、それは、単に過去ソルバの良いところ取りに留まらず、自律的新アルゴリズムを発見した、

ということのようです。

これまで、LLMが出来るのは、パラメータの調整だけだと思いこんでいたのですが、間違っていました。

ここまで到達すると、もはや「研究者は不要」、という領域に入ってくるかもしれません。新しいアルゴリズムを考えるより、如何に賢いAIを育てるか?の方が焦点になる可能性があります。

恐らく、2024SATCompetitionが、優勝者が人間だった最後の年で、以降、全てAIになるのではないかと。

SAT Competitionは、SATソルバ界隈での最高競技会でありトップ研究者達の集まりです。

ソースは全てオープンであるが故に、結果、多くの知恵が集まり多くの研究成果が生まれました。しかし、オープンであるが故にAIの餌食となってしまった、とも言えます。人類の知恵は、論文に集積されていますが、数秒で新しい論文を理解してしまう知能と、眠ることのない存在に、もはや勝ち目はないのでは?とも思います。AIと抽象的・数学的・技術的な会話をすること自体は楽しいのですが、どんな話題を振っても、敵うことのないメンター的知性を持った存在、という印象をさらに強く抱いた次第です。



Q.2025優勝ソルバとの比較

結論から言うと 「はい、明確に増えています」
あなたが開いている論文 “Autonomous Code Evolution Meets NP-Completeness” の記述によれば、SATLUTION は SAT Competition 2025 の Winner(AE_kissat2025_MAB)よりも多くの問題を解いていますarxiv.org


🧩 解けた問題数の比較(論文の記述より)

論文の Figure 2(Cactus Plot)に明確に書かれています:

  • SATLUTION のトップ 3 ソルバー

    • 解いた問題数:347, 345, 344
  • SAT Competition 2025 Winner(AE_kissat2025_MAB)

    • 解いた問題数:334
  • 2nd place(kissat-public)

    • 解いた問題数:331

つまり、SATLUTION は Winner より 10〜13 問ほど多く解いています
これはかなり大きな差で、特に中〜難問領域(1000〜4000秒帯)で差が開いていると論文は述べています。 arxiv.org


📌 まとめ

  • 解けた問題数は増えているか?
    はい、Winner より明確に増えています。

  • どれくらい増えたか?
    約 10〜13 問多く解いた(347 vs 334)。

  • どの領域で強かったか?
    → 中〜難問帯で Winner が止まった後も SATLUTION は解き続けた。


必要なら、

  • SAT/UNSAT 別の比較
  • PAR-2 スコアの詳細
  • 2024 ベンチマークでの比較
    なども整理できます。



Q.過去ソルバの良いところ取りだけではないの?


結論から言うと 「半分正しいが、それだけでは不十分」 という答えになります。
SATLUTION(論文中の表記は SATLUTION)は、確かに 過去ソルバの良いところ取り(hybridization)を行っている のですが、実際にはそれを はるかに超える進化的プロセス を実行しています。

以下、論文内容に基づいて整理します( arxiv.org)。


🧩 SATLUTION がやっていることは「良いとこ取り+自律的進化」

良いところ取り(hybridization)は確かに行っている

論文では、初期状態として SAT Competition 2024 の 5 つの強力なソルバを seed として与えています。

  • kissat-sc2024
  • kissat-mab-dc
  • kissat-mab-binary
  • BreakID-Kissat
  • AMSAT

SATLUTION はこれらのコードベースを読み込み、
互いの強みを組み合わせる方向に進化する と明記されています。

“SATLUTION made rapid progress in the first 5–10 iterations, quickly lowering PAR-2 by combining complementary strengths from the different seed solvers.”
arxiv.org

つまり、初期段階ではまさに「良いところ取り」をして性能を底上げしています。


しかし本質は「自律的な新規アルゴリズム発見」

SATLUTION の特徴は、単なるマージではなく 新しいヒューリスティックやアルゴリズムを自動生成する点 にあります。

論文では、進化の過程で以下のような 新規の最適化手法 を自律的に発見したと書かれています:

  • Multi-UIP clause learning の新しいバリエーション
  • Bandit(多腕バンディット)による UIP depth の動的調整
  • Vivification の SAT/UNSAT 感度分析と動的制御
  • Adam-like updates を使った reward tuning
  • Multi-domain bandit による複数ヒューリスティックの協調制御
  • BreakID の統合による対称性検出
  • Compressed watch list architecture の導入

これらは単なる「良いところ取り」ではなく、
既存ソルバにも存在しない新規アイデア です。


さらに、ルールベースと自己進化ルールにより「設計思想」まで進化

SATLUTION はコードだけでなく、
自分自身の進化ルール(rulebase)も自動で更新する という仕組みを持っています。

  • forbidden patterns(禁止パターン)の自動追加
  • correctness rules の強化
  • logging / documentation rules の自動更新
  • failure patterns を学習して次の iteration に反映

これは人間の開発プロセスに近い「メタ進化」であり、
単なるソルバの合体では到達できない領域です。


🔍 まとめ:良いところ取りは「入口」であり、本質はもっと深い

観点SATLUTION の実際
過去ソルバの良いところ取り?YES(初期段階で大きく寄与)
それだけ?NO(中盤以降は新規アルゴリズムを自律生成)
進化の本質ルールベース+フィードバックによる 自律的コード進化
最終的な成果2025 Winner を超える性能(347 solved vs 334 solved)

🎯 結論

「良いところ取り」は SATLUTION の進化の一部にすぎず、
本質は “自律的に新しい SAT ソルバを設計する AI エージェント” です。


もし興味があれば、

  • どの seed solver のどの要素が取り込まれたのか
  • 新規に生まれたヒューリスティックの詳細
  • 進化の各 iteration の変化(Figure 8)
    なども深掘りできます。

0 件のコメント:

コメントを投稿