Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

GitHubのコーディングエージェントでClaude、Codexを選べるようになりました! ✅GitHub Copilot Pro+ またはEnterpriseプラン 👀パブリックプレビュー 📱ブラウザ、VS Code、GitHubモバイルアプリ 📊複数モデルで並列実行し結果を比較もできます 詳しくは👇

37,912 görüntüleme • 4 ay önce •via X (Twitter)

0 Yorum

Yorum bulunmuyor

Orijinal gönderinin yorumları burada görünecek

Benzer Videolar

PFNから、材料科学などのシミュレーションを用いた長期の解析タスクを実行できるコーディングエージェント PARC を発表しました。末尾に実行動画、スレッドに論文があります。 PARCは100ステップを超えるような研究計画・実行・検証・考察を行い、数十時間規模のシミュレーションを複数同時に走らせ、結果を自動で検証します。 PARCはマルチエージェント構成であり、プランナーと複数のワーカーからなります。まずプランナーが実行計画を立て、人の承認を受けた後、自動実行に移ります。自動実行は複数のステップに分割され、各ステップ内では自己検証と、外部エージェントによる検証と修正によって途中実行結果を何重にも検証しながら進めていきます。 LLM自体の性能向上がある中でも、現時点ではこうしたマルチエージェントシステムは必須で、それを使わない場合は今回のような長期タスクは不可能dした(今回のケーススタディはClaude Sonnet 4.5で行っています)。 ケーススタディでは、論文などで報告されているシミュレーションを使った解析を再現できるかを調べ、それを専門家が検証する形でその有効性や課題を調べました。 具体的には、固体電解質におけるリチウム拡散の推定、超合金の偏析機構の解析、電場をかけた非平衡シミュレーション、および汎用性を確かめるため同じシステムでのKaggleタスク実行を行いました。これらではシミュレーションの実験設定が誤っている場合でも、PARCが自動で検証し間違いを発見できることを確認しました。 一方、電場をかけた非平衡シミュレーションの場合は、途中の重要な計算に誤りがあり、誤った最終結果が導かれることが判明しました。ただし、このときも研究者がその部分だけを修正すれば全体は正しく動作することも確認しました。このようにPARCは中間計算や実行結果を逐次レポートするため、研究者が正確に介入できる点も大きな利点です。 今後も全体の最適化をAIがしつつ人が適切に介入できるシステム設計が重要になると考えられます。

Daisuke Okanohara / 岡野原 大輔

32,988 görüntüleme • 6 ay önce