正在加载视频...

视频加载失败

Playwright MCPを使って、ユーザーテスト自動化を試した。Googleマップで藤沢駅の焼き鳥屋を調べ、ユーザー評価4.0以上で最も安い店舗の営業開始時刻と混雑状況を確認するタスクを実行。テスト結果を評価してもらう。 ※動画は2倍速です

44,252 次观看 • 1 年前 •via X (Twitter)

4 条评论

鈴木慎吾 / TSUMIKI INC. 的头像
鈴木慎吾 / TSUMIKI INC.1 年前

指示内容とテスト結果は以下にまとめました。 各ステップでの操作を記録し、良い点と課題点をざっくり評価してくれる。 手順は以下の記事を参考にさせていただきました。

鈴木慎吾 / TSUMIKI INC. 的头像
鈴木慎吾 / TSUMIKI INC.1 年前

テスト結果はざっくりしている。ユーザビリティ評価というより、シナリオに沿って機能が利用可能かを評価してもらう感じに近い。

鈴木慎吾 / TSUMIKI INC. 的头像
鈴木慎吾 / TSUMIKI INC.1 年前

同一シナリオに基づいて、競合他社のサービスを大量にテストして比較したい場合とかに向いていそう。

Wonderchat 的头像
Wonderchat2 年前

Automate up to 70% of your customer support today. Save time and help your users find answers quickly. Try now at

相关视频

AIによる大量並列実装、ローカルでgit worktree使うより上位互換の方法が見つかりました。 CodexもしくはCursor Agentの「クラウド版」で「テスト駆動開発」を並列実行する方法。解説↓ ローカルgit worktreeの課題 ⚠️マシンのメモリがひっ迫すること ⚠️大量並列した後、すべてのAIのアウトプットを手動で確認する手間 ⚠️テスト駆動開発したい時、playwrightの実行環境が競合すること これらをすべて解決するのが、クラウド環境でのテスト駆動開発。 ✅️クラウド環境なのでマシンメモリの上限がない。やろうと思えば100並列でも1000並列でも出来る。 ✅️playwrightもしくはjestのテスト駆動開発環境さえ先にローカルで整えれば、AIのアウトプットの評価を手動で行う必要がない。テスト通ったものだけローカルに落として確認すればよい。 ✅️playwrightの実行環境も分離しているので競合しない。 ✅️実行の時、パソコンを閉じてもOK。スマホから操作でもOK。 これにより、ローカルのgit worktreeで実行する課題を解決しながら、AI大量並列実装のメリットである、AI出力の不安定さを確率論で下げる点をしっかり享受出来ます。 注意するべきは、クラウド環境で環境変数の設定をすること、postgresサーバをlocalではなくリモートで開発環境整えること、くらいですね。 あとは、とにかくGitに慣れること!Gitをマスターしなさい!

J

325,263 次观看 • 7 个月前

PFNから、材料科学などのシミュレーションを用いた長期の解析タスクを実行できるコーディングエージェント PARC を発表しました。末尾に実行動画、スレッドに論文があります。 PARCは100ステップを超えるような研究計画・実行・検証・考察を行い、数十時間規模のシミュレーションを複数同時に走らせ、結果を自動で検証します。 PARCはマルチエージェント構成であり、プランナーと複数のワーカーからなります。まずプランナーが実行計画を立て、人の承認を受けた後、自動実行に移ります。自動実行は複数のステップに分割され、各ステップ内では自己検証と、外部エージェントによる検証と修正によって途中実行結果を何重にも検証しながら進めていきます。 LLM自体の性能向上がある中でも、現時点ではこうしたマルチエージェントシステムは必須で、それを使わない場合は今回のような長期タスクは不可能dした(今回のケーススタディはClaude Sonnet 4.5で行っています)。 ケーススタディでは、論文などで報告されているシミュレーションを使った解析を再現できるかを調べ、それを専門家が検証する形でその有効性や課題を調べました。 具体的には、固体電解質におけるリチウム拡散の推定、超合金の偏析機構の解析、電場をかけた非平衡シミュレーション、および汎用性を確かめるため同じシステムでのKaggleタスク実行を行いました。これらではシミュレーションの実験設定が誤っている場合でも、PARCが自動で検証し間違いを発見できることを確認しました。 一方、電場をかけた非平衡シミュレーションの場合は、途中の重要な計算に誤りがあり、誤った最終結果が導かれることが判明しました。ただし、このときも研究者がその部分だけを修正すれば全体は正しく動作することも確認しました。このようにPARCは中間計算や実行結果を逐次レポートするため、研究者が正確に介入できる点も大きな利点です。 今後も全体の最適化をAIがしつつ人が適切に介入できるシステム設計が重要になると考えられます。

Daisuke Okanohara / 岡野原 大輔

32,988 次观看 • 6 个月前

交流ロボコンで技術賞をいただきました! 茨城高専Bチーム たまたま完熟金柑(タマタマカンジュクキンカン)です 安定完全自動を目指して技術開発をメインでやってました 本番でも98%を自動で競技を終わらせることができました! またRealSense画像認識でアヒルの自動回収をしたり、LiDARx3の最強自己位置推定をやりました 自律移動 mermaidを使った状態遷移図をもとに自律移動をし、競技をすべてこなすことができます 非線形最適化で事前に経路を引いたり、A*で動的に生成したりできます 自動の停止精度は1.2cmでした 6m/s 8m/s2で自動ができましたが、安全面やカーブ時の安定性の問題から3m/sに制限していました(動画は手動時のものです) 画像認識 担当:HK YOLOv8を使いアヒルを検出、Depthから位置を推定しています (アノテーション5k枚) 検出結果から経路を引きPurePursuitで追従することで正確にアヒルを回収できます ✞最強の自己位置推定✞ 事前にホイールオドメトリのバイアスなどをマルチIMUを使い測定し、オドメトリの精度を向上させていました MCLで位置推定をしていました 400hzで動作しましたがLiDARが40Hz x2 + 30Hzだったので100Hzで動かしていました 8m/sで動かした時も安定して位置推定ができており、大会期間中に3回しか自己位置がずれませんでした 物理シミュレーター 担当: HK ros2 for unity を使って物理シミュレーションをしていましたが、実機が思ったより早く完成したので途中から使わなくなってしまいました ボトル検出 LiDAR点群からペットボトルの位置を推定し自動で回収します yaw角と横方向を先に揃えて最後に後ろにまっすぐ下がることで安定して回収ができました コントローラー 担当: HK いつも通りros2 for unity androidでアプリを作成し直接通信しています こたっく 様によりjazzyに対応させることができたのですべてjazzyに移行しました map path goal current poseの表示やinitial poseのpublishができるので試合中rviz2をみることなく終わることができました またコントローラーの角度を取得し、操縦者の向いている方を前として操縦できるようになってます (手動操縦ほぼしなかったけど) #交ロボ #ROS2

橋本 千聡@kazu321

27,472 次观看 • 3 个月前