正在加载视频...

视频加载失败

「3Dを理解できるAI」はついにここまで来た。 Depth Anything 3は、入力がどんなアングルでも「3D視覚空間」を正しく再構築。単一のトランスフォーマーと深度レイターゲットだけで多視点ジオメトリを簡素化しSOTAを更新。 この方向が主流になるかもしれない。リンクは🧵

50,486 次观看 • 7 个月前 •via X (Twitter)

0 条评论

暂无评论

原始帖子的评论将显示在这里

相关视频

俯瞰でも縦パースをつけない 二点透視の構図を作る方法と仕組みについて 漫画の表現でよくある「見下ろしている構図だけど高さ方向にはパースがつかない」という、一見矛盾した構図を撮るための手順は以下の通りです。 1. 原理の理解 クリップスタジオの3Dの構図は、カメラだけではなく「カメラ」と「注視点」の2つの関係性によって作られています。この2つを制御することが必要です。 2. 二点透視を作る基本操作 カメラと注視点の高さを一致させることで、二点透視になります。 3. 問題 (a) 高さを一致させたままでは、画面に3D素材が映らないという問題が出てきます。 (b) しかし素材を映そうとしてカメラの角度を変えると、注視点との高さが平行ではなくなるため、縦パースがついてしまいます。 4. 解決の方法 (a) 大凡の構図を決めた後に、カメラと注視点の高さを揃えて二点透視の状態を作ります。 (b) その後に「レンズシフト」機能を使って、映す範囲をずらします。中ボタンドラックは注視点とカメラの関係性を保持したまま構図調整できるので適宜使用。 この手順をとることで、縦のラインを垂直に保ったまま、見下ろしの構図を作ることが可能です。 レンズシフトの下にある「垂直に補正」のボタンを使えば簡単に同様の事ができますが、上記を理解する事で「垂直に補正」の機能はカメラと注視点の位置、レンズシフトYの項目をオートで調整するという機能でもある、ということが理解できます。

漫画用3D承ります|マンガ3Dラボ|脇﨑

139,101 次观看 • 2 个月前

3D空間で一点透視の構図を作る方法と仕組み 漫画の構図ではよくある一点透視ですが、3D空間で再現するとなると、割とコツが必要な構図になります。なぜ、一点透視を3D空間で再現するのが難しいかというと、成立させるための条件が多いからです。 【 一点透視を成立させるための4つの条件】 【a.軸の一致】 カメラと注視点のXYZいずれか二つを一致させる 【b.構図の決定】 レンズシフトを使い構図を決める 【c.配置】 カメラと映したいものが正面になること 【d.奥行き調整】 奥行きの調整(圧縮調整)が必要であること 【構図決定と調整のコツ】 構図を決める際には、レンズシフトのXとYの値を調整すること、そして映すモチーフに対してカメラが正面を向いている必要があります。 また、絵として調和をとるためには、いわゆる「奥行きの圧縮」を行い、奥行きの見え方を微調整する必要があります。 奥行きの見た目を調整する際には、パースの値を調整してください。「連動してカメラを前進・後退」のチェックボックスは、オンにする必要があります。 この手順を取る事で、1点透視の構図を作る事が可能です。 無限遠の定規に設定して3Dを配置しようとしても、3D空間と連動しないことは覚えておくと良いでしょう。

漫画用3D承ります|マンガ3Dラボ|脇﨑

12,983 次观看 • 2 个月前

数日 ClaudeCode と codex を行き来しながらゲーム制作したら、両者のハマり方の違いがくっきり見えた✨ ゲームを作る上での肌触りや、細かい UI 調整は明らかに codex の方が上手い。 両方とも「素直に作る → どんどん深みにハマる → パッチを当てて抜け出せなくなる」という罠を踏むんだけど、その顕著さは Claude の方が強い感じ。 最初のペースは codex の方が速いし、UI / レイアウトの捉え方も codex 優位。 ただし codex も完璧ではなくて、開発段階でハマることはある。どちらにせよ、修正や仕様変更が入ったタイミングで苦しくなるのは同じ。 3D ゲームだと特に、AI 側が空間認識と 2D 認識の両方を行き来する必要があって、内部を複雑にとらえがち。1 画面で完結するものなら楽だけど、このゲームのようなワンカットの中でモード遷移があるゲームは AI 側の認識が難しいぽい🤔 それと、ゲーム制作の難しいところは「これ面白いと思って作ったけど、やってみたら全然面白くない」ということがまあよく起きる。そうなるとゲームデザインを大きく変えることになるわけだが、 大きな転換があったときは、無理にパッチを重ねるより、最初から作り直す方が悪くない選択だったりする。実際このプロジェクトでも、最初に作ったものを元に別でサブエージェントを使って再構築するのにかかったトークンと時間はそんなに多くなかった。 つまりワークフロー的には、一回ごちゃごちゃ作ったものを、もう一度作り直していく方が上手くいくのかもしれない。特に UI によって UX が変わるゲームでは顕著。 これはこれまで何度も実務で経験したことだが、かかってる時間が少ないから、やり直しでかかる負荷はそれまでの時間とトークン量ぐらいなのでサンクコストが低く、「面白い」に邁進できる🥰 これは動画も同じで、完全に質の時代に突入した😊 いかに己の能力を上げられるかが問われる時代。 #ai

LUTA@AI

10,623 次观看 • 1 个月前

【OpenAI共同設立者】イリヤ・サツケバーのみている世界 イリヤ・サツケバーがトロント大学でスピーチを行いました。その内容が非常に重要だと感じたため、翻訳しました。 『AIは人類にとって「史上最大の課題」であると同時に「最大の報酬」ももたらす』 以下、字幕全文です↓↓↓ --- 6月6日 皆さん。 ここに来られたことを本当に嬉しく思います。この場を準備し、企画してくださった皆さん、そしてこの名誉学位を授与してくださったことに、心から感謝を申し上げます。この名誉学位をいただけるのは、私にとって非常に意味深いことです。 今からちょうど20年前のほぼ同じ日に、私はこの同じホールで、トロント大学から学士号を授与されました。実は、これでトロント大学からいただく学位は4つ目になります。ここで過ごした合計10年間は、本当に素晴らしい時間でした。 学部生として多くのことを学び、大学院生としても素晴らしい経験を積むことができました。興味のある分野を深く掘り下げ、研究者としての道を歩み始めることができたのです。 特に、ジェフ・ヒントン先生のもとで研究できたことは、望外の幸運でした。先生がこの大学に在籍されていたことは、私の人生で最も幸運な出来事の一つです。これ以上ないというほど素晴らしい環境で教育を受け、科学者として成長できたことに、大学には深く感謝しています。 私が学生だった頃、この大学はどこよりも優れたAI研究を行っていました。最も革新的で、最もエキサイティングな研究です。それに学生として貢献できたことを、今も誇りに思っています。もう、ずいぶん昔のことになりましたが。 さて、卒業式のスピーチでは、卒業生の皆さんに賢明なアドバイスをすることが期待されていると思います。今日は少しだけ、その役割を果たさせてください。少しだけ、と言うのは、今回のスピーチは少し毛色の違うものになるからです。 一つ、実用的な心の持ち方をお伝えしたいと思います。これを心掛ければ、きっと多くのことが楽になるはずです。それは、「現実をあるがままに受け入れ、過去を後悔せず、ただ状況を改善することに努める」という考え方です。 なぜこんな話をするかというと、これが非常に難しいことだからです。私たちは、過去の悪い決断や不運な出来事を思い出し、「あれは不公平だった」と考えて時間を無駄にしがちです。 しかし、「現実はこうなのだから、次善の策は何か」と考える方が、はるかに生産的です。私自身、そう考える時はいつも、物事がうまくいくことに気づきます。 とはいえ、これは簡単なことではありません。自分の感情との戦いでもあるのです。だからこそ、皆さんにお話ししています。この考え方を、できる限り心に留めておいてください。これは、私自身へのリマインダーでもあります。 さて、本題に入りましょう。このスピーチが普通のものにならない理由は、私たちの周りで、少し違うことが起きているからです。皆さんは、これまでとは全く異なる時代の節目に立っています。これはよく言われることですが、今回は、本当にそうなのです。 その理由は、AIです。言うまでもありませんね。 聞くところによると、今日のAIはすでに「学生であること」の意味を大きく変えているそうですね。かなりのレベルで。これは私自身が強く感じていることであり、そして真実だと思います。 しかし、AIの影響はそれだけにとどまりません。私たちの仕事は、これからどうなっていくのでしょうか? すでに、未知で予測不可能な形で、少しずつ変化が始まっています。 Twitterで検索すれば、AIに何ができるのか、人々が何を言っているのかを見ることができます。そうすると、「どのスキルが役に立ち、どのスキルが時代遅れになるのだろうか」といった疑問が頭をよぎるかもしれません。 しかし、AIがもたらす本当の課題は、それが前例のない、極めて大きなものであるという点です。未来は、今日とは全く異なるものになるでしょう。 私たちは、コンピューターと話すことができるようになりました。これは新しいことです。コンピューターが私たちを理解し、言葉を返してくる。音声でコードを書くことさえあります。クレイジーなことです。 もちろん、AIにはまだ不十分な点もたくさんあります。 しかし、AIはすでに、数年後の世界を想像させるほどの力を持ち始めています。それが3年後か、5年後か、10年後か、未来の予測は困難ですが、AIは着実に、あるいは私たちの想像より速く、進化し続けるでしょう。 そしていつか、AIが私たち人間の仕事を「すべて」こなす日が来るかもしれません。一部ではなく、すべてです。 なぜ、そう確信できるのでしょうか? その理由は、私たち人間には脳があり、その脳が一種の生物学的コンピューターだからです。 であるならば、私たちが脳でできることを、デジタルコンピューターにできない理由はありません。これが、AIがいずれ万能になりうる、という考えの根拠です。 そうなると、「コンピューターが私たちの仕事をすべてできるようになったら、何が起こるのか?」という、途方もなく大きな問いに直面します。それは少し強烈すぎると感じるかもしれません。 しかし、それはまだ序の口です。私たちは、その万能なAIを、経済成長や研究開発のために使うでしょう。AIがAI自身の研究を進めるようになれば、進歩の速度は爆発的に加速します。それは、もはや想像を絶する世界です。 この、AIが作り出す極端で根源的な未来を、感情レベルで本当に信じることは、私にとっても難しいことです。それでも、論理はそうなる可能性が非常に高いと示しています。 そのような世界で、私たちは何をすべきなのでしょうか? 「政治に興味を持たなくても、政治はあなたに興味を持つ」という言葉があります。この言葉は、AIにもそっくりそのまま当てはまります。 AIから目をそらさないでください。AIが今何ができるのかを、自分の目で確かめてみてください。そうすれば、直感が働くはずです。そしてAIが進化するにつれて、その直感は確信に変わっていくでしょう。どんな説明も、自分自身の感覚にはかないません。 特に、超知的なAIが社会に実装される未来では、AIをいかにコントロールするかという、非常に根深い問題が生じます。 AIができることを見て、そこから目をそらさないこと。そうして初めて、私たちはAIがもたらす巨大な課題に立ち向かうエネルギーを得ることができるのです。 AIがもたらす課題は、人類史上最大の課題かもしれません。しかし、それを乗り越えた先には、史上最大の報酬が待っているはずです。好むと好まざるとにかかわらず、皆さんの人生はAIによって大きく左右されます。だからこそ、AIに注意を払い、この課題を解決するためのエネルギーを生み出すことが重要です。それが、これから最も大切なことになると私は信じています。 ここで、私の話を終わります。 ありがとうございました。

ChatGPT研究所

35,612 次观看 • 1 年前

核兵器は、より良い核兵器を自分で発明してはくれない。しかし知能は違う。知能は、より強い知能を生み出すプロセスそのものを最適化することができる。したがって「AIがAIを改良する」という構図は、これまでのどの技術とも異なる質的な転換点になるのだ。 トリスタン・ハリス「ここで理解しておくべき重要な点は、『AIはAIを加速する』ということです。 私が核兵器を発明しても、核兵器がより良い核兵器を発明してくれるわけではありません。しかしAIを発明すると、AIは『知能』そのものです。知能は、より良いプログラミングや、より良いチップ設計を自動化します。 たとえばAIに『これはNVIDIAのチップの設計だ。これを50%効率よくしてほしい』と指示すれば、その方法を見つけ出すことができます。『これは私のAI企業に必要なサプライチェーンだ。これを最適化して、もっと効率的にしてほしい』と言えば、そのサプライチェーンを改善できます。『これはAIを作るためのコードだ。これをもっと効率化してほしい』と命じることもできます。『これはトレーニングデータだ。もっとトレーニングデータが必要だ。これをどう作るか、100万回シミュレーションしてほしい』と言えば、その過程を通じて自分自身をより良く訓練していきます。 このように、AIはAIを加速するのです」

Tsubame

13,332 次观看 • 6 个月前

いまのスマホ体験は、「知能を持たないOSに、超知能まがいのサービスを押し込んだ状態」なのかもしれない。タイムズスクエアではなく山の湖畔のキャビンというメタファーでOSを再設計することは、人間の主観体験レイヤーそのものを張り替え、常駐するAIを前提にした世界への入口になる。 サム・アルトマン「iPhoneはこれまでのところ消費者向けプロダクトの最高傑作だと本気で思っていて、本当にすばらしいものです。それでも、今のデバイスや多くのアプリケーションを使っているとき、私はニューヨークのタイムズスクエアを歩いているような感覚になるのです。 顔の前でフラッシュがたかれ、あちこちに注意を引かれ、誰かにぶつかられ、ノイズが鳴り続ける。その小さな不快さの連続にずっと対処させられているような感じで、とても落ち着かない体験です。まぶしいものがあふれ、通知がフラッシュのように飛び込んできて、ドーパミンを追いかけさせられ、注意力はどんどん短くなっていく。 どうしてこうなったのかというプロセスは理解していますが、これが私たちの生活を穏やかで静かなものにし、ほかの大事なことに集中させてくれているとは思えません。 そこで、私たちがこれからつくろうとしているデバイスについて、初期の段階で話していたのはこういうことです。長い時間軸でタスクを任せられる、本当に賢くて信頼できるAIがいて、情報をふるいにかけてくれる。いつあなたを邪魔しないべきか、逆にいつ情報を提示したり、入力を求めるべきかを、文脈に応じて理解してくれる。そして時間をかけて信頼関係を築けるくらい、あなたの人生全体について途方もない文脈理解を持っている。 そうなれば、タイムズスクエアを押し合いへし合いで歩き、あらゆるものが注意を奪い合うような雰囲気ではなく、山あいの湖のほとりにある、とても美しいキャビンのなかで、静けさと安らぎを味わっているような雰囲気を目指せるはずです。 こうした体験は、プレAI時代のテクノロジーでは実現できなかったと思います。今の種類のデバイスでも、同じことはできません。だからこそ、私たちはその感覚を少しでも取り戻してくれるようなデバイスをつくりたいと願っているのです」

Tsubame

46,110 次观看 • 7 个月前

すべての人に「自分の代理人として働くAI」がつく世界は一見ユートピアに見えるが、僕たちはAIの決定に「了解」と返すだけの存在になってしまうかもしれない。だからその先では「AIとの融合」という論点が避けられなくなっていく。理解そのものをAIと共有し、人間が再びゲームの内部に戻るのだ。 イリヤ・スツケヴァー「長期的な均衡という観点から言うと、一つのアプローチは『おそらくすべての人が、自分のために行動してくれるAIを持つようになる』という世界だ、と言えるかもしれません。それが無期限に維持できるなら、確かに良いことです。 しかしその欠点は、AIがその人のためにお金を稼ぎ、政治の場でニーズを代弁し、おそらく『これこれこういうことをやりました。状況はこうです』とレポートを書き、人間は『素晴らしい、そのまま続けて』と返すだけになることです。そこで人間は、もはやプロセスの参加者ではなくなってしまう。これはかなり危うい状態だと言えるでしょう。 気に入っている解決策ではないと前置きしますが、一つの解は『人間がNeuralink++のようなもので部分的にAIになる』ことです。そうなると、AIが何かを理解したとき、私たちもそれを理解するようになり、その理解が丸ごと転送される。AIが何らかの状況に置かれているとき、その状況に私たち自身も完全に関与していることになる。それが長期的な均衡に対する答えだと、私は考えています」

Tsubame

21,189 次观看 • 7 个月前

いまのAIに決定的に欠けているのは、僕たちの背景を理解する能力だ。だから毎回プロンプトで関係性を組み立て、状況説明をし、欲しい出力へ誘導しなければならない。だが、その制約が外れ始めたとき、AIは単なる便利ツールではなくなるのだろう。その日はきっと、それほど遠くない。 サム・アルトマン「今のモデルは、将来そうなるものと比べれば、まだかなり愚かです。しかもそれ以上に、あなたの人生についての理解がきわめて限られています。今はまだ、こちらがうまく、なだめたりすかしたりしながら、欲しいものを引き出さなければならないのです。 ですが、あなたの文脈をすべて知っているようなモデルは、もうそれほど遠くありません。そのモデルは、あなたのことを知っている。あなたの人生を知っている。何をしているかを知っている。何を大事にしているかを知っている。あなたの人生にいる人たちのことも知っている。もちろん、あなたが望む形で、望む範囲においてですが、あなたのコンピュータやブラウザにもアクセスできる。そして時間がたつにつれて、現実世界であなたの周囲に起きていることにも、ますますアクセスするようになるかもしれません。 それは、コンピュータを使う感覚、そしてAIを使う感覚そのものを、完全に変えてしまうはずです。私はそれに強く興奮しています。ただ、実際それがどんな感覚になるのかは、私たち自身でさえ、まだ十分に直感できていないと思います」 グレッグ・ブロックマン「まさにその点ですが、今の私たちは、チャットでも何でも、使っているツールに対して『何が起きているのか』を説明するのに、ものすごく多くの時間を使っています。そしてそれがどれだけ苛立たしいかを考えてみてください。まるで同僚に対して、いや、私が欲しいのはこういうことで、今こういう状況なんだ、と延々説明し続けているようなものです。今のシステムの振る舞い方は、本来こうあってほしい姿ではないのです」

Tsubame

15,287 次观看 • 2 个月前

【絶体絶命の楽器編成】 たまに、ドラム・ピアノ・フロントという、いわゆる“ベースレス”の編成でライブをやらされることがあります。 ドラムがいるにもかかわらずベースがいない。この編成はピアニストにとって最も厄介な状況の一つかもしれません。 多くのアマチュアのピアニストは、ベーシストがいないと分かった瞬間、左手でウォーキングをしてしまったりします。 しかし、音楽は必ずしも理屈で解決すべきものではありません。 やることは、実は極めてシンプルです。 三人全員が、抜群にスイングし、良い音で演奏すること。 それだけです。それだけで音楽は成立します。 もう一度言います。 良い音で、三人が同時に演奏する。ただそれだけ。 この動画を観てください。 無理に相手に合わせようとしていますか? 過剰に「化学反応」を起こそうとしているでしょうか? ただ相手の音を聴きながら、良い音で演奏しているだけです。 理論的にも、特別に難しいことは何一つやっていません。 ただし、ここに至るまでには時間がかかります。良い音でスイングして演奏できるようになれるように、一生かけて勉強します。どんなに才能がある人でも最低20年はかかるでしょう。 結局のところ、自分の演奏に一切の嘘がなくなるレベルまで到達しなければ、こうした「シンプルなこと」はできないのです。これはその事実を如実に示している一例です【完】

天才ピアニストゆうこりん❤️ 4/22 中目黒 楽屋 🎹 Yuking of Swing🔥

33,834 次观看 • 6 个月前

インターネットやスマホの時代も勝者は読めなかったが、物理的な限界は見えていた。生成AIは違う。なぜ効くのかの理論が薄く、人間知能の理解も浅い。性能の上限も、3年後の到達点もモデル化できない。結果、予測はロードマップではなく「そう感じる」と言うしかない——そして誰も確信できない。 ベネディクト・エヴァンス「これは面白い種類の難しさだと思いますし、これが過去のプラットフォーム転換と決定的に違う点だと思います。インターネットでもモバイルでも、あるいはメインフレームの時代でも、今後2〜3年に何が起きるかは分かりませんでした。Amazonがどうなるかも分からなかったし、Netscapeがどう落ち着くかも分からなかったし、来年のiPhoneがどうなるかも分からなかった。10年前にそういうことを気にしていた頃も同じでした。 けれども当時は、物理的な限界はだいたい分かっていました。1995年の時点で、通信会社が翌年に全員へギガビット光回線を配るわけではない、ということは分かっていました。そして、iPhoneが1年持つバッテリーを搭載して、くるくると巻物みたいに広がって、プロジェクターが付いて、空を飛ぶ——みたいなことにはならない、ということも分かっていました。 ところが、この技術(生成AI)については物理的な限界が分かりません。なぜこれほどうまく動くのかを理論的に十分理解できていないからです。さらに言えば、人間の知能が何なのかについても、理論的に十分理解できていません。だから、どこまで良くなり得るのかが分かりません。 モデムならロードマップの図を作れて、DSLならロードマップの図を作れて、DSLがどれくらい速くなるかも描けます。さらに、通信会社がどれくらいの速度でDSLを展開するかについても、ある程度の推測ができます。そうすると、1998年に放送テレビをストリーミングで置き換えるのは明らかに無理だ、といった判断もできます。 でも、この手のものを同じようにモデル化して、3年後に根本的な能力がどんな姿になっているかを見積もるための同等の方法がありません。結果として雰囲気ベースの予測になってしまい、誰にも本当のところは分からない。ジェフ・ヒントンが『こういう感じがする』と言い、デミス・ハサビスが『こういう感じがする』と言っても、結局は誰にも分からないのです」

Tsubame

51,410 次观看 • 6 个月前

シンギュラリティのトリガーである「再帰的自己改善」は、すでに少し前に起きているという。もちろん、まだ全自動ではないが、「進歩のどこまでがAIでどこまでが人間なのか」は曖昧になってきている。著者性が溶けるこの感覚こそ、分単位で進むシンギュラリティの手触りなのだ。 サリム・イスマイル「再帰的自己改善(RSI)がシンギュラリティの本当のトリガーだという話は、以前からしてきました。そしてそれは、すでに少し前に起きているんです。だから今やっているのは、その道筋を加速しているだけです。私たちは今この瞬間にも、産業時代を恒久的に抜けつつあります」 デイブ・ブランディン「ええ、シンギュラリティが分単位で展開していく様子は、私が経験した中で最も興味深いものだと本当に思いますし、アレックスの言うとおりです。いまは、人間がループの中にいて貢献している時期ではあるのですが、進歩のどこまでがAIでどこまでが人間なのかが、本当に曖昧なんです。実際にコーディングしていると、『あれは自分のアイデアだったのか?』となります。 半分は自分のアイデアのようでも、AIが別の案を提案してきて、それを採用していくうちに、結局それが自分のアイデアだったのかどうかも分からなくなります。ただ、いまのモードでは、こうしたコアアルゴリズムの研究の多くが、『500本のテストを走らせて、どのハイパーパラメータが良かったか、どのニューラルトポロジーが良かったかを教えて』という形になっています。相対論を発明したり発見したりするような話ではありません。 いろいろな試行を大量に回して、うまくいったものを選んで再デプロイし、そうするとより賢いAIになって、さらに多くの試行をする——その繰り返しです。私たちはその道筋をかなり進んでいる可能性が高いと思います」

Tsubame

15,386 次观看 • 4 个月前