AGIラボ's banner
AGIラボ's profile picture

AGIラボ

@ctgptlb137,527 subscribers

ChatGPT、Gemini、ClaudeなどのAI ツールが持つ無限の可能性について探っていきます。フォローするとAIの有益情報をお届けします。お仕事の依頼はDMまで。

Shorts

【速報】Google「Personal Intelligence」を発表 GeminiとGmail・Google Photos・YouTube・Searchを接続し、パーソナライズされた回答を生成する新機能。米国でベータ版の提供を開始 詳細をスレッドにまとめました🧵👇

【速報】Google「Personal Intelligence」を発表 GeminiとGmail・Google Photos・YouTube・Searchを接続し、パーソナライズされた回答を生成する新機能。米国でベータ版の提供を開始 詳細をスレッドにまとめました🧵👇

175,970 次观看

【速報】OpenAIがSoraの後継モデルSora 2を発表 Sora 2はSoraと比較して圧倒的に性能が向上しています。SoraがGPT-1だとしたらSora 2はGPT-3.5です。 音声がついたことが一番大きいです。またSoraアプリが発表され、SNS機能が非常に充実しています。 衝撃のSora 2生成動画を10個まとめました🧵👇 1:

【速報】OpenAIがSoraの後継モデルSora 2を発表 Sora 2はSoraと比較して圧倒的に性能が向上しています。SoraがGPT-1だとしたらSora 2はGPT-3.5です。 音声がついたことが一番大きいです。またSoraアプリが発表され、SNS機能が非常に充実しています。 衝撃のSora 2生成動画を10個まとめました🧵👇 1:

282,659 次观看

【速報】OpenAI、ChatGPTのメモリ機能を強化 ・過去チャットからの検索精度が向上 ・参照元が「ソース」として表示され、元の会話を確認可能 ・Plus & Pro向け、本日よりグローバル展開 数回試してみたところ、過去の会話内容をしっかり拾ってくれました👇

【速報】OpenAI、ChatGPTのメモリ機能を強化 ・過去チャットからの検索精度が向上 ・参照元が「ソース」として表示され、元の会話を確認可能 ・Plus & Pro向け、本日よりグローバル展開 数回試してみたところ、過去の会話内容をしっかり拾ってくれました👇

158,481 次观看

GPTの秘書化に成功 紐づくGoogleカレンダー情報の表示、追加、削除、編集作業をしてくれる、秘書のように使えるGPTを作成しました。 以下デモ動画のように「空いている時間に予定入れといて」のような雑な命令でも適切に判断して追加してくれるので便利です。以前と同様にこのGPTも運用コストゼロ

GPTの秘書化に成功 紐づくGoogleカレンダー情報の表示、追加、削除、編集作業をしてくれる、秘書のように使えるGPTを作成しました。 以下デモ動画のように「空いている時間に予定入れといて」のような雑な命令でも適切に判断して追加してくれるので便利です。以前と同様にこのGPTも運用コストゼロ

646,136 次观看

Google 本気です。Google は、本日予告通りに Gemini Pro の API をパブリックに公開しました。以下に Gemini API の概要をまとめました👇 ・高性能: 「Gemini Pro」は、同じサイズの他のモデルを上回る性能を提供 ・多言語・多国籍対応: 180カ国以上、38言語に対応し、世界中で使用可能 ・大容量コンテキスト: 最新バージョンでは、テキスト処理用の32Kコンテキストウィンドウが搭載 ・安い&しばらく無料: 現在、開発者はGoogle AI Studioを通じてGemini Pro を無料で利用可能。それ以降は、入力1000トークンあたり約0.035円、出力1000トークンあたり約0.07円、画像一枚につき約0.35円。 ・Google AI Studioを発表: この無料のWebベースの開発ツールを使用すると、迅速にプロンプトを開発し、アプリ開発用のAPIキーを取得可能 ・多機能サポート: 関数呼び出し、埋め込み、セマンティック検索、カスタム知識の根拠設定、チャット機能などを含む多彩な機能を提供 ・二つのエンドポイント: テキストのみを扱う標準版と、テキストと画像の両方を入力できる「Gemini Pro Visionマルチモーダルエンドポイント」がある(gemini-pro OR gemini-pro-vision) ・マルチモーダルプロンプトサポート: マルチモーダルなプロンプト(テキストと画像、またはビデオ)を入力として受け入れ、テキストまたはコードを出力 ・セーフティ設定: レスポンスが特定のセーフティカテゴリに属する可能性に基づいて、ブロックの閾値を設定できます。 ・多様なSDKサポート: Python、Android(Kotlin)、Node.js、Swift、JavaScriptをサポートするSDKがあり、多様なプラットフォームでのアプリ開発を支援 ・複数リージョン対応: 米国中部(アイオワ)、米国西部(ラスベガス、ネバダ州)、カナダ(モントリオール)、米国東部(バージニア州北部)、米国西部(オレゴン)、韓国(ソウル)、シンガポール、日本(東京)など複数の地域でサービスが提供 ・Gemini Ultraのローンチ: 来年初めには、より複雑なタスクに対応するための最大かつ最も能力の高いモデルであるGemini Ultraのローンチを予定

Google 本気です。Google は、本日予告通りに Gemini Pro の API をパブリックに公開しました。以下に Gemini API の概要をまとめました👇 ・高性能: 「Gemini Pro」は、同じサイズの他のモデルを上回る性能を提供 ・多言語・多国籍対応: 180カ国以上、38言語に対応し、世界中で使用可能 ・大容量コンテキスト: 最新バージョンでは、テキスト処理用の32Kコンテキストウィンドウが搭載 ・安い&しばらく無料: 現在、開発者はGoogle AI Studioを通じてGemini Pro を無料で利用可能。それ以降は、入力1000トークンあたり約0.035円、出力1000トークンあたり約0.07円、画像一枚につき約0.35円。 ・Google AI Studioを発表: この無料のWebベースの開発ツールを使用すると、迅速にプロンプトを開発し、アプリ開発用のAPIキーを取得可能 ・多機能サポート: 関数呼び出し、埋め込み、セマンティック検索、カスタム知識の根拠設定、チャット機能などを含む多彩な機能を提供 ・二つのエンドポイント: テキストのみを扱う標準版と、テキストと画像の両方を入力できる「Gemini Pro Visionマルチモーダルエンドポイント」がある(gemini-pro OR gemini-pro-vision) ・マルチモーダルプロンプトサポート: マルチモーダルなプロンプト(テキストと画像、またはビデオ)を入力として受け入れ、テキストまたはコードを出力 ・セーフティ設定: レスポンスが特定のセーフティカテゴリに属する可能性に基づいて、ブロックの閾値を設定できます。 ・多様なSDKサポート: Python、Android(Kotlin)、Node.js、Swift、JavaScriptをサポートするSDKがあり、多様なプラットフォームでのアプリ開発を支援 ・複数リージョン対応: 米国中部(アイオワ)、米国西部(ラスベガス、ネバダ州)、カナダ(モントリオール)、米国東部(バージニア州北部)、米国西部(オレゴン)、韓国(ソウル)、シンガポール、日本(東京)など複数の地域でサービスが提供 ・Gemini Ultraのローンチ: 来年初めには、より複雑なタスクに対応するための最大かつ最も能力の高いモデルであるGemini Ultraのローンチを予定

427,212 次观看

【速報】ChatGPTの音声モードに新しい声「Monday」が追加! ・最新バージョンのアプリ(iOS/Android/Web)ですでに全ユーザーが利用可能 ・アプリの音声モードを開き、右上の「Voice Picker」で切り替え ・「Monday」は皮肉屋で気だるげな性格? ぜひ試してみてください!

【速報】ChatGPTの音声モードに新しい声「Monday」が追加! ・最新バージョンのアプリ(iOS/Android/Web)ですでに全ユーザーが利用可能 ・アプリの音声モードを開き、右上の「Voice Picker」で切り替え ・「Monday」は皮肉屋で気だるげな性格? ぜひ試してみてください!

169,673 次观看

Sora 2は日本語音声の出力もかなり自然です... プロンプト: 「POV、かわいいアニメの女の子と一緒に東京」

Sora 2は日本語音声の出力もかなり自然です... プロンプト: 「POV、かわいいアニメの女の子と一緒に東京」

102,287 次观看

【速報】OpenAI、ChatGPTの画像生成を「gpt-image-1」APIとして公開 画像編集にも対応し、Adobe Firefly/Figma/HeyGen などが先行導入。 料金はテキスト入力$5/画像入力$10/画像出力$40(100Mトークン)。画像は3段階の品質から選択でき、1枚あたり約 $0.02〜 $0.19。 本日より提供開始。

【速報】OpenAI、ChatGPTの画像生成を「gpt-image-1」APIとして公開 画像編集にも対応し、Adobe Firefly/Figma/HeyGen などが先行導入。 料金はテキスト入力$5/画像入力$10/画像出力$40(100Mトークン)。画像は3段階の品質から選択でき、1枚あたり約 $0.02〜 $0.19。 本日より提供開始。

145,007 次观看

【速報】Sora 2でChatGPT Proユーザーが生成した動画からウォーターマークが削除されるように

【速報】Sora 2でChatGPT Proユーザーが生成した動画からウォーターマークが削除されるように

84,768 次观看

【速報】 ついにきた!!!OpenAIから、Claude Computer Useの対抗馬、Macアプリ連携が登場!! ポイント ・ChatGPTがMacアプリと連携可能に ・現状は、VS Code、Xcode、ターミナル、iTerm2のみ対応 ・PlusとTeamユーザー向けに、早期ベータ版を提供 ・Xcode、VS Code、TextEditの開いているエディタ内容を読み取り可能 ・エディタでテキスト選択時、選択箇所に焦点を当てて回答 ・ターミナルでテキスト選択時、選択箇所とその周辺テキストを参考に回答 ・利用にはユーザーの許可が必要 ・EnterpriseとEdu版にも、今後展開予定 先日のBloomberg報道によると、1月にOpenAIは「Operator」というデスクトップ全体を操作するAIエージェントをリリース予定というリークも出されています。今回の発表はその第一歩と見られます。

【速報】 ついにきた!!!OpenAIから、Claude Computer Useの対抗馬、Macアプリ連携が登場!! ポイント ・ChatGPTがMacアプリと連携可能に ・現状は、VS Code、Xcode、ターミナル、iTerm2のみ対応 ・PlusとTeamユーザー向けに、早期ベータ版を提供 ・Xcode、VS Code、TextEditの開いているエディタ内容を読み取り可能 ・エディタでテキスト選択時、選択箇所に焦点を当てて回答 ・ターミナルでテキスト選択時、選択箇所とその周辺テキストを参考に回答 ・利用にはユーザーの許可が必要 ・EnterpriseとEdu版にも、今後展開予定 先日のBloomberg報道によると、1月にOpenAIは「Operator」というデスクトップ全体を操作するAIエージェントをリリース予定というリークも出されています。今回の発表はその第一歩と見られます。

144,548 次观看

【速報】ChatGPT Canvasアップデート!! Canvas機能に複数の新機能が追加されました。 ✅ Canvasが o1に対応(Pro, Plus, Team) ✅ HTML & Reactコードのレンダリングに対応(全ユーザー) ✅macOS向けChatGPTデスクトップアプリで全プランへの完全開放 Enterprise/Eduは今後数週間で展開。 ↓↓↓

【速報】ChatGPT Canvasアップデート!! Canvas機能に複数の新機能が追加されました。 ✅ Canvasが o1に対応(Pro, Plus, Team) ✅ HTML & Reactコードのレンダリングに対応(全ユーザー) ✅macOS向けChatGPTデスクトップアプリで全プランへの完全開放 Enterprise/Eduは今後数週間で展開。 ↓↓↓

116,220 次观看

【速報】Google、Gemini 2.5 Pro搭載の非同期AIコーディングエージェント「Jules」を正式発表! ・本日よりパブリックベータ ( jules. google ) を開始 ・大規模コードベースでの複雑なタスク(バグ修正、機能実装等)を、数時間から数分レベルに短縮へ ・GitHub連携で非同期処理

【速報】Google、Gemini 2.5 Pro搭載の非同期AIコーディングエージェント「Jules」を正式発表! ・本日よりパブリックベータ ( jules. google ) を開始 ・大規模コードベースでの複雑なタスク(バグ修正、機能実装等)を、数時間から数分レベルに短縮へ ・GitHub連携で非同期処理

91,703 次观看

【速報】ChatGPTのWeb版に待望の音声入力機能が登場 以前から一部ユーザーに先行リリースされていましたが、一般ユーザーへの公開が始まったようです。 ・マイクアイコンから直接話すと、音声がテキストに変換されて入力欄に反映 ・日本語の音声認識精度もかなり高い印象

【速報】ChatGPTのWeb版に待望の音声入力機能が登場 以前から一部ユーザーに先行リリースされていましたが、一般ユーザーへの公開が始まったようです。 ・マイクアイコンから直接話すと、音声がテキストに変換されて入力欄に反映 ・日本語の音声認識精度もかなり高い印象

88,225 次观看

【速報】Google Geminiの無料版でもGemini 2.0 Flashが使えるように また画像生成機能も非常に高精度な画像生成AI、Imagen 3 の最新バージョンにアップグレード🔥

【速報】Google Geminiの無料版でもGemini 2.0 Flashが使えるように また画像生成機能も非常に高精度な画像生成AI、Imagen 3 の最新バージョンにアップグレード🔥

90,208 次观看

Claude 3.7 Sonnetはすでに Bolt, Cursor, Cline, Devin, Vercel AI SDK などへの統合が報告されています!

Claude 3.7 Sonnetはすでに Bolt, Cursor, Cline, Devin, Vercel AI SDK などへの統合が報告されています!

35,065 次观看

Videos

ctgptlb's profile picture

【速報】Anthropic CEO「6〜12ヶ月でAIがSWE業務をほぼ全て遂行」 ダボス会議でDario Amodeiが発言。AIがAI開発を加速するフィードバックループが形成されつつあり、チップ製造などの制約を考慮しても「予想より早く進む」との見解を示した。 文字おこし全文↓ 女性司会者:まずタイムラインについて、ダリオ、昨年パリで「2026年か27年までに、ノーベル賞受賞者レベルで人間ができることを多くの分野でこなせるモデルができる」とおっしゃいましたね。今は2026年です。その予測は今も変わりませんか? Dario Amodei:そうですね、何かがいつ起きるか正確に予測するのは常に難しいですが、そこまで外れていないと思います。 私が想定しているメカニズムは、コーディングとAI研究に優れたモデルを作り、それを使って次世代のモデルを作り、開発を加速させる——モデル開発のスピードを上げるループを作ることです。 現在、コードを書くモデルについて言えば、Anthropic社内のエンジニアで「もうコードを書いていない」という人がいます。モデルにコードを書かせて、自分は編集したり周辺作業をするだけだと。 おそらく6〜12ヶ月後には、ソフトウェアエンジニアの仕事のほとんど、あるいは全てをモデルがエンドツーエンドでこなすようになると思います。そうなると、そのループがどれだけ速く閉じるかという問題です。 ループの全ての部分がAIで加速できるわけではありません。チップがあり、チップの製造があり、モデルの訓練時間があります。不確実性は多いと思います。数年かかる可能性は十分にあります。それ以上かかるとは考えにくいですが、予測するなら、人々が想像するより速く進むと思います。 コーディングと研究が予想以上に速く進む、それが重要な推進力になります。その指数関数的な加速がどれほどのスピードアップをもたらすか、予測は本当に難しいです。でも何か速いことが起きます。

AGIラボ

238,330 次观看 • 4 个月前

ctgptlb's profile picture

GPT-4o、やばすぎる……

AGIラボ

939,360 次观看 • 2 年前