Video wird geladen...

Video konnte nicht geladen werden

Zur Startseite

Locipo (ロキポ)は 名古屋のテレビ局が共同で運営する動画配信プラットフォーム 【テレビ番組が無料で見放題】 そんなLocipoのCMソングをぜひチェック! アニメーションのきもかわダンス(?)にもご注目! ぜひ音声オンで動画見てね

3,927,281 Aufrufe • vor 2 Monaten •via X (Twitter)

0 Kommentare

Keine Kommentare verfügbar

Kommentare vom Original-Post werden hier angezeigt

Ähnliche Videos

【速報】中国Alibabaがマルチモーダルで勝負を仕掛けてきた。テキスト・画像・音声・動画を全て理解して音声も生成できる「Qwen3-Omni」を完全オープンソース化。何が凄いのか、具体的に解説していきます。 ①音声生成できる唯一のオープンソースモデル MetaのLlama 4、GoogleのGemma 3、OpenAIのGPT-OSS、全部音声生成はできない。 でもQwen3-Omniだけはテキスト・画像・音声・動画を理解して、さらに音声でも返答できる。 つまり「動画見せて音声で説明して」「リアルタイム音声会話」が無料でできる唯一のオープンソース。これがApache 2.0ライセンスで商用利用OK、完全無料ってヤバすぎる。 ②実力テストで有料モデルと互角 AIの実力を測る「ベンチマーク」でQwen3-Omniが驚異的な結果を出してる。36のベンチマークのうち22で最高スコア、32でオープンソース1位を記録。 しかも動作に必要なのは30億パラメータだけ。他のモデルが数千億必要なのに。つまり、普通のPCでも動くサイズで、巨大サーバー必要なAIと同等の性能ってこと。 ③動画と音声の同期技術がヤバい 「Thinker-Talker」っていう新技術で、考える部分と話す部分を分離。これで0.234秒(まばたきする間)で音声返答できるようになった。さらに「TMRoPE」技術で動画と音声のタイムスタンプを完璧に同期。 動画見せて「これを日本語吹き替えして」って言ったら、音声タイミングを合わせて吹き替えできるレベル。 ④音声AIビジネスが爆発的に広がる OpenAIのRealtime APIは音声会話できるけど、100万トークンで入力40ドル、出力80ドルかかる。 でもQwen3-Omniなら同じような機能を自社サーバーで無制限に使える。これで何ができるか? AI Vtuberの音声をリアルタイムで生成する配信。バーチャルAIインフルエンサーが動画を見ながら実況。視聴者の動画に多言語音声を自動でつける機能も、タイミングを合わせて生成できる。 さらに、オンライン語学学習アプリ、AIカスタマーサポート、音声ガイドアプリ。 全部APIコストゼロで、リアルタイム音声対話が可能になる。(誰か精度検証お願いしますw) というわけで、音声対話AIを開発するなら、Qwen3-Omni試さない理由がない。AI Vtuberから動画翻訳まで、音声生成できる唯一のオープンソースAIだぞ。

Tom | ドバイで生成AIやってる人

46,269 Aufrufe • vor 9 Monaten