Loading video...

Video Failed to Load

Go Home

Elgato、無料オーディオミキシングソフト「Wave Link 3.0」正式リリース ゲーム音声やマイク入力などを一元管理し、出力先ごとにミュートや音量調節などが可能。Elgato製品に限定せず、あらゆるデバイスで利用できる

128,775 views • 3 months ago •via X (Twitter)

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

【速報】中国Alibabaがマルチモーダルで勝負を仕掛けてきた。テキスト・画像・音声・動画を全て理解して音声も生成できる「Qwen3-Omni」を完全オープンソース化。何が凄いのか、具体的に解説していきます。 ①音声生成できる唯一のオープンソースモデル MetaのLlama 4、GoogleのGemma 3、OpenAIのGPT-OSS、全部音声生成はできない。 でもQwen3-Omniだけはテキスト・画像・音声・動画を理解して、さらに音声でも返答できる。 つまり「動画見せて音声で説明して」「リアルタイム音声会話」が無料でできる唯一のオープンソース。これがApache 2.0ライセンスで商用利用OK、完全無料ってヤバすぎる。 ②実力テストで有料モデルと互角 AIの実力を測る「ベンチマーク」でQwen3-Omniが驚異的な結果を出してる。36のベンチマークのうち22で最高スコア、32でオープンソース1位を記録。 しかも動作に必要なのは30億パラメータだけ。他のモデルが数千億必要なのに。つまり、普通のPCでも動くサイズで、巨大サーバー必要なAIと同等の性能ってこと。 ③動画と音声の同期技術がヤバい 「Thinker-Talker」っていう新技術で、考える部分と話す部分を分離。これで0.234秒(まばたきする間)で音声返答できるようになった。さらに「TMRoPE」技術で動画と音声のタイムスタンプを完璧に同期。 動画見せて「これを日本語吹き替えして」って言ったら、音声タイミングを合わせて吹き替えできるレベル。 ④音声AIビジネスが爆発的に広がる OpenAIのRealtime APIは音声会話できるけど、100万トークンで入力40ドル、出力80ドルかかる。 でもQwen3-Omniなら同じような機能を自社サーバーで無制限に使える。これで何ができるか? AI Vtuberの音声をリアルタイムで生成する配信。バーチャルAIインフルエンサーが動画を見ながら実況。視聴者の動画に多言語音声を自動でつける機能も、タイミングを合わせて生成できる。 さらに、オンライン語学学習アプリ、AIカスタマーサポート、音声ガイドアプリ。 全部APIコストゼロで、リアルタイム音声対話が可能になる。(誰か精度検証お願いしますw) というわけで、音声対話AIを開発するなら、Qwen3-Omni試さない理由がない。AI Vtuberから動画翻訳まで、音声生成できる唯一のオープンソースAIだぞ。

Tom | ドバイで生成AIやってる人

46,269 views • 9 months ago

【SUPERBOOTH26 レポート 26 】【長文注意】 あまりにも革新的… Elektron Outbox 8 について色々聞いてきました! ※開発中の製品且つ、筆者のヒアリング時の誤りが含まれる可能性もありますので、正確な情報を保証するものではありません。予めご了承下さい。 Digitone II などの Overbridge 対応製品にUSBで直接繋ぐことで、Outbox 8 から音声のパラアウトやバスアウト、CV/Gate 等の出力が可能になります。 まず、動画の画面の様に8つのアウトをどう使うか構成を決定します。 オーディオでは、Mono や Stereo アウト、CV ではピッチやゲート、クロックやモジュレーション信号などをアサイン可能。 OS はまだプロトタイプとのことですが、8つのアウトの中にボーダーを設定し、左側をオーディオ、右側をCVとして使用できるようになっていました。 Outbox 8 のアウトはバランス・モノラルアウト(TRS) x8 の構成となっておりますが、ブースではTS - mini TSケーブルを直接さして、Mother 32 にCV出力を行っていました。 スプリッター・ケーブルなどを使わずそのまま出力できるのは便利ですね! CVアウトについてはおそらく、MIDI トラックのシーケンスを CV/Gate として変換/出力できる様です。 CV出力は+-5Vで、最大値/最小値を細かく設定できる様になっていました。 オーディオアウトについては、上記の設定画面で構成した各アウト毎にルーティング設定画面が設けられ、其々に任意のトラックを複数選択可能です。 ※Syntakt の FX トラックへのルーティング画面に近い挙動。 つまり、シンプルなパラアウトも可能ですし、ドラムや上物など、複数のトラックをまとめて、一つのアウトから出力することも可能です。 同じ内容の出力を二つ作って片方は空間系ペダルに、なんて構成も出来ますね! とにかくElektronユーザーにとって非常に革新的なデバイスです。中の人も早く買いたい!! #Superbooth #Superbooth26 #Elektron

宮地楽器RPM シンセサイザーコーナー【Elektron 下取り価格UPキャンペーン中!!】

36,661 views • 1 month ago

これかなり有益なんですけど・・・ 昨日も1,000いいね17万インプ達成!! 本日は、 Deepfakeする上で重要なことをガチまとめ。 著作権or素材の探し方のヒント。 音楽はSunoを使うべき。 ↓ ※まず、Deepfake技術を使用する際は、倫理的な側面を常に考慮することが不可欠。 個人の肖像権やプライバシーを尊重し、誤解を招くような用途での使用は避けましょう。 ━━ ①Deepfakeとは? ━━ ディープフェイクとは、人工知能の一種であるディープラーニングの技術を使って、 本物そっくりの映像や音声を作り出す技術のこと。 たとえば、ある有名人が実際には言っていない言葉を話しているような動画や、全く別の人の顔を、本物のように見せる画像などが作れます。 この技術は日々進化しており、 今では人間の目では本物か偽物かの区別がつかないほど高い品質の映像や画像を作ることが可能。 さらに、音声もまるで本人が話しているかのように再現できるようになっています。 ↓ しかし、 この技術には大きな問題があり。 インターネット上で、 人をだます目的で使われることが多く、 ①いじめ ②名誉棄損 ③脅迫 ④詐欺 などの犯罪に利用されるケースが増えています。 見た目や聞こえがとてもリアルなため、 誤解を招いたり、 人々に悪影響を与えることがあるのです。 ディープフェイクは非常に進歩した技術ですが、 その使い方には倫理的な観点から注意が必要。 偽の情報を見分ける力を身につけ、 インターネット上の情報を 扱う際には慎重になることが大切です。 ━━ ②著作権や素材の探し方 ━━ 次に、著作権や素材の探し方についてです。 Deepfakeに使用する素材は、著作権で保護されていないか、あるいは適切な許可を得たものでなければなりません。 ①フリー素材サイト ②クリエイティブ・コモンズライセンスの素材 ③商用利用できる など、合法的に使用可能なリソース を活用することが重要です。 ━━ ③動画の音楽選びのポイント ━━ 音楽選びには、Sunoがおすすめ。 Suno AI は、楽器や音楽理論の知識がなくても、 誰でも簡単にオリジナル音楽を作ることができるという、初心者にとって魅力的なサービス。 ①楽器や音楽理論の知識が不要 ↓ ②音楽制作のハードルを大幅に下げます。 ↓ ③テキストを入力するだけでOK ↓ ④誰でも簡単に始めることができます。 ↓ ⑤さまざまなジャンルの音楽を作れる ↓ ⑥自分の好きな音楽を作ることができます。 Sunoは様々なジャンルの音楽を提供しており、 特にクリエイティブなプロジェクトに適しています。 しかし、音楽も著作権の対象であるため、使用する際はライセンス条項を確認し、必要に応じて許可を得ることが重要。 課金すれば、 8ドルで500曲商用で利用可能です。 ━━ まとめ ━━ ディープフェイク技術は、 クリエイティブな表現の可能性を広げる一方で、 倫理的な観点からの慎重な取り扱いが必要です。 正しい知識と使い方で、 この技術の潜在力を活用しながら、 倫理的な問題や著作権の遵守にも 注意を払いましょう! やってみたい人はリプ欄にお好きな絵文字✨ ここからどれだけDeepfakeが凄いのか✓ ↓

こはく

48,411 views • 2 years ago