Video wird geladen...

Video konnte nicht geladen werden

Zur Startseite

ByteDanceの音声生成AI 「Seed Audio 1.0」 使用感はこんな感じでした! ・Seedance2.0での音声出力より日本語が安定 ・セリフに沿って感情表現を微妙に合わせてくれる ・音声と画像は同時にリファレンス不可 ・音声のリファレンスの精度が高い(Max30秒) ・高い声だと機械音っぽい感じが出やすい 用途にもよりますが、ElevenLabsより使いやすいかもしれないです…👀 またじっくり検証してみます!

30,891 Aufrufe • vor 8 Tagen •via X (Twitter)

0 Kommentare

Keine Kommentare verfügbar

Kommentare vom Original-Post werden hier angezeigt

Ähnliche Videos

🎊🎊様々なキャラクターたちの声で音声合成できるサービス”Kotodama”をリリースします🎊🎊 感情豊かなキャラクターの声で、新しい物語を紡いであげてください。HappyRatの他のキャラクターや、HappyRat以外のキャラクターも順次登場予定です。 お楽しみに! -------- 僕達は感情豊かなキャラクターAIを作っています。その中でも、声は欠かすことができない要素で、こだわりを持ちながら音声合成エンジンを作っています。 フルスクラッチの学習からスタートして、感情豊かな表現を出すためにモデル自体を改良したり、より自然な表現になるよう日夜アノテーションで性能改善を進めたり。 ・・・そんなことを積み上げていたら、いつの間にか「リアルタイム (<0.5秒)」「キャラクターの声色の再現」「豊かな感情表現」の三拍子揃ったモデルになっていました。 これまでは弊社アプリからのみ利用可能な状態にしていましたが、様々な企業様やクリエイターの方から、ぜひ誰でも簡単に使えるようにしてほしいとご要望をいただき、晴れて独立したサービスとしてローンチすることになりました。 特に自信があるのは、リアルタイム性と感情表現の豊かさです。API経由でも使えますので、リアルタイム対話アプリケーションにもぴったりです。 感情表現については・・・そうですね、ここまで本気で、泣いたり笑ったり出来る音声合成エンジンは、これまで無かったのではと思います。 ぜひ実際のサービスで体験してみてください‼️ #ハピラト #kotodama #音声AI #AIVOICE #AI

佐々木雄一 (SpiralAI CEO)

74,301 Aufrufe • vor 8 Monaten

今回は Void Gaming さんより、話題のコントローラー「FireBird」をご提供いただいたので、忖度なしで正直にレビューします。 これまで DualShock 4 を使用していましたが、FireBirdに変更してまず感じたのは「遅延の少なさ」です。 撃ち合いで「あと少し追えない」「反応が一瞬遅れる」と感じていた場面がありましたが、FireBirdに替えてからはしっかり追えるようになりました。 これは気のせいではなく、明確に体感できた変化です。入力に対するレスポンスがとにかく速いと感じました。 スティックの操作感も非常に良好です。 他のコントローラーを多く使ってきたわけではありませんが、それでも違いがはっきり分かるレベル。エイムの安定感が一段階向上した印象があります。 背面ボタンは好みが分かれる部分だと思いますが、私はリロードを設定しています。 親指をスティックから離さずに操作できるため、撃ち合い時の安定感につながっていると感じました。 これだけの性能を持ちながら、コストパフォーマンスが高い点も魅力です。 今回は提供品として使用させていただきましたが、個人的にももう一台購入を検討しています。 一方で、気になった点もあります。 起動時に接続がやや不安定に感じることがあります。プレイに大きな支障はありませんでしたが、人によってはストレスに感じる可能性があります。 また、スティック感度が良い分、最初は指先が少し震えて疲れやすく感じました。 ただし、数日使えば自然と慣れる範囲だと思います。 総合的に見ると、FireBirdは自分のポテンシャルを最大限に引き出してくれるコントローラーでした。 本気で上達を目指している方には、十分検討する価値のある製品だと感じています。 以下はFireBird使用時のクリップです

ちこちゃんだお🐟🪇【BS】

83,013 Aufrufe • vor 4 Monaten

最近、YouTubeのコメント欄に「某声優さんにそっくり」「AIだろ」「訴えられろ」みたいなコメントが急増しています。 親父譲りの声でお話しているだけなのですが…せっかくなので、声の類似性について音声学的な話を少し。 人間の声は、声帯で作られるピッチと、声道(喉・口腔・鼻腔)の形状で決まる共鳴特性によって成り立っています。 声道の長さ・形状は、身長や骨格と強く関係しており、個人差も大きい。 ですが80億人もいるので、色々な条件の組み合わせの中で「似た声」が出てくるのは、生物学的に自然な現象です。 顔の「そっくりさん」がいるのと同じ理屈です。 むしろ、顔は似せるために極めて多くの条件が同時に一致する必要がある一方で、声は連続的な変数が多く、完全に一致しなくても「似た音色」として聞こえやすいのです。 つまり、「声の出力(聞こえ方)」が似る確率は、「顔が似る」確率より高い傾向があるということです。 実際、法廷音声鑑定の分野では、声は指紋ほど完全にユニークではなく、似た声の誤認リスクは常に議論されています。 特に双子研究では声の類似性が非常に高いケースが多く報告されています。 つまり「似てる声」は普通に「あるある」なのです。 僕の場合は、完全に親父と瓜二つの声であって、誰かの声を学習させたAIでも声真似でもありません。 (ちなみに副鼻腔炎になりやすい鼻腔なので、似てる人は副鼻腔炎持ち率が高いかも…?) ということで、これを読んだ人は「似てる声」は「顔が似てる」と同様に、ただのあるあるなんだということを、新しい知見として認識してもらえると良いなと思います。 そして、誤解している人を見かけたら「違いますよ」と指摘していただけますと幸いです。 ※ただし、これは自然に生まれた声の話です。 特定の声優の声をAIに無断で学習させて、収益化するのは全く別問題です。 おそらく最新の分析技術であれば、生声か学習かくらい判別できそうですが、どうなんでしょう??🧐

神のみぞ知る

19,510 Aufrufe • vor 1 Monat

【SunoとUdioの違いについて】(主観) 音質の違いからずっとUdioを使い続けてましたが、SunoV4.5+がでてから3日ほど使ってみました。 結論から言うと、どちらも良し悪しがあり使い分けが必要という判断に至りました。 当初から気になっていた、Sunoの音質に関してはやはりUdioに比べると低音が割れてしまったり全体的にばらつきがあるように感じました。 しかし、Udioに比べてプロンプトやタグの理解度が高く、パラメーターの調整やv4.5から使えるようになった「Remaster」機能などを使うと音質も多少調整できることに気が付きました。 「Remaster」機能を使うと、ボーカルや楽器の音質やリズムを微調整してくれているような気がしていますが、良くも悪くもお利巧な音になるのでライブ感を残したい人には微妙かも。 まだやってませんが、Udioで作ったインスト曲をSunoの「Cover」機能でボーカルを付けるといった方法もありかもしれませんね。 あと最大の特徴と感じたのは、トラック数の多さです。 Udioは楽器を多く入れてもプロンプトで指示しても、トラック数に制限があるように感じました。 それに比べてSunoは再現できる楽器は無理やりにでも入れてくれるのでどこまでも豪華な曲にできます。 ただ、トラックを増やせば増やすほど、全体のバランスが崩れてガサガサしたノイズに近付いていきます。 v4.0以降使っていなかったので、まだまだ主観ですがもう少し研究して音質にもこだわった設定を探したいです。 とりあえず当面は、映画などで使う雰囲気重視のインストや電子音系は「Udio」、アニメなどで使う歌付きで日本風の曲を作る場合は「Suno」といった使い分けをすると思います。 余談ですが、日本は人口密度が高く、住宅が密集しているため、低音が効いた音楽を良いスピーカーで聴くという習慣はほとんどの人がもちあわせていません。 欧米の音圧や音質でシンプルにせめてくる音楽とは違って、昨今のJpopはトラック数が多く、楽器ごとにリズムやメロディーを工夫した繊細な曲が多くなってきた印象です。 この日本のテクニカルな音楽造りはとても文化的で、他国には真似できないレベルになってきていたと個人的に思います。 Sunoの音質が整ったとき、音楽業界は確実にひっくり返されることになると思います。 どのAIもそうですが、プロが使えば素人が追い抜かせる余地などありません。 まだAI音楽を見て見ぬふりしているプロの方がいれば一度試してみることをオススメします。 AIミュージック Suno v4.5+ (Suno) Lyrics : Chat GPT AIイラスト Nijijourney(niji・journey ✨) niji6 + personalized AIアニメーション Vidu AI (Vidu AI) Reference Q1 イラスト1枚 #AI音楽 #AIミュージック #AImusic

SEIIIRU😈動画生成AI×AfterEffects

39,771 Aufrufe • vor 11 Monaten

先日、SUNOで生成されたものをmp3でダウンロードするか wavでダウンロードするか、で音質が違うという話題を見かけました。 SUNOもACE Studioも(というかAI生成全部かもしれない) mp3で生成されます。 SUNOの場合、生成された状態はmp3でもwavでダウンロードを掛けると何かしらのフィルターが掛かって書き出されるのか それともコンバートの精度なのか、音は変わるっぽい。 その話題で、初心者の方々に誤った勘違いが起こっているのをちょこちょこ見かけました。 ここからはSUNOやAI生成の話ではないです。 WAVやAIFFからmp3やAACに変換された音声は 圧縮するために情報量が削られます。 この動画を見ていただければ、元は同じファイルでも mp3の方は上が無くなっている事が分かると思います。 で、この状態のmp3やAACを、wavやAIFFに変換しても 容量が増えるだけで失った音質は戻ってきません。 なので「wavの方が音が良い」は、この状態になってしまったファイルには当てはまりません。 mp3と全く同じ音のまま容量が増えるだけです。 ちなみに、Logic Proはmp3やAACを取り込むと 自動的に設定しているwavかAIFFに変換されます。 ※DAWによっては、そのままmp3を扱うものと、wavに変換されるものがあります。 そのまま再生するとmp3と全く同じ音になります。 では、なぜDAWに入れた際にwavに変換されるのか? フェーダー操作やPluginを掛けていった際に、mp3とwavで結果が変わる点と mp3やAACを再生するために都度デコードしながら再生するので、無駄な負荷が掛かるためです。 とはいえ、現代のパソコンでこの程度の負荷は誤差の範囲ですが デコードしながらプラグインも掛ける行為が安定しているとはいえない、とされているからの様です。 ここでSUNOの話に戻します。 なので、SUNOで生成されたファイルをmp3でダウンロードした後に それを何かしらのソフトでwavに変換しただけの状態では 無駄に容量が増えただけで音質は変わっていない、という事です。 (先に書いたように、SUNOからのダウンロードにおいてはmp3とwavは音が違うようです。) その後、何かしらの変化を行った場合にwavが活きてくる。 何も変化を起こさない2mixのままならmp3のままでいい、という事になります。 ※一部、特殊な音声圧縮フォーマット「FLAC」は 元の音質に戻ります。

くうP

84,546 Aufrufe • vor 1 Monat