Video wird geladen...

Video konnte nicht geladen werden

Zur Startseite

「Synthesizer V 2 AI 小春六花」は声優「青山吉能」の声を元に制作した、明るく元気で、声に芯もありつつ語尾には声が抜けていく余韻もあるオールジャンルに対応できる歌声データベースです。 対応ボーカルスタイル:Pops/Soft/Kawaii/Mellow/Ballade/Emotional/Adult

22,530 Aufrufe • vor 4 Monaten •via X (Twitter)

0 Kommentare

Keine Kommentare verfügbar

Kommentare vom Original-Post werden hier angezeigt

Ähnliche Videos

最近、YouTubeのコメント欄に「某声優さんにそっくり」「AIだろ」「訴えられろ」みたいなコメントが急増しています。 親父譲りの声でお話しているだけなのですが…せっかくなので、声の類似性について音声学的な話を少し。 人間の声は、声帯で作られるピッチと、声道(喉・口腔・鼻腔)の形状で決まる共鳴特性によって成り立っています。 声道の長さ・形状は、身長や骨格と強く関係しており、個人差も大きい。 ですが80億人もいるので、色々な条件の組み合わせの中で「似た声」が出てくるのは、生物学的に自然な現象です。 顔の「そっくりさん」がいるのと同じ理屈です。 むしろ、顔は似せるために極めて多くの条件が同時に一致する必要がある一方で、声は連続的な変数が多く、完全に一致しなくても「似た音色」として聞こえやすいのです。 つまり、「声の出力(聞こえ方)」が似る確率は、「顔が似る」確率より高い傾向があるということです。 実際、法廷音声鑑定の分野では、声は指紋ほど完全にユニークではなく、似た声の誤認リスクは常に議論されています。 特に双子研究では声の類似性が非常に高いケースが多く報告されています。 つまり「似てる声」は普通に「あるある」なのです。 僕の場合は、完全に親父と瓜二つの声であって、誰かの声を学習させたAIでも声真似でもありません。 (ちなみに副鼻腔炎になりやすい鼻腔なので、似てる人は副鼻腔炎持ち率が高いかも…?) ということで、これを読んだ人は「似てる声」は「顔が似てる」と同様に、ただのあるあるなんだということを、新しい知見として認識してもらえると良いなと思います。 そして、誤解している人を見かけたら「違いますよ」と指摘していただけますと幸いです。 ※ただし、これは自然に生まれた声の話です。 特定の声優の声をAIに無断で学習させて、収益化するのは全く別問題です。 おそらく最新の分析技術であれば、生声か学習かくらい判別できそうですが、どうなんでしょう??🧐

神のみぞ知る

19,510 Aufrufe • vor 20 Tagen

✨AI音声で一貫した声を作り会話させるチャレンジ 前に音声を使ってLLMの文章を読ませることには成功していたけど、今回はオリジナルの声を作成してみました。 やったこと: ①まずQwen3-TTSで声を1個作る ②その声で171個量産(台詞バリエーション) ③Style-Bert-VITS2で学習 → 50分でカスタム音声モデル完成 ④UIに接続 → リアルタイムで喋る やばい!自分で作った声だと楽しい😊 苦労したところ: ・最初はブラウザ内TTS(Chatterbox)を試した → 1文30秒&英語のみでまだ難しいしそもそもこの用途が厳しいかも💦 ・SBV2に切り替えたら環境構築に手間取ったけどうまくいった ・ただライセンスは要注意。やる場合は先にライセンス確認を。用途によっては制限があるものもある📝 まだまだ色々あるけど、今後のことを考えるとNVIDIAからも良い音声AIが出てるし、対応できるようにしておきたい。 今回は前回と同じくモデルはGPT-OSS 20Bだけど、Ollamaから読んでるので早い。 WebGPUでこれぐらい出たら嬉しいけどなー🥰 とはいえローカルでここまでできるようになったのは嬉しい。データは一切外に出ないしね。 声の元はAI生成だから、「存在しない人の声」をAIが学習して、AIキャラが喋る。 #AI #TTS

LUTA@AI

57,505 Aufrufe • vor 3 Monaten