Loading video...

Video Failed to Load

Go Home

📢nizima ACTION!!でVOICEVOX&ずんだもんLive2Dモデルが使える! 新登場の「字幕・音声合成」では字幕をまとめて作成でき、 VOICEVOXの声やGoogle音声合成による世界中の音声を簡単に生み出せます🎶 さらに、表情豊かなずんだもん(坂本アヒル式)のLive2Dモデルも新登場! ぜひ使ってみてください✨

91,840 views • 13 days ago •via X (Twitter)

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

🎊🎊様々なキャラクターたちの声で音声合成できるサービス”Kotodama”をリリースします🎊🎊 感情豊かなキャラクターの声で、新しい物語を紡いであげてください。HappyRatの他のキャラクターや、HappyRat以外のキャラクターも順次登場予定です。 お楽しみに! -------- 僕達は感情豊かなキャラクターAIを作っています。その中でも、声は欠かすことができない要素で、こだわりを持ちながら音声合成エンジンを作っています。 フルスクラッチの学習からスタートして、感情豊かな表現を出すためにモデル自体を改良したり、より自然な表現になるよう日夜アノテーションで性能改善を進めたり。 ・・・そんなことを積み上げていたら、いつの間にか「リアルタイム (<0.5秒)」「キャラクターの声色の再現」「豊かな感情表現」の三拍子揃ったモデルになっていました。 これまでは弊社アプリからのみ利用可能な状態にしていましたが、様々な企業様やクリエイターの方から、ぜひ誰でも簡単に使えるようにしてほしいとご要望をいただき、晴れて独立したサービスとしてローンチすることになりました。 特に自信があるのは、リアルタイム性と感情表現の豊かさです。API経由でも使えますので、リアルタイム対話アプリケーションにもぴったりです。 感情表現については・・・そうですね、ここまで本気で、泣いたり笑ったり出来る音声合成エンジンは、これまで無かったのではと思います。 ぜひ実際のサービスで体験してみてください‼️ #ハピラト #kotodama #音声AI #AIVOICE #AI

佐々木雄一 (SpiralAI CEO)

74,301 views • 7 months ago

✨AI音声で一貫した声を作り会話させるチャレンジ 前に音声を使ってLLMの文章を読ませることには成功していたけど、今回はオリジナルの声を作成してみました。 やったこと: ①まずQwen3-TTSで声を1個作る ②その声で171個量産(台詞バリエーション) ③Style-Bert-VITS2で学習 → 50分でカスタム音声モデル完成 ④UIに接続 → リアルタイムで喋る やばい!自分で作った声だと楽しい😊 苦労したところ: ・最初はブラウザ内TTS(Chatterbox)を試した → 1文30秒&英語のみでまだ難しいしそもそもこの用途が厳しいかも💦 ・SBV2に切り替えたら環境構築に手間取ったけどうまくいった ・ただライセンスは要注意。やる場合は先にライセンス確認を。用途によっては制限があるものもある📝 まだまだ色々あるけど、今後のことを考えるとNVIDIAからも良い音声AIが出てるし、対応できるようにしておきたい。 今回は前回と同じくモデルはGPT-OSS 20Bだけど、Ollamaから読んでるので早い。 WebGPUでこれぐらい出たら嬉しいけどなー🥰 とはいえローカルでここまでできるようになったのは嬉しい。データは一切外に出ないしね。 声の元はAI生成だから、「存在しない人の声」をAIが学習して、AIキャラが喋る。 #AI #TTS

LUTA@AI

57,505 views • 3 months ago