Загрузка видео...

Не удалось загрузить видео

На главную

Suno v4.5でプロンプトに "spoken word" を指定すると歌ではなくトークモードになってくれるんですが、結構な確率でBGM的なものが入る... それを逆手に取ってSunoを「朗読劇生成AI」にするテスト☺️ イラストはChatGPT、字幕はFilmoraのAI字幕起こしを使って一撃です

28,903 просмотров • 1 год назад •via X (Twitter)

Комментарии: 7

Фото профиля あしながジャック卿@物言う犬
あしながジャック卿@物言う犬1 год назад

いい感じですね。お話。 民謡もそうでした。アカペラで歌って、後ろでちょっと津軽三味線を鳴らしてくれればいいものを、頼んでない太鼓や、嫌がらせの男衆の掛け声や、最後はお囃子でお祭り騒ぎ・・・・。頼んでないのに。ww

Фото профиля いにしえ@AIクリエイター
いにしえ@AIクリエイター1 год назад

生成するたびにトークテイストが違うのが面白いですね ネタとして生成するのは楽しいんですけど、一貫性のあるコンテンツを複数作るってのは厳しいので、あくまで検証用の範囲かな~と思いましたw

Фото профиля 🌸 Sleepy Time Lofi Channel 🌸
🌸 Sleepy Time Lofi Channel 🌸1 год назад

朗読劇AIとしての可能性、めちゃくちゃ面白いです☺️

Фото профиля いにしえ@AIクリエイター
いにしえ@AIクリエイター1 год назад

いい感じのトーク生成ができればいいんですけど、ガチャ要素が大きいので実用性はどうかなーとは思います 個人的にはOpenAI,fmのほうが向いてると思いました

Фото профиля 沖縄ジョニー
沖縄ジョニー1 год назад

読み上げソフトやAIで一番日本語が上手いのは何になるのでしょうか?ご存知でしたら教えてください。

Фото профиля いにしえ@AIクリエイター
いにしえ@AIクリエイター1 год назад

こちらどうぞ!あとは、にじボイスとかOpenAI,fmなんかもありかなと

Фото профиля The Rundown AI
The Rundown AI2 лет назад

AI won't replace you, but a person using AI will. Join 500,000+ readers and learn how to use AI in just 5 minutes a day (for free).

Похожие видео

先日、SUNOで生成されたものをmp3でダウンロードするか wavでダウンロードするか、で音質が違うという話題を見かけました。 SUNOもACE Studioも(というかAI生成全部かもしれない) mp3で生成されます。 SUNOの場合、生成された状態はmp3でもwavでダウンロードを掛けると何かしらのフィルターが掛かって書き出されるのか それともコンバートの精度なのか、音は変わるっぽい。 その話題で、初心者の方々に誤った勘違いが起こっているのをちょこちょこ見かけました。 ここからはSUNOやAI生成の話ではないです。 WAVやAIFFからmp3やAACに変換された音声は 圧縮するために情報量が削られます。 この動画を見ていただければ、元は同じファイルでも mp3の方は上が無くなっている事が分かると思います。 で、この状態のmp3やAACを、wavやAIFFに変換しても 容量が増えるだけで失った音質は戻ってきません。 なので「wavの方が音が良い」は、この状態になってしまったファイルには当てはまりません。 mp3と全く同じ音のまま容量が増えるだけです。 ちなみに、Logic Proはmp3やAACを取り込むと 自動的に設定しているwavかAIFFに変換されます。 ※DAWによっては、そのままmp3を扱うものと、wavに変換されるものがあります。 そのまま再生するとmp3と全く同じ音になります。 では、なぜDAWに入れた際にwavに変換されるのか? フェーダー操作やPluginを掛けていった際に、mp3とwavで結果が変わる点と mp3やAACを再生するために都度デコードしながら再生するので、無駄な負荷が掛かるためです。 とはいえ、現代のパソコンでこの程度の負荷は誤差の範囲ですが デコードしながらプラグインも掛ける行為が安定しているとはいえない、とされているからの様です。 ここでSUNOの話に戻します。 なので、SUNOで生成されたファイルをmp3でダウンロードした後に それを何かしらのソフトでwavに変換しただけの状態では 無駄に容量が増えただけで音質は変わっていない、という事です。 (先に書いたように、SUNOからのダウンロードにおいてはmp3とwavは音が違うようです。) その後、何かしらの変化を行った場合にwavが活きてくる。 何も変化を起こさない2mixのままならmp3のままでいい、という事になります。 ※一部、特殊な音声圧縮フォーマット「FLAC」は 元の音質に戻ります。

くうP

84,546 просмотров • 1 месяц назад

いまのAIに決定的に欠けているのは、僕たちの背景を理解する能力だ。だから毎回プロンプトで関係性を組み立て、状況説明をし、欲しい出力へ誘導しなければならない。だが、その制約が外れ始めたとき、AIは単なる便利ツールではなくなるのだろう。その日はきっと、それほど遠くない。 サム・アルトマン「今のモデルは、将来そうなるものと比べれば、まだかなり愚かです。しかもそれ以上に、あなたの人生についての理解がきわめて限られています。今はまだ、こちらがうまく、なだめたりすかしたりしながら、欲しいものを引き出さなければならないのです。 ですが、あなたの文脈をすべて知っているようなモデルは、もうそれほど遠くありません。そのモデルは、あなたのことを知っている。あなたの人生を知っている。何をしているかを知っている。何を大事にしているかを知っている。あなたの人生にいる人たちのことも知っている。もちろん、あなたが望む形で、望む範囲においてですが、あなたのコンピュータやブラウザにもアクセスできる。そして時間がたつにつれて、現実世界であなたの周囲に起きていることにも、ますますアクセスするようになるかもしれません。 それは、コンピュータを使う感覚、そしてAIを使う感覚そのものを、完全に変えてしまうはずです。私はそれに強く興奮しています。ただ、実際それがどんな感覚になるのかは、私たち自身でさえ、まだ十分に直感できていないと思います」 グレッグ・ブロックマン「まさにその点ですが、今の私たちは、チャットでも何でも、使っているツールに対して『何が起きているのか』を説明するのに、ものすごく多くの時間を使っています。そしてそれがどれだけ苛立たしいかを考えてみてください。まるで同僚に対して、いや、私が欲しいのはこういうことで、今こういう状況なんだ、と延々説明し続けているようなものです。今のシステムの振る舞い方は、本来こうあってほしい姿ではないのです」

Tsubame

15,287 просмотров • 2 месяцев назад

今起きている変化について、お伝えします。 最近、海外動画の日本語字幕が減り、 代わりに吹き替え動画が増えていることに 気づいている方も多いと思います。 これは偶然ではありません。 理由はシンプルで、字幕を「自動で、安全に、商売として」成立させるのが、 今の環境では極端に難しくなっているからです。 かつて主流だった字幕編集は、 魔法のような技術ではありませんでした。 実際に行われていたのは、音声を文字に起こし、意味ごとに文章をまとめ、 人が読める速度になるよう表示時間を調整し、日本語として破綻しない形に整える。 この一連の作業です。 重要なのは、これを支えていたのは AIの性能そのものではなく、字幕のルール設計と、人間の判断でした。 ところが、政治や国際情勢を含む翻訳字幕は、少しの誤解や言い回しの違いで、抗議やトラブルに直結します。 企業として運営する場合、そのリスクは年々大きくなり、利益よりも負担が上回っていきます。 結果として、字幕を減らし、 意味を単純化できる吹き替えに移行する。 これが今、多くの場面で起きている流れです。 一方で、個人の発信者は違います。 個人は、表現も解釈も自己責任で行える。速さと柔軟性を優先できる。 音声を文字にし、文章を整え、表示の仕方を工夫する。 この作業は、個人の環境でも十分に再現できるようになりました。 だから今、字幕は消えているように見えて、実は 形を変えて、個人の手に戻ってきている。 そういう段階に入っています。 字幕が減っているのは、技術が退化したからではありません。 字幕を扱う主体が、企業から個人へ移っている。 その結果として、吹き替えが増え、 字幕は「分かる人の武器」になりつつある。 いま起きているのは、そういう変化です。

トッポ

38,291 просмотров • 5 месяцев назад

大学が語りたがらない未来ほど、たぶん実現が早い。AIチューターは「その子が何を分かっていないか」を逐次推定し、説明をリアルタイムで作り替える。教科書の一方向性ではなく、対話が教育のデフォルトになる。退屈な研修動画が「過去の遺物」になるのは、案外すぐかもしれない。 ジェフリー・ヒントン「大学は私がこれを話すのを好みませんが、AIは人を指導すること、つまりチュータリングがずっと得意になるでしょう。 私たちはすでに、子どもに個別指導の先生をつけると、教室で学ぶよりも学習がだいたい2倍速くなることを知っています。それは、個別指導の先生が『その子が何を分かっていないのか』を理解し、その子の理解度に合わせて説明を調整できるからです。AIはそれをさらにうまくできるはずです。 なぜならAIは、学習のために何百万人もの子どもとの経験を積めるからです。これは今後10年くらいで実現してくるでしょう。まだそこまで到達していませんが、確実に向かっています。そうなれば、多くのレベルで教育が大きく良くなります。 最後に影響が出るのは博士課程の学生の教育だと思います。そこはより徒弟制度に近いからです。それは事実を教えるというより、進め方やアプローチを教えるものですが、最終的にはそこにも波及していくでしょう」

Tsubame

28,261 просмотров • 6 месяцев назад

【今年の制作を振り返る④】 7月制作:Nullbeat Midjourneyの[sref]を使用して作ったMVです。 (スタイルのあるアーティスティックな映像を作るなら、今だにこの方法が一番ですね!) テーマは「ドラッグと夢」です 【制作フロー】 いつもChatGPTにプロンプトを書いてもらってるんですが、この時は「お前は倒錯して頭がおかしくなっている」(ホントはもっと色々言った!)と洗脳してプロンプトを吐き出させ続けました。 曲も同じ感じで洗脳して作り、歌詞も脱構築を重ねて意味が残らないようにしてます。(Nullです。) 画像・動画生成はMidjourneyオンリーです。 srefを固定して、さまざまな異常性のあるカットをガンガン作っていきました。 動画化はほぼAuto。たぶん画像生成時のプロンプトが動画化でも直接反映されるので、下手に指定するより動きが良くなるんですよね。 このMVは1日で制作したんですが、AI映像って、ハマるフローができると本当にスピードが出ます。 この時も洗脳したChatGPTがめちゃくちゃいい画像プロンプトどんどん出してくれるようになったタイミングがあって、そこから一気に完成までいきました。 (まあ、それを見つけるのが大変なんですが) (--sref 4080214805)

tapehead.lab

88,614 просмотров • 6 месяцев назад