Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

🤯🤯🤯 Music generated by finetuning Stable Diffusion on spectograms then generating any song possible

429,245 görüntüleme • 3 yıl önce •via X (Twitter)

37 Yorum

@levelsio profil fotoğrafı
@levelsio3 yıl önce

I could see LO FI be the first genre to be completely taken over by AI beats (LO FAI?), it's relatively simple, predictable and barely any vocals, could make a 24/7 livestream of perpetually generated LO FAI:

Solar Heavy profil fotoğrafı
Solar Heavy2 yıl önce

Driving Music by Solar Heavy

Banana profil fotoğrafı
Banana3 yıl önce

here is a colab notebook for anybody that wants to play with Riffusion: if you want a custom deployment for yourself, run it on Banana 🍌 with this:

Seth Forsgren profil fotoğrafı
Seth Forsgren3 yıl önce

Thank you @levelsio! My friend and I built Riffusion over the past few months and I was literally going to reach out to you directly to get your thoughts today--then someone found it and posted to hackernews this morning 😅

Pete Callaghan profil fotoğrafı
Pete Callaghan3 yıl önce

Music industry is getting hammered with terrible AI music right now. This is interesting

@levelsio profil fotoğrafı
@levelsio3 yıl önce

What u mean?

Rodrigo Rocco 👨‍💻📈📗 from JobBoardSearch 🔎 profil fotoğrafı
Rodrigo Rocco 👨‍💻📈📗 from JobBoardSearch 🔎3 yıl önce

Levels from Nomad guru to AI guru 😀

@levelsio profil fotoğrafı
@levelsio3 yıl önce

I am just the messenger 😂

@photos profil fotoğrafı
@photos3 yıl önce

The artificial vocalization is amazing. AI creating new languages. eminem style anger rap :

Marco D'Alia profil fotoğrafı
Marco D'Alia3 yıl önce

OMG!! 🤯🤯 I wonder if finetuning GPT-3 for MIDI would work

marcelo profil fotoğrafı
marcelo3 yıl önce

I had read about using computer vision to recognize audio waves years ago and completely forgot about it. The idea is so simple yet so effective. Awesome use case.

nicky profil fotoğrafı
nicky3 yıl önce

as resolutions improve, quality of spectograph-generated music will too. but in the meantime, can plug this into something like NU-Wave or another audio upsampling model and improve outputs.

S C profil fotoğrafı
S C3 yıl önce

This already worked pretty well some time ago with stuff like SinGAN to perform "AI resampling". I know of at least one recent work that uses spectrograms: Problem is lack of phase. I guess this project uses Griffin-Lim but Griffin-Lim is crap.

Spaces for macOS  profil fotoğrafı
Spaces for macOS 3 yıl önce

Music industry gonna sue it 😬

Ludwig Wittgenstein profil fotoğrafı
Ludwig Wittgenstein3 yıl önce

@jamespoulos Humanity might not be able to handle this kind of thing when it gets really good. Will mankind rise up and smash?

Alex profil fotoğrafı
Alex3 yıl önce

Wild

rudy@FURE.Cab 🌐 - e/acc profil fotoğrafı
[email protected] 🌐 - e/acc3 yıl önce

@djtoddterry peep this.

Peggy Wang profil fotoğrafı
Peggy Wang3 yıl önce

@acwangpython

Micah Bratt profil fotoğrafı
Micah Bratt3 yıl önce

It’s like the music version of a deffusion image with the hand coming out of the head or 3 hands. It’s like it kind of sounds like something but doesn’t make sense at the same time.

Dominic St-Laurent profil fotoğrafı
Dominic St-Laurent3 yıl önce

Such a clever way to generate music!

Joyful profil fotoğrafı
Joyful3 yıl önce

Dude, you're on fire with #ai rn.

Matt profil fotoğrafı
Matt3 yıl önce

…but can it do screamo?

videz🧪 profil fotoğrafı
videz🧪3 yıl önce

@Cephii1 How many industries still need humans in the next 5-10 years?

Thibaut Patel ☀️ profil fotoğrafı
Thibaut Patel ☀️3 yıl önce

Next up: AI talking head with AI music background ? 😉

Robbin LóClar 👑 (kween/acc)👓 profil fotoğrafı
Robbin LóClar 👑 (kween/acc)👓3 yıl önce

@Cephii1 A buddy showed this to me about a few days ago. I was like...If you can see Ai and hear AI ..it's a whole other world.

Wil profil fotoğrafı
Wil3 yıl önce

Is it capable of like, making music clips that follow conventional measures, and sound "not shit"? This is utter arse.

RΞNZO profil fotoğrafı
RΞNZO3 yıl önce

What do you think @akirathedon ?

Raunak Chowdhuri profil fotoğrafı
Raunak Chowdhuri3 yıl önce

@drscotthawley how does this compare to what you all have been building at @harmonai_org? If fine tuning image methods can achieve results this good - I can’t wait for specialized audio models!

jett profil fotoğrafı
jett3 yıl önce

One of the most creative applications for SD I’ve seen

afox 🦊 profil fotoğrafı
afox 🦊3 yıl önce

I love how much AI is going to change things in the next decade, its really exciting

N:ko profil fotoğrafı
N:ko3 yıl önce

AI generated music has no soul man...

@levelsio profil fotoğrafı
@levelsio3 yıl önce

Wait till it gets a soul

Alip Hamjah profil fotoğrafı
Alip Hamjah3 yıl önce

giliran musisi di senggol @fachrezamuslim @alhamdvlillove

rishav profil fotoğrafı
rishav3 yıl önce

Shitty. Doesn't recognise the text at all. Playing random things

Krzysztof profil fotoğrafı
Krzysztof3 yıl önce

It is uuuuugly as hell

Sid B profil fotoğrafı
Sid B3 yıl önce

Brilliant application and innovation... Opens up a world of possibilities!

Rolf profil fotoğrafı
Rolf3 yıl önce

It even loops! This is amazing!

Benzer Videolar