正在加载视频...

视频加载失败

Aqua Voiceはもう不要!?Gensparkの音声入力ツール『Speakly』がすごい! ✅マイク音声から簡単に文字起こし ✅辞書登録も可能 ✅カスタム指示でプロンプトも仕込める ✅Genspark以外にも使える ✅今なら無料で使える 🎁導入マニュアル配布中です! 👇👇 Speakly(スピークリー)は、Gensparkが新しくリリースした 音声入力特化のデスクトップアプリ です。 単なる「音声→文字起こし」ではなく、 ・音声入力 ・フィラー(えー、あのー等)の自動除去 ・入力内容をそのままAIエージェントに投げる ・他アプリ上でも使えるOS常駐型 という、“AI前提の音声入力ツール” になっています。 位置づけとしては、 ・音声入力 × ・AIエージェント × ・Gensparkワークスペース連携 をまとめて使えるツール、という感じです。 超便利なので使ってみてくださいね✨ 🎁導入マニュアルが欲しい人は ①いいね ②リプで『ス』からはじまる言葉

11,973 次观看 • 4 个月前 •via X (Twitter)

0 条评论

暂无评论

原始帖子的评论将显示在这里

相关视频

「すごいプロンプト1発ですべて解決する」という幻想に対して、かなり重要な現実論が語られている。現場では、入力も出力も何度も修正し、文脈を足し、確認しながら前に進む。AI革命の核心は魔法の呪文ではなく、反復と文脈とUXにある。ここを押さえている議論は強い。 マイク・キャノン=ブルックス「Xを見れば、『この魔法のようなプロンプトを貼り付けるだけで、一人で10億ドル企業を動かせる』みたいな話がいくらでも出てきます。ですが、それはかなり馬鹿げています。現実には、データ面でもかなり反復が必要です。ワンショットは確かに有用ですが、実際には出力も入力も何度も編集し直すことが多いのです。 たとえば『宿題のエッセイを書いて』と言えば、AIはエッセイを返してきますが、『いや、違う、歴史の授業なんだ』と言うと、『分かりました、ではエッセイを出します』と返ってくる。つまり、実際には入力自体を変えているわけです。ある意味、これはチャットによる反復です。ですが、画像編集をチャットで何度もやったことがあるなら分かると思いますが、あれは非常にフラストレーションがたまります。『いや、変えてほしくなかった部分まで変わってしまった』となるからです。つまり、入力の設計と体験に問題がある。その一部は、適切な量のコンテキストをどう持たせるかという問題であり、さらに出力と反復の問題もあります」

Tsubame

18,758 次观看 • 3 个月前

【販売開始】あなたの"文字起こし"の常識を 今日で終わりにします。 ◤ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 手作業の文字起こしから解放され AI活用の質を劇的に向上させる 『文字起こしブースターパック』 ____________◢ 【10月14日(月) 23:59まで】の期間限定で 特別な価格でご提供します。 「文字起こしに疲弊している!」 「AIをもっと本気で活用したい!」という人は この機会を逃さないでください。 今回お届けするのは 単純に「文字起こしが楽になる」という話では ありません。 ✅これまで誰もが諦めていた 「UTAGE内の動画文字起こし」 ✅画像だらけのLPも URL入力だけで丸ごとテキスト化 ✅1時間半の音声も わずか数分・約9.5円で完了 ✅競合YouTubeチャンネルの サムネ、台本複数取得 など、ビジネスや学習の "一次情報"を、AIが最も得意な 「テキストデータ」に変換することに特化した 実践的なツール群です。 見てもらった方が早いので 実際の動作デモ動画を添付しました。 ・1時間半の音声が、数分で完了する処理速度 ・誰もが諦めていたUTAGE動画やLPの画像文字も抽出可能 ・複雑な設定不要のWebツールで、誰でもすぐに使える このレベルの環境を 全くの未経験からでも構築できるのが 今回の『文字起こしブースターパック』です。 生まれた時間で創造的な仕事に集中したり ライバルが持っていない「テキストデータ」という 最強の武器を手にしたり。 「〇〇さんの分析、いつも深いですね」 「どうやってそんなに早く情報まとめてるんですか?」 大量の情報を的確に処理し 質の高いアウトプットを生み出す。 それが、AI時代の新しいビジネスの進め方です。 もちろん、言いたいことは分かります。 🙅‍♀️設定が難しそう 🙅‍♀️自分にも使えるか不安 実は、そんな人ほど、このパックが役立ちます。 普段ChatGPTに指示をするのと同じ感覚で APIキーを貼り付けるだけで 誰でもすぐに使えるのが、このツールの特徴です。 事実、このツールを活用している弊社スタッフは PCが得意でなくても これまで半日かかっていた 議事録作成をわずか10分で終えています。 特別なことは一切していません。 ただ、適切なツールと手順を知っただけです。 未知のツールだから難しそうに感じるだけで 必要なのは.... あなたの「もっと効率化したい」という想いだけ。 ——————————— ✅会議後、議事録作成で残業するのが当たり前になっている。 ✅有益なセミナー動画も、見るだけで満足して活用できていない。 ✅競合LPの分析も、結局は手作業で非効率だと感じている。 ✅インプットはしているのに、アウトプットに繋がっていない感覚がある。 ——————————— 他の人が手作業で消耗している 「文字起こし」の時間が あなただけの「戦略立案」の時間に変わります。 AIに与える"原石"の質と量を劇的に向上させ AIの出力レベルを根底から 引き上げる方法をお渡しします。 さらに今回、『文字起こしブースターパック』のリリースを記念して、3つの豪華な限定特典をご用意しました。 ▼ ▼ ▼ ▼ ▼ 【特典1】 資産を築くナレッジ化プロンプト術 テキストを真の「宝」に変えるための秘伝のコツ 【特典2】 noteリサーチツールの作り方講座 文字起こしツールで得た知見を応用し、リサーチツールを自作するノウハウ 【特典3】 購入者限定の公式LINEにご招待 最新情報の案内や、使い方・Q&Aセミナーも実施予定 ▲ ▲ ▲ ▲ ▲ 面倒な文字起こしから解放され AI活用のレベルを一段階上げたい人は 今すぐ「リプ欄のリンク」から 詳細を確認してください。 この特別価格でご案内できるのは 【10月14日(月) 23時59分】までです。 以降は通常価格、 または各ツール毎の単品販売となります。 ご了承ください。

てる@AIエージェントマフィア

161,495 次观看 • 7 个月前

最近、YouTubeのコメント欄に「某声優さんにそっくり」「AIだろ」「訴えられろ」みたいなコメントが急増しています。 親父譲りの声でお話しているだけなのですが…せっかくなので、声の類似性について音声学的な話を少し。 人間の声は、声帯で作られるピッチと、声道(喉・口腔・鼻腔)の形状で決まる共鳴特性によって成り立っています。 声道の長さ・形状は、身長や骨格と強く関係しており、個人差も大きい。 ですが80億人もいるので、色々な条件の組み合わせの中で「似た声」が出てくるのは、生物学的に自然な現象です。 顔の「そっくりさん」がいるのと同じ理屈です。 むしろ、顔は似せるために極めて多くの条件が同時に一致する必要がある一方で、声は連続的な変数が多く、完全に一致しなくても「似た音色」として聞こえやすいのです。 つまり、「声の出力(聞こえ方)」が似る確率は、「顔が似る」確率より高い傾向があるということです。 実際、法廷音声鑑定の分野では、声は指紋ほど完全にユニークではなく、似た声の誤認リスクは常に議論されています。 特に双子研究では声の類似性が非常に高いケースが多く報告されています。 つまり「似てる声」は普通に「あるある」なのです。 僕の場合は、完全に親父と瓜二つの声であって、誰かの声を学習させたAIでも声真似でもありません。 (ちなみに副鼻腔炎になりやすい鼻腔なので、似てる人は副鼻腔炎持ち率が高いかも…?) ということで、これを読んだ人は「似てる声」は「顔が似てる」と同様に、ただのあるあるなんだということを、新しい知見として認識してもらえると良いなと思います。 そして、誤解している人を見かけたら「違いますよ」と指摘していただけますと幸いです。 ※ただし、これは自然に生まれた声の話です。 特定の声優の声をAIに無断で学習させて、収益化するのは全く別問題です。 おそらく最新の分析技術であれば、生声か学習かくらい判別できそうですが、どうなんでしょう??🧐

神のみぞ知る

19,510 次观看 • 12 天前

✨AI音声で一貫した声を作り会話させるチャレンジ 前に音声を使ってLLMの文章を読ませることには成功していたけど、今回はオリジナルの声を作成してみました。 やったこと: ①まずQwen3-TTSで声を1個作る ②その声で171個量産(台詞バリエーション) ③Style-Bert-VITS2で学習 → 50分でカスタム音声モデル完成 ④UIに接続 → リアルタイムで喋る やばい!自分で作った声だと楽しい😊 苦労したところ: ・最初はブラウザ内TTS(Chatterbox)を試した → 1文30秒&英語のみでまだ難しいしそもそもこの用途が厳しいかも💦 ・SBV2に切り替えたら環境構築に手間取ったけどうまくいった ・ただライセンスは要注意。やる場合は先にライセンス確認を。用途によっては制限があるものもある📝 まだまだ色々あるけど、今後のことを考えるとNVIDIAからも良い音声AIが出てるし、対応できるようにしておきたい。 今回は前回と同じくモデルはGPT-OSS 20Bだけど、Ollamaから読んでるので早い。 WebGPUでこれぐらい出たら嬉しいけどなー🥰 とはいえローカルでここまでできるようになったのは嬉しい。データは一切外に出ないしね。 声の元はAI生成だから、「存在しない人の声」をAIが学習して、AIキャラが喋る。 #AI #TTS

LUTA@AI

57,505 次观看 • 3 个月前