Video wird geladen...
Video konnte nicht geladen werden
OpenAIの新しい音声「Openai. fm」の精度が高い、抑揚、感情も日本語でも一級品。好きな文章を読み上げてmp.3でDLも可能。Youtubeやショート動画のアフレコに使える。声のトーンもプロンプトで自由に変更可能。面白いので是非試してほしい。しかも無料。使い方↓
94,118 Aufrufe • vor 1 Jahr •via X (Twitter)
3 Kommentare

VoiceとVibeを選択して、好きなスクリプトを貼って、再生ボタンを押せばOKです。

======================= 【OpenAIのオーディオと音声機能の概要】 ======================= OpenAI APIでは、さまざまなオーディオ機能が提供されています。これらの機能を使うことで、音声エージェントの構築、音声のテキスト変換、テキストの音声変換などが可能になります。 ======================= 【主な用途】 ======================= OpenAI APIでは、以下のような主要なオーディオ用途があります: ● 音声エージェント → 音声を理解してタスクを処理し、自然言語で応答します → speech-to-speechモデルとRealtime APIを使用する方法と、speech-to-text、テキスト言語モデル、text-to-speechを連携させる方法があります ● リアルタイム音声 → Realtime APIを使用して、リアルタイムで音声を処理します ● テキスト読み上げ(TTS) → Audio APIの`audio/speech`エンドポイントを使用します → 対応モデル:【gpt-4o-mini-tts】、【tts-1】、【tts-1-hd】 ● 音声認識(STT) → Audio APIの`audio/transcriptions`エンドポイントを使用します → 対応モデル:【gpt-4o-transcribe】、【gpt-4o-mini-transcribe】、【whisper-1】 ======================= 【最適なAPIの選択方法】 ======================= OpenAIには音声処理のための複数のAPIがあります: ● 汎用API → Realtime APIとChat Completions APIは、音声理解と生成に加え、function callingなどの他の機能と組み合わせることができます ● 専用API → Transcription、Translation、Speech APIは特定の目的のみに特化しています 選択方法としては: ・リアルタイムの対話や文字起こしが必要な場合 :【Realtime API】を使用 ・リアルタイム不要だが音声エージェント等が必要な場合:【Chat Completions API】を使用 ・特定の目的のみの場合 :専用APIを使用 ======================= 【既存アプリケーションへの音声機能の追加】 ======================= GPT-4oやGPT-4o miniなどのモデルはマルチモーダルであり、複数の入出力形式を理解・生成できます。既存のテキストベースのLLMアプリケーションに音声機能を追加したい場合は、`modalities`配列に`audio`を含め、`gpt-4o-audio-preview`などの音声対応モデルを使用します。 ======================= 【新しい音声モデル】 ======================= OpenAIは最近、以下の新しい最先端の音声モデルをAPIで公開しました: ● 2つの新しい音声認識(STT)モデル → Whisperよりも性能が向上 ● 新しいTTSモデル → 話し方を指示できる機能付き ● Agents SDK → 音声をサポートするようになり、音声エージェントの構築が容易に

What REAL customers say about TurboScribe's unlimited AI transcription 👇 🇺🇸 "Not only does it transcribe with amazing accuracy, it also filters out a ton of the unnecessary noise associated with pauses in audio. Keep up the great work!" - Kevin
