#工程师工具 看到一个在线文字转语音的工具「TTSMaker」,提供语音合成服务,支持多种语言以及各种风格,可以用它朗读文本或者合成视频声音,可完全免费用于商业场景,弄好后直接下载文件,普通用户每周限制 20000 个字符使用,基本够用。 🤖

Tw93's profile picture

Tw93

105,715 görüntüleme • 3 yıl önce

又发现 GitHub 上一款开源强大的文本转语音工具:Abogen。 能快速将 ePub、PDF 或文本文件转换成高质量音频,并生成匹配的字幕。 GitHub: 主要特性: -...

GitHubDaily's profile picture

GitHubDaily

31,126 görüntüleme • 10 ay önce

阿里刚刚开源了TTS:Fun-CosyVoice3 0.5B,zero-shot音色克隆,可本地部署 还开源了款ASR【Fun-ASR-Nano 0.8B】,Fun-ASR的轻量化版本,推理成本更低,可以本地及定制化微调 另外,Fun-CosyVoice3模型做了升级,首包延迟比之前降低了50%,WER降低了56.4%,复杂场景字符错误率降低了26% 支持9种通用语言、18种中文方言、9种情感控制,可以跨语种音色复刻,比如说,用一段普通话录音可生成粤语、日语、英语等 支持双向流式合成,“输入即发声”,这个适用于语音助手、直播配音、无障碍阅读等等实时场景 Fun-ASR也升级了,噪声场景下准确率到了93%,新增歌词与说唱识别能力,支持31种语言自由混说无需预先指定语种 覆盖7大方言和26种地方口音,流式识别模型的首字延迟降低到了160ms...

AIGCLINK's profile picture

AIGCLINK

35,020 görüntüleme • 6 ay önce

#工程师工具 推荐一个很不错的学英语的扩展「Trancy」,产品做的很精致易用,在你看 Youtube 的时候想看双语可一键切换,阅读模式可以直接深度理解内容,支持收藏将之前沉淀的视频句子来复习,结合 OpenAi 的能力练习各场景的对话,提供各种 ChatGPT 的能力,可以玩玩看。

Tw93's profile picture

Tw93

149,158 görüntüleme • 3 yıl önce

Glarity 插件 - 基于 ChatGPT 和 YouTube 字幕生成视频摘要 不得不说,这个插件实在是太强了,可以提前预定我的年度插件之选了😆...

千寻 🌸's profile picture

千寻 🌸

47,273 görüntüleme • 3 yıl önce

这个不错,原生 macOS 视频下载工具,在一个应用内完成视频下载、裁剪和管理,背后跑的是 yt-dlp。 粘贴链接,一个 Spotlight 风格的小窗口弹出来,点一下就开始下载。下载完自动转成通用 MP4、复制到剪贴板、存到你选的文件夹,还带缩略图历史。

Geek's profile picture

Geek

62,927 görüntüleme • 1 ay önce

全平台翻墙工具使用教程⬇️ 很适合新手上手那些主流的代理工具,通过图文配合视频,基本上就是手把手喂到你嘴边的那种教程。

知识分享官's profile picture

知识分享官

91,016 görüntüleme • 1 yıl önce

字节、港中文等最新搞了一个专用于人-物交互的端到端视频生成模型:OmniShow,妥妥的电商广告专用模型 全模态,一个模型通吃图+音+姿势+文本输入 任务可以覆盖R2V、RA2V、RP2V、RAP2V四种生成模式,目前应该是唯一一个支持同时用图像+音频+姿势+文本混合输入的 人脸保持、物理合理性、表现力及口型同步看起来效果都还可以 原生长镜头生成,最长可生成10秒连续视频 目前代码还没放出来 #人物视频生成模型 #OmniShow #电商视频生成

AIGCLINK's profile picture

AIGCLINK

22,597 görüntüleme • 2 ay önce

你知道吗?中文是世界使用人数最多的语言。 目前全球1/5人口以中文为母语或第二语言。 它也是联合国的6种正式语文之一。 联合国 #中文日 定在 #谷雨 ,是为了纪念仓颉造字。

联合国教科文组织's profile picture

联合国教科文组织

15,837 görüntüleme • 3 yıl önce

又搞出一个好玩的东西: 任何输入框,输入中文,按快捷键,自动调用LLM翻译成英文替换。 工具用 Keyboard Maestro就可以。 感觉玩法场景,可以拓展很多的样子,LLM什么都能生成啊。 比如,不翻译成英语,重写你的话,换高情商表达? 还有撩妹、客服等各种场景... 😝

向阳乔木's profile picture

向阳乔木

28,666 görüntüleme • 1 yıl önce

有点意思,让 Web 应用有原生应用那样的交互音效,但不用加载音频文件。tiks 是个 Web 音效库,用 Web Audio API...

Geek's profile picture

Geek

22,166 görüntüleme • 1 ay önce

又发现一款跨设备文件分享的开源免费工具:Croc,可以放弃使用网盘或硬盘了。 无需在同一网络下,允许任意两台电脑之间传输文件或文件夹,不限制大小,并提供端到端加密,更安全更快速地分享。 GitHub: 除此之外,还支持多文件传输,以及中断后的断点续传功能。 支持 Windows、Linux 和 macOS 一键安装使用。

GitHubDaily's profile picture

GitHubDaily

53,589 görüntüleme • 1 yıl önce

Skywork 上线了视频 Agent 能力,他们这个流程有意思 你可以从第一个分镜开始,左边生成之后,将生成的视频和音频素材发到右边的视频编辑器里面去进行编辑。 支持使用主流的视频模型和能力,文生、图生、首尾帧都有,另外支持生成音乐和语音。 我用首尾帧做了一条香水广告的演示,还不错。 也上线了一些特效模版,你可以不用管提示词直接复用。 而且会员从昨天(0106)开始会有为期七天的无限使用优惠,只要你是会员就可以一直用。 最近有需求的朋友们可以看看,说不定这几天直接回本了。

歸藏(guizang.ai)'s profile picture

歸藏(guizang.ai)

18,171 görüntüleme • 5 ay önce

5. Thing Translator Thing Translator是一种基于Web的工具,它使用AI实时识别和翻译文本。 🔗

比特傻's profile picture

比特傻

29,204 görüntüleme • 2 yıl önce

Gemini3真的强,一句话模拟生成英语学习视频。 生成一个单页HTML应用,但看起来像播放视频,带字幕和发音,带着我学最高频使用的商务英语单词。

向阳乔木's profile picture

向阳乔木

20,138 görüntüleme • 6 ay önce

在Boss直聘上用中文不能找8小时工作制的工作, 而用英文就可以找到带双休的8小时工作制的好工作了!

芙宁娜娜💙Furinana (王者归来版)'s profile picture

芙宁娜娜💙Furinana (王者归来版)

134,544 görüntüleme • 11 gün önce

7个月21w🙋普通人用 AI 搞钱,收入翻倍! 但 99% 的人不知道如何使用 这里有 8 个AI工具,可以在线...

千寻 🌸's profile picture

千寻 🌸

127,647 görüntüleme • 2 yıl önce

爆赞!! 必须分享,爱死这款由 Jina AI 开发的工具了: 我一直在寻找集成Prompts 优化,GPTs和二次AI开发的工具,今天终于如愿 普通使用者, 用它可以极致优化Prompt(提示词);...

黄赟's profile picture

黄赟

67,322 görüntüleme • 2 yıl önce

🚨 停止为100个AI工具付费。 我找到一个平台可以提供所有工具: ChatGPT、Claude、Midjourney、Gemini — 并排使用。 无费用。无需切换标签。 运作方式如下:👇

桃桃的运营日记📓's profile picture

桃桃的运营日记📓

27,681 görüntüleme • 1 yıl önce

太猛了!谷歌 Gemini 直接塞了一个N8N 进去 ​ 把 Opal 塞到了 Gem...

歸藏(guizang.ai)'s profile picture

歸藏(guizang.ai)

98,693 görüntüleme • 5 ay önce

分享 GitHub 上一款能自动生成 Cursor 高质量的 MDC 规则文件开源工具:MDC Rules Generator。...

GitHubDaily's profile picture

GitHubDaily

28,985 görüntüleme • 1 yıl önce