
nicekate
@nicekate8888 • 11,635 subscribers
AI and tech aficionado, keen on radios and e-readers. 🌐 https://t.co/aW55vLd67a
Videos

Codex 的 Computer Use 真好用 我让它操作了我自己做的 APP 批量生图 全程在后台,我在前台该干嘛干嘛 比 Claude Computer Use 聪明太多 完整视频:🧵
nicekate25,600 views • 1 month ago

Cursor / Windsurf + Android Studio 高效AI编程:零基础也能开发安卓应用 视频亮点: 双工具对比:解析 Cursor 和 Windsurf 各自优势 实战案例:从五子棋到卡路里计算AI应用的完整开发过程 专业部署:Android Studio 配置与构建技巧 时间戳: 0:00 - 引言 0:26 - 我开发的应用演示 2:33 - React Native Expo VS Android Studio 3:21 - Android Studio安装要求 4:06 - Android Studio基础使用 5:31 - 用Cursor生成五子棋游戏 6:53 - Android Studio无线调试 7:40 - 用Cursor开发幻灯片页面 8:42 - 用Windsurf 开发卡路里计算AI应用 17:13 - Android Studio图标设置、生成APK 17:57 - 对比总结
nicekate102,398 views • 1 year ago

微软新出的 VibeVoice-Large(7B)声音克隆效果是真不错,非常大的亮点是生成的语音时长最长 45 分钟,如果是 VibeVoice-1.5B,最长 90 分钟,但我对比了下,1.5 B 生成效果还是要差些 之前用过的一些开源克隆模型最大问题是超过30秒就变样,今天用 VibeVoice-Large 感觉真不错 下面的视频是我的声音克隆效果(和我本人声音很像),Mac 上 ComfyUI 运行 VibeVoice-Large,运行了 24分钟,生成了 1分19秒的音频 VibeVoice-1.5B ,17秒视频生成花了 5分钟 VibeVoice-Large,17秒视频生成花了 12分钟 如果用英伟达的 Win电脑,应该会快很多 显存建议: 1.5B 约需 8 GB VRAM 7B/Large 类约 16 GB VRAM 我使用的仓库见🧵
nicekate48,748 views • 9 months ago

我的声音被克隆了?效果惊人 | F5 TTS语音合成模型体验和本地部署全流程 最近超火的F5 TTS语音合成模型,据说效果惊艳,而且完全开源,还能在消费级设备上运行,今天就带大家一起体验一下这个神奇的AI工具。 我会用自己的声音进行克隆,看看效果如何,还会分享如何在Hugging Face和本地运行F5 TTS模型,包括安装教程和一些实用技巧。 时间戳 0:00 - F5 TTS简介 0:42 - Demo演示:使用我的声音进行克隆 3:05 - F5 vs E2:模型对比和技术解读 4:32 - 本地部署详细演示 6:51 - F5 vs E2 生成效果对比
nicekate73,650 views • 1 year ago

零基础教程:用Cursor和Gemini API打造你的第一个Chrome插件 今天我要和大家分享如何用Cursor和Gemini API制作一个Chrome浏览器插件,用来总结网页内容。 在视频中,我从头到尾演示了整个过程,包括获取API密钥、用Cursor写代码、调试插件功能,以及选择合适的Gemini模型版本。 我还介绍了一些实用技巧,比如从GitHub获取cookbook和使用AI Studio。 时间戳: 00:00 - 介绍我用Cursor制作的几个Chrome插件用法 08:08 - 演示如何获取Gemini API密钥 12:33 - 开始使用Cursor编写插件代码 16:16 - 调试和修改插件功能 20:29 - 讨论从GitHub获取cookbook和使用AI Studio 21:16 - 解释Gemini模型版本的选择和使用 22:12 - 视频总结和结束语
nicekate65,732 views • 1 year ago

开源 | 基于 DeepSeek、Kokoro TTS 与 Replicate 的多功能内容 AI 创作应用:故事、播客、图像、音频一站式生成 简介: 在本期视频中,我详细演示了一个整合 DeepSeek、Kokoro TTS 以及 Replicate 的多功能内容创作应用。 该应用我已开源,它可以一键生成故事、播客脚本并支持语音合成,还可通过 Replicate 进行图像创作。 我还分享了如何根据角色或场景灵活选择不同的声音和微调图像,以及如何在浏览器开发者工具和 Replicate 后台进行调试和错误排查。 无论你是想快速生成多角色故事、播客脚本,还是想尝试个性化图像生成,本视频都能为你提供实用的思路与示例。 时间戳: 0:00 - 项目开源和简介 0:53 - 应用演示 7:30 - Kokoro js 介绍 8:24 - Replicate API 调用说明 10:10 - Replicate 图片模型微调介绍 11:40 - 浏览器开发者工具调试 14:44 - 应用提示词解读 17:04 - 要点总结
nicekate39,492 views • 1 year ago

Cursor 0.43 全新升级!两个实战案例深度解析 Agent 功能 Cursor 于昨日发布了 0.43 版本,带来了全新的 Composer 界面、Agent 功能以及 Bug 查找器等一系列更新。 在本期视频中,我将通过 Next.js 应用开发和 iOS 应用开发这两个实例,深入探讨 0.43 版本的各项新特性。内容包括 Agent 功能的实际使用演示、与 Windsurf 中 Cascade 的对比,以及新版本的一些不足之处。 时间戳: 0:00 - Cursor 0.43 版本更新内容 3:40 - Cursor 论坛 3:55 - Cursor 设置 5:50 - 使用 Agent 功能开发 Next.js 应用 8:41 - Cursor 新版本缺点 9:06 - 使用 Agent 功能开发 iOS 应用
nicekate25,151 views • 1 year ago

全面解读 Gemini 2.0 Flash:实时音视频对话,教我编程、剪视频 | 智能桌面协同,实时互动教学 | 原生多模态升级,每日 1500 次免费调用 这次谷歌放大招,发布了比1.5 Pro更强大的模型,响应速度翻倍。 最令人惊艳的是实时音视频对话功能,就像科幻电影照进现实。 本期视频将带你深入了解Gemini 2.0 Flash的各项新特性、技术突破、实际应用演示,以及与1.5 Pro的性能对比,更有Project Astra、Project Mariner等前沿项目解读。 从代码生成到游戏辅助,从图片生成到深度研究,Gemini 展现了无限可能。 🕐 时间戳: 00:00 Gemini 2.0 Flash 整体介绍与性能提升 02:27 实时音视频对话功能演示 11:03 Gemini 教我们打游戏 11:18 Project Astra、Project Mariner 介绍 12:39 图像生成与编辑功能演示 13:19 谷歌代码执行原生工具使用演示 14:33 数据分析代理介绍 15:12 Deep Research 介绍 16:04 编程工具 Jules
nicekate23,645 views • 1 year ago

Claude高级玩法:MCP多工具组合,自动化工作流搭建指南 | GitHub、SQLite、Fetch、Filesystem等 在本期视频中,我介绍了多个MCP工具的实际使用案例。我们一起来看如何将GitHub、SQLite、Fetch等工具高效集成到项目中,探索它们的强大功能和实际应用场景。 时间戳: 0:00 - MCP 快速入门 & 工具配置 3:59 - Fetch实战:网页内容抓取 & 多风格内容生成 5:20 - SQLite和Claude集成:100M+大数据分析 7:34 - GitHub集成:自动搜索 & 代码仓库管理 9:10 - CSV数据分析脚本创建 11:15 - 多工具协同:Puppeteer+GitHub自动化工作流
nicekate23,921 views • 1 year ago

WindSurf + DeepSeek 打造 AI 智能闪卡:从界面设计到功能实现全流程演示 | 开源分享 在本视频中,我将详细演示如何利用 WindSurf、DeepSeek API、Tldraw 等工具,从零开始打造一款 AI 智能闪卡应用。 视频内容涵盖闪卡的生成、标记、复习等核心功能,以及数据库本地存储和自定义内容导入等实用特性。 我还分享了如何使用 Shadcn UI 快速搭建前端界面,并结合代码块高亮与 Markdown 渲染技术,最终呈现出一个易维护的智能闪卡应用。 时间戳 0:00 - 开场介绍与演示效果 3:41 - 开源信息 3:47 - Tldraw 快速创作页面 5:16 - 和 Windsurf 开始对话 5:48 - Shadcn CLI 使用 6:33 - 功能界面迭代 9:09 - 和 Windsurf 沟通详情 11:35 - 总结
nicekate22,560 views • 1 year ago

详解 Kokoro TTS :82M 参数的高效文本转语音 | 附本地部署教程 本期视频带你深入了解一款紧凑高效的开源 TTS 项目——Kokoro TTS。 它仅有 8200 万参数,却能在 CPU 上实现近乎实时的语音生成,GPU 端速度更可飙升至 50 倍实时。 视频中,我将演示如何混合 2 种声音,生成长篇文本的实际语音效果;并分享在本地安装与使用 Kokoro TTS 的经验,以及如何在 Hugging Face 或 Google Colab 上快速上手。 适用于 AI 语音助手、有声读物、角色配音等多种场景,欢迎感兴趣的朋友一起探索! 时间戳: 0:00 Kokoro TTS 核心技术与参数特点 2:12 Hugging Face 平台功能演示 4:17 nicole 声音系统与混音技术 5:11 本地化部署指南与问题排查 9:40 实际应用效果与性能评测
nicekate20,292 views • 1 year ago