nicekate's banner

nicekate

@nicekate8888 • 11,818 subscribers

AI and tech aficionado, keen on radios and e-readers. 🌐 https://t.co/aW55vLd67a

Videos

Anya Rossi

sweetdream.ai

SweetDream.ai•Sponsored•Livecam

Watch Anya Live

Anya is streaming live right now! Join her private show and enjoy exclusive content.

Exclusive private shows

1.2k viewers online

Private Show

Join now for exclusive access

Free preview available • Premium content

Blender MCP 项目已经拥有 23K Star，而 GPT 5.6 Sol 正把它再次推上热潮社区热门案例：手绘机器人变成 3D 打印零件、零外部素材生成建筑场景、一句话制作写实蝙蝠…… 但想获得高质量结果，提示词和工作流比“一句话生成”重要得多社区案例、MCP 安装、真实实测都在这期视频👇

Blender MCP 项目已经拥有 23K Star，而 GPT 5.6 Sol 正把它再次推上热潮社区热门案例：手绘机器人变成 3D 打印零件、零外部素材生成建筑场景、一句话制作写实蝙蝠…… 但想获得高质量结果，提示词和工作流比“一句话生成”重要得多社区案例、MCP 安装、真实实测都在这期视频👇

21,887 views • 12 days ago

最近二十天我都在折腾一件事——怎么让 Qwen3.6-27B 在我的 Mac 上跑得又快又好。一开始我用 Unsloth Q5，18 tok/s，风扇呼啦呼啦响。后来换成 MLX 6bit + DFlash，提到 22 tok/s，还是不够快。直到我遇到了 MTPLX 4bit，43 tok/s，质量不错。完整视频：🧵 视频里有完整对比、编码任务实测、写作推理测试，还分享了我和 Grok 一步步搞配置的全过程

最近二十天我都在折腾一件事——怎么让 Qwen3.6-27B 在我的 Mac 上跑得又快又好。一开始我用 Unsloth Q5，18 tok/s，风扇呼啦呼啦响。后来换成 MLX 6bit + DFlash，提到 22 tok/s，还是不够快。直到我遇到了 MTPLX 4bit，43 tok/s，质量不错。完整视频：🧵 视频里有完整对比、编码任务实测、写作推理测试，还分享了我和 Grok 一步步搞配置的全过程

69,623 views • 2 months ago

有观众好奇怎么让 GPT 5.6 Sol 一次提示做出以下成语故事视频关键两个 skill： react-best-practice MiniMax skill（音频生成），MiniMax 有很多内置适合讲故事的音色 AI会挑选合适的音色来讲故事

有观众好奇怎么让 GPT 5.6 Sol 一次提示做出以下成语故事视频关键两个 skill： react-best-practice MiniMax skill（音频生成），MiniMax 有很多内置适合讲故事的音色 AI会挑选合适的音色来讲故事

14,622 views • 15 days ago

我请 Gemini 2.0 Flash 作为英语口语老师 Gemini 2.0 Flash 对音准识别非常敏感，能精准指出我的发音错误。相比之下，ChatGPT 的高级语音模型对我的口语评价通常过于宽松，会说我的发音正确，但不能很好地识别具体问题。前者真正帮你解决问题，后者能给你自信。参考了 Gemini 官方代码，链接在评论

我请 Gemini 2.0 Flash 作为英语口语老师 Gemini 2.0 Flash 对音准识别非常敏感，能精准指出我的发音错误。相比之下，ChatGPT 的高级语音模型对我的口语评价通常过于宽松，会说我的发音正确，但不能很好地识别具体问题。前者真正帮你解决问题，后者能给你自信。参考了 Gemini 官方代码，链接在评论

201,713 views • 1 year ago

Gemini 3.1 Flash TTS 太能打了让我惊喜的点有几个：原生支持多说话人对白、支持 70+ 语言、可以通过自然语言和 Audio Tags 精细控制风格视频里我也放了 6 段不同风格的中文 Demo，包括笑话、悬疑、情绪对话、AI 吐槽和诗意独白完整视频后面还会拆解我是怎么写提示词的，以及怎么借助 Hermes Agent 去理解官方文档，生成音频。完整视频：🧵

Gemini 3.1 Flash TTS 太能打了让我惊喜的点有几个：原生支持多说话人对白、支持 70+ 语言、可以通过自然语言和 Audio Tags 精细控制风格视频里我也放了 6 段不同风格的中文 Demo，包括笑话、悬疑、情绪对话、AI 吐槽和诗意独白完整视频后面还会拆解我是怎么写提示词的，以及怎么借助 Hermes Agent 去理解官方文档，生成音频。完整视频：🧵

33,224 views • 3 months ago

GLM 5.2 实测，对比 GPT 5.5、Opus 4.8 这期我用多个复杂前端任务实测它的表现：国风 3D 书画应用、纤夫拉船、桌面行星仪、耳机网站、动态海报、交通仿真和苏州博物馆 3D 场景结论是： GLM 5.2 审美和传统文化理解很强，思考深度也不错，但速度太慢、API 稳定性是短板完整视频：🧵

GLM 5.2 实测，对比 GPT 5.5、Opus 4.8 这期我用多个复杂前端任务实测它的表现：国风 3D 书画应用、纤夫拉船、桌面行星仪、耳机网站、动态海报、交通仿真和苏州博物馆 3D 场景结论是： GLM 5.2 审美和传统文化理解很强，思考深度也不错，但速度太慢、API 稳定性是短板完整视频：🧵

13,231 views • 1 month ago

Codex 的 Computer Use 真好用我让它操作了我自己做的 APP 批量生图全程在后台，我在前台该干嘛干嘛比 Claude Computer Use 聪明太多完整视频：🧵

Codex 的 Computer Use 真好用我让它操作了我自己做的 APP 批量生图全程在后台，我在前台该干嘛干嘛比 Claude Computer Use 聪明太多完整视频：🧵

25,723 views • 3 months ago

Cursor / Windsurf + Android Studio 高效AI编程：零基础也能开发安卓应用视频亮点：双工具对比：解析 Cursor 和 Windsurf 各自优势实战案例：从五子棋到卡路里计算AI应用的完整开发过程专业部署：Android Studio 配置与构建技巧时间戳： 0:00 - 引言 0:26 - 我开发的应用演示 2:33 - React Native Expo VS Android Studio 3:21 - Android Studio安装要求 4:06 - Android Studio基础使用 5:31 - 用Cursor生成五子棋游戏 6:53 - Android Studio无线调试 7:40 - 用Cursor开发幻灯片页面 8:42 - 用Windsurf 开发卡路里计算AI应用 17:13 - Android Studio图标设置、生成APK 17:57 - 对比总结

Cursor / Windsurf + Android Studio 高效AI编程：零基础也能开发安卓应用视频亮点：双工具对比：解析 Cursor 和 Windsurf 各自优势实战案例：从五子棋到卡路里计算AI应用的完整开发过程专业部署：Android Studio 配置与构建技巧时间戳： 0:00 - 引言 0:26 - 我开发的应用演示 2:33 - React Native Expo VS Android Studio 3:21 - Android Studio安装要求 4:06 - Android Studio基础使用 5:31 - 用Cursor生成五子棋游戏 6:53 - Android Studio无线调试 7:40 - 用Cursor开发幻灯片页面 8:42 - 用Windsurf 开发卡路里计算AI应用 17:13 - Android Studio图标设置、生成APK 17:57 - 对比总结

102,611 views • 1 year ago

微软新出的 VibeVoice-Large（7B）声音克隆效果是真不错，非常大的亮点是生成的语音时长最长 45 分钟，如果是 VibeVoice-1.5B，最长 90 分钟，但我对比了下，1.5 B 生成效果还是要差些之前用过的一些开源克隆模型最大问题是超过30秒就变样，今天用 VibeVoice-Large 感觉真不错下面的视频是我的声音克隆效果（和我本人声音很像），Mac 上 ComfyUI 运行 VibeVoice-Large，运行了 24分钟，生成了 1分19秒的音频 VibeVoice-1.5B ，17秒视频生成花了 5分钟 VibeVoice-Large，17秒视频生成花了 12分钟如果用英伟达的 Win电脑，应该会快很多显存建议： 1.5B 约需 8 GB VRAM 7B/Large 类约 16 GB VRAM 我使用的仓库见🧵

微软新出的 VibeVoice-Large（7B）声音克隆效果是真不错，非常大的亮点是生成的语音时长最长 45 分钟，如果是 VibeVoice-1.5B，最长 90 分钟，但我对比了下，1.5 B 生成效果还是要差些之前用过的一些开源克隆模型最大问题是超过30秒就变样，今天用 VibeVoice-Large 感觉真不错下面的视频是我的声音克隆效果（和我本人声音很像），Mac 上 ComfyUI 运行 VibeVoice-Large，运行了 24分钟，生成了 1分19秒的音频 VibeVoice-1.5B ，17秒视频生成花了 5分钟 VibeVoice-Large，17秒视频生成花了 12分钟如果用英伟达的 Win电脑，应该会快很多显存建议： 1.5B 约需 8 GB VRAM 7B/Large 类约 16 GB VRAM 我使用的仓库见🧵

48,748 views • 10 months ago

我的声音被克隆了？效果惊人 | F5 TTS语音合成模型体验和本地部署全流程最近超火的F5 TTS语音合成模型，据说效果惊艳，而且完全开源，还能在消费级设备上运行，今天就带大家一起体验一下这个神奇的AI工具。我会用自己的声音进行克隆，看看效果如何，还会分享如何在Hugging Face和本地运行F5 TTS模型，包括安装教程和一些实用技巧。时间戳 0:00 - F5 TTS简介 0:42 - Demo演示：使用我的声音进行克隆 3:05 - F5 vs E2：模型对比和技术解读 4:32 - 本地部署详细演示 6:51 - F5 vs E2 生成效果对比

我的声音被克隆了？效果惊人 | F5 TTS语音合成模型体验和本地部署全流程最近超火的F5 TTS语音合成模型，据说效果惊艳，而且完全开源，还能在消费级设备上运行，今天就带大家一起体验一下这个神奇的AI工具。我会用自己的声音进行克隆，看看效果如何，还会分享如何在Hugging Face和本地运行F5 TTS模型，包括安装教程和一些实用技巧。时间戳 0:00 - F5 TTS简介 0:42 - Demo演示：使用我的声音进行克隆 3:05 - F5 vs E2：模型对比和技术解读 4:32 - 本地部署详细演示 6:51 - F5 vs E2 生成效果对比

73,650 views • 1 year ago

零基础教程：用Cursor和Gemini API打造你的第一个Chrome插件今天我要和大家分享如何用Cursor和Gemini API制作一个Chrome浏览器插件，用来总结网页内容。在视频中，我从头到尾演示了整个过程，包括获取API密钥、用Cursor写代码、调试插件功能，以及选择合适的Gemini模型版本。我还介绍了一些实用技巧，比如从GitHub获取cookbook和使用AI Studio。时间戳： 00:00 - 介绍我用Cursor制作的几个Chrome插件用法 08:08 - 演示如何获取Gemini API密钥 12:33 - 开始使用Cursor编写插件代码 16:16 - 调试和修改插件功能 20:29 - 讨论从GitHub获取cookbook和使用AI Studio 21:16 - 解释Gemini模型版本的选择和使用 22:12 - 视频总结和结束语

零基础教程：用Cursor和Gemini API打造你的第一个Chrome插件今天我要和大家分享如何用Cursor和Gemini API制作一个Chrome浏览器插件，用来总结网页内容。在视频中，我从头到尾演示了整个过程，包括获取API密钥、用Cursor写代码、调试插件功能，以及选择合适的Gemini模型版本。我还介绍了一些实用技巧，比如从GitHub获取cookbook和使用AI Studio。时间戳： 00:00 - 介绍我用Cursor制作的几个Chrome插件用法 08:08 - 演示如何获取Gemini API密钥 12:33 - 开始使用Cursor编写插件代码 16:16 - 调试和修改插件功能 20:29 - 讨论从GitHub获取cookbook和使用AI Studio 21:16 - 解释Gemini模型版本的选择和使用 22:12 - 视频总结和结束语

65,732 views • 1 year ago

开源 | 基于 DeepSeek、Kokoro TTS 与 Replicate 的多功能内容 AI 创作应用：故事、播客、图像、音频一站式生成简介：在本期视频中，我详细演示了一个整合 DeepSeek、Kokoro TTS 以及 Replicate 的多功能内容创作应用。该应用我已开源，它可以一键生成故事、播客脚本并支持语音合成，还可通过 Replicate 进行图像创作。我还分享了如何根据角色或场景灵活选择不同的声音和微调图像，以及如何在浏览器开发者工具和 Replicate 后台进行调试和错误排查。无论你是想快速生成多角色故事、播客脚本，还是想尝试个性化图像生成，本视频都能为你提供实用的思路与示例。时间戳： 0:00 - 项目开源和简介 0:53 - 应用演示 7:30 - Kokoro js 介绍 8:24 - Replicate API 调用说明 10:10 - Replicate 图片模型微调介绍 11:40 - 浏览器开发者工具调试 14:44 - 应用提示词解读 17:04 - 要点总结

开源 | 基于 DeepSeek、Kokoro TTS 与 Replicate 的多功能内容 AI 创作应用：故事、播客、图像、音频一站式生成简介：在本期视频中，我详细演示了一个整合 DeepSeek、Kokoro TTS 以及 Replicate 的多功能内容创作应用。该应用我已开源，它可以一键生成故事、播客脚本并支持语音合成，还可通过 Replicate 进行图像创作。我还分享了如何根据角色或场景灵活选择不同的声音和微调图像，以及如何在浏览器开发者工具和 Replicate 后台进行调试和错误排查。无论你是想快速生成多角色故事、播客脚本，还是想尝试个性化图像生成，本视频都能为你提供实用的思路与示例。时间戳： 0:00 - 项目开源和简介 0:53 - 应用演示 7:30 - Kokoro js 介绍 8:24 - Replicate API 调用说明 10:10 - Replicate 图片模型微调介绍 11:40 - 浏览器开发者工具调试 14:44 - 应用提示词解读 17:04 - 要点总结

39,492 views • 1 year ago

实测 Qwen3-TTS，5 分钟音频，大家看下是否能打？

实测 Qwen3-TTS，5 分钟音频，大家看下是否能打？

15,722 views • 6 months ago

DeepSeek R1 生成幻灯片效果不错，搭配 Roo Cline 一次提示就能生成下面的幻灯片，花费 0.88 元。提示词：「Sam的博文 Reflections 全文」根据以上内容，做一个高质量的中文幻灯片，内容要丰富，排版设计要一流

DeepSeek R1 生成幻灯片效果不错，搭配 Roo Cline 一次提示就能生成下面的幻灯片，花费 0.88 元。提示词：「Sam的博文 Reflections 全文」根据以上内容，做一个高质量的中文幻灯片，内容要丰富，排版设计要一流

33,535 views • 1 year ago

Cursor 0.43 全新升级！两个实战案例深度解析 Agent 功能 Cursor 于昨日发布了 0.43 版本，带来了全新的 Composer 界面、Agent 功能以及 Bug 查找器等一系列更新。在本期视频中，我将通过 Next.js 应用开发和 iOS 应用开发这两个实例，深入探讨 0.43 版本的各项新特性。内容包括 Agent 功能的实际使用演示、与 Windsurf 中 Cascade 的对比，以及新版本的一些不足之处。时间戳： 0:00 - Cursor 0.43 版本更新内容 3:40 - Cursor 论坛 3:55 - Cursor 设置 5:50 - 使用 Agent 功能开发 Next.js 应用 8:41 - Cursor 新版本缺点 9:06 - 使用 Agent 功能开发 iOS 应用

Cursor 0.43 全新升级！两个实战案例深度解析 Agent 功能 Cursor 于昨日发布了 0.43 版本，带来了全新的 Composer 界面、Agent 功能以及 Bug 查找器等一系列更新。在本期视频中，我将通过 Next.js 应用开发和 iOS 应用开发这两个实例，深入探讨 0.43 版本的各项新特性。内容包括 Agent 功能的实际使用演示、与 Windsurf 中 Cascade 的对比，以及新版本的一些不足之处。时间戳： 0:00 - Cursor 0.43 版本更新内容 3:40 - Cursor 论坛 3:55 - Cursor 设置 5:50 - 使用 Agent 功能开发 Next.js 应用 8:41 - Cursor 新版本缺点 9:06 - 使用 Agent 功能开发 iOS 应用

25,151 views • 1 year ago

全面解读 Gemini 2.0 Flash：实时音视频对话，教我编程、剪视频 | 智能桌面协同，实时互动教学 | 原生多模态升级，每日 1500 次免费调用这次谷歌放大招，发布了比1.5 Pro更强大的模型，响应速度翻倍。最令人惊艳的是实时音视频对话功能，就像科幻电影照进现实。本期视频将带你深入了解Gemini 2.0 Flash的各项新特性、技术突破、实际应用演示，以及与1.5 Pro的性能对比，更有Project Astra、Project Mariner等前沿项目解读。从代码生成到游戏辅助，从图片生成到深度研究，Gemini 展现了无限可能。 🕐 时间戳： 00:00 Gemini 2.0 Flash 整体介绍与性能提升 02:27 实时音视频对话功能演示 11:03 Gemini 教我们打游戏 11:18 Project Astra、Project Mariner 介绍 12:39 图像生成与编辑功能演示 13:19 谷歌代码执行原生工具使用演示 14:33 数据分析代理介绍 15:12 Deep Research 介绍 16:04 编程工具 Jules

全面解读 Gemini 2.0 Flash：实时音视频对话，教我编程、剪视频 | 智能桌面协同，实时互动教学 | 原生多模态升级，每日 1500 次免费调用这次谷歌放大招，发布了比1.5 Pro更强大的模型，响应速度翻倍。最令人惊艳的是实时音视频对话功能，就像科幻电影照进现实。本期视频将带你深入了解Gemini 2.0 Flash的各项新特性、技术突破、实际应用演示，以及与1.5 Pro的性能对比，更有Project Astra、Project Mariner等前沿项目解读。从代码生成到游戏辅助，从图片生成到深度研究，Gemini 展现了无限可能。 🕐 时间戳： 00:00 Gemini 2.0 Flash 整体介绍与性能提升 02:27 实时音视频对话功能演示 11:03 Gemini 教我们打游戏 11:18 Project Astra、Project Mariner 介绍 12:39 图像生成与编辑功能演示 13:19 谷歌代码执行原生工具使用演示 14:33 数据分析代理介绍 15:12 Deep Research 介绍 16:04 编程工具 Jules

23,645 views • 1 year ago

Claude高级玩法：MCP多工具组合，自动化工作流搭建指南 | GitHub、SQLite、Fetch、Filesystem等在本期视频中，我介绍了多个MCP工具的实际使用案例。我们一起来看如何将GitHub、SQLite、Fetch等工具高效集成到项目中，探索它们的强大功能和实际应用场景。时间戳： 0:00 - MCP 快速入门 & 工具配置 3:59 - Fetch实战：网页内容抓取 & 多风格内容生成 5:20 - SQLite和Claude集成：100M+大数据分析 7:34 - GitHub集成：自动搜索 & 代码仓库管理 9:10 - CSV数据分析脚本创建 11:15 - 多工具协同：Puppeteer+GitHub自动化工作流

Claude高级玩法：MCP多工具组合，自动化工作流搭建指南 | GitHub、SQLite、Fetch、Filesystem等在本期视频中，我介绍了多个MCP工具的实际使用案例。我们一起来看如何将GitHub、SQLite、Fetch等工具高效集成到项目中，探索它们的强大功能和实际应用场景。时间戳： 0:00 - MCP 快速入门 & 工具配置 3:59 - Fetch实战：网页内容抓取 & 多风格内容生成 5:20 - SQLite和Claude集成：100M+大数据分析 7:34 - GitHub集成：自动搜索 & 代码仓库管理 9:10 - CSV数据分析脚本创建 11:15 - 多工具协同：Puppeteer+GitHub自动化工作流

23,921 views • 1 year ago