
艾略特
@elliotchen100 • 25,822 subscribers
Building @EverMind - memory for self-evolving agents https://t.co/AUbhZlNBD3
Shorts
Videos

卧槽,发现一个好东西 视频翻译,字幕,配音,语音克隆,一体方案 KrillinAI - 免费免费免费 - 出海开发酱可以替代剪映了 • 支持多种语言,英语和中文都不错(王炸功能) • 支持 Win 和 Mac,下载即用 • 一键启动 - 即刻开启你的工作流 • 视频导入 - 支持 yt-dlp 下载和本地文件上传 • 精准字幕 - 基于 Whisper 的高精度识别 • 智能分段 - 基于 LLM 的字幕分段与对齐 • 专业翻译 - 按段翻译,确保上下文一致性 • 术语替换 - 一键替换领域专用词汇 • 配音与声音克隆 - 支持 CosyVoice 选音或声音克隆 • 视频合成 - 自动适配横屏/竖屏等格式 可以看下视频里面的 TTS 效果,非常不错。
艾略特113,324 views • 1 year ago

F1 迈凯轮车队的车手, 兰多·诺里斯的个人网站非常酷炫 设计和交互从页头到页脚,全是戏, 有意思的是,这个网站没有用 web 框架, 是 Webflow + 纯 JS 魔改 扒了一下 Hero 部分, Lando 照片区域用了多层 3D 效果, 深度图(depth map)让 2D 照片随鼠标产生轻微视差, 再叠加 alpha map,roughness map 控制透明与高光反射, 营造真实的 「立体质感」 头盔本身是一个 glTF 3D 模型, 通过不同贴图(base color,金属度,法线,粗糙度等) 切换多款头盔皮肤,并随滚动实时旋转, 而不是用滚动驱动的视频序列 大写的牛批,非常考验设计师的美感和交互设计, 也非常考验前端的功力,效果极其复杂,但性能很好, 基本维持高 FPS,几乎不掉帧 另外,这网站支持手机端,且很丝滑, 还在 Console 里面藏了彩蛋
艾略特44,525 views • 5 months ago

好东西,天眼平替,查公司利器,开源 Company Research Agent - 免费 - 查起来 结合 Gemini 2.0 Flash 和 GPT-4.1 的双模型架构,一键生成公司尽职调查报告。 功能亮点 🌐 多源采集:抓取公司官网、新闻、财报、行业报告等信息 🧠 AI 内容筛选:基于 Tavily 的相关性评分系统自动过滤冗余信息 🧾 实时进度流:基于 WebSocket 展示研究进度与结果 🧱 模块化架构:拆分为多个 Research / Processing Node 协同完成研究 研究框架包括 Company / Industry / Financial / News 分析器 Collector + Curator + Briefing(Gemini)+ Editor(GPT-4.1 mini) 使用方式 输入公司名、官网、行业、总部位置 👉 自动开始研究 前端使用 Modern React 构建,体验流畅,实时可视化更新! 官网 Github
艾略特69,568 views • 1 year ago

国内团队开源了一个字幕神器,宣传接近奈飞的水准 商业版本还没发布,目前免费 VideoLingo - 开源免费 - 功能全 - 视频字幕 AI 自动化神器 视频展示的是用了 GPT-SoVITS 克隆声音后的效果 其实用这个直接下载油管视频也行 亮点 • 支持一键下载 YouTube 视频并自动切割字幕 • NLP 和大模型驱动的智能分句,翻译更自然 • 三步翻译流程,字幕质量媲美专业团队 • 支持 WhisperX 字级对齐,字幕同步精准 • 支持 GPT-SoVITS,Azure,OpenAI 等多种高质量配音 • 支持多语言界面,Streamlit 一键启动 • 单行字幕输出,体验接近 Netflix 标准 • 详细日志,进度可断点续传 • 支持本地和云端多种 API,易用性强 官网 Github
艾略特62,072 views • 11 months ago

We put TEN VAD from TEN Framework on GitHub last month. It became so popular that many people asked us to open source it. Guess what? We made it happen with the ONNX model. 😎 As always, please support TEN Framework and TEN VAD with stars on GitHub, it means a lot. ⭐️🥰
EC Elliot31,371 views • 11 months ago

今年最强的前端 UI 动效组件库,没有之一,强烈推荐 - 看中的组件直接复制 - 经济实用还特么漂亮 这种组件库,任何人,随便玩玩就可出道,比坤快 亮点 • AI UI Builder:通过 AI 生成 UI 界面(Magic MCP / Magic Chat 等) • 组件市场:提供丰富的 UI 元素(按钮、导航栏、卡片、动画等) • 模板与组合包:整页模板、界面合集、一键打包使用 • 创作者系统:支持用户上传作品、参与挑战、查看排行榜 • 互动功能:支持点赞、收藏、复制代码、嵌入至项目中 同时,这个组件库也是评论区各位前端老湿极力推荐,必须分享一波。Anthony 热烤奶 官网
EC Elliot17,090 views • 1 year ago

Github 上发现一个桌面 Agent,自然语言命令自动完成各类任务,可运行在容器化的 Linux 桌面环境中。 支持多种模型,也可本地模型。 开源,免费。
艾略特13,314 views • 9 months ago

数字人系统,阿里本地运行数字人对话系统 Open Avatar Chat - 开源 - RTC 技术所以实时性强 亮点 ⚡ 低延迟实时对话:端到端平均响应时间约 2.2 秒 🧠 多模态支持:接入 MiniCPM-o 等模型,支持文本、语音、视频等输入输出 🧩 模块化设计:可替换 ASR / LLM / TTS 模块,灵活配置语音/文本/S2S 模式 🖥️ 本地运行:支持 CPU/GPU 推理,推荐 RTX 4090(量化模型支持低显存) 实测平台 i9-13900KF + RTX 4090 架构清晰 支持 RTC、VAD、S2S 与 TTS 全链路闭环交互 Hugging Face 直接体验(貌似有点卡,多试几次) GitHub
EC Elliot12,264 views • 1 year ago
No more content to load