正在加载视频...

视频加载失败

纳米搜索这个 AI 搜索简直是创作者神器! 任何热点都能一键生成播客和视频快速分发。 搜索生成结果从文本拓展到了更多模态。 尤其是真人语音模型很自然。 下面是我用Lex的视频文稿生成的

47,730 次观看 • 1 年前 •via X (Twitter)

10 条评论

歸藏(guizang.ai) 的头像
歸藏(guizang.ai)1 年前

这里尝试纳米搜索:

歸藏(guizang.ai) 的头像
歸藏(guizang.ai)1 年前

播客生成: App 中获取搜索结果后点击下方播放 UI 的分享按钮就可以下载生成的播客。 除了可以在声音市场(点击左上角头像→声音)选择既有的声音之外,还可自定义上传自己或家人的声音。

歸藏(guizang.ai) 的头像
歸藏(guizang.ai)1 年前

视频生成: 生成视频的时候只需要提供文档的链接就行,也可以从搜索结果提取。 然后 AI 会根据已有内容自动生成不同风格的口播稿和标题,当然你也可以自己再修改。 最后根据润色完的文本生成视频或者播客或者文档,他们甚至专门为不同的视频渠道做了适配,比如抖音和小红书的行文风格和标题就会不一样。

歸藏(guizang.ai) 的头像
歸藏(guizang.ai)1 年前

以 NotebookLM 为代表的 AI 交互新范式说了好久了,国内的跟进的是真的慢,反倒不管行不行都开始搞生成了。 但是今天发布的纳米搜索是我最近发现把这套融合的非常好的,甚至比 Perplexity 做的都很好。 他们把 AI 搜索完全做成了多模态的创作工具。 AI 时代以前的搜索引擎只能对文本进行处理,AI 时代的搜素引擎不再是内容检索工具而是内容生成工具和消费工具。 未来一个内容的消费场景会覆盖视频、图片、播客、数据图、PPT 甚至是不同的软件和交互布局。

Jackywine 的头像
Jackywine1 年前

语音的可以提升的空间还很大,但是我还是看完了,从侧面说明一件事,只要内容好,展现形式可以不限

歸藏(guizang.ai) 的头像
歸藏(guizang.ai)1 年前

是的 核心内容重要,其他就是适配一下场景

PromptFuture 的头像
PromptFuture1 年前

人人都来生产AI垃圾内容,结果就是生产内容的比看的还多

永贵 的头像
永贵1 年前

语音还是很差

Vincent Lei 的头像
Vincent Lei1 年前

虽然但是对 360 这家公司不敢抱什么期待,hh

John Mike 的头像
John Mike1 年前

.cn的话,还是算了

相关视频

把网站录下来给AI看, AI能照着做出来吗? 刚刚看到了个炫酷的灯具网站, 它有个功能是点击按钮直接能看到灯点亮的效果, 甚至网站的配色也会暗淡下来, 特别有氛围. 我突然想到, 这样的网站, 如果要让AI来做, 该怎么办? 把源代码拷给它? 用一个巨复杂的 prompt 来完成? 有没有可能, 我录个视频, 展示一下这个"关灯"的效果, 然后让AI来按照视频来写网站? 于是, 这个重任就交给了今天测试的模型, 百度刚出的文心-5.0-preview, 全模态大模型, 这个模型同时支持文本, 图片, 音频, 视频作为输入, 然后可以生成文本和图片, 所以我们这个测试可以最大化的利用它的能力. 我先录制了网站的效果, 然后写了prompt作为补充, 告诉它这个效果是怎样的, 以及准备的图片材料在哪里. 值得一提的是, 网站所展示的图片也是我用文心-5.0-preview生成的. 大家可以看视频中我生成的效果. 直接说测试结论: 目前每个模态都是可用的, 而且模态之间关联性非常好, 我测试了视频+文本, 图片+文本, 图片+语音, 都可以完成任务. 当然测试也发现了一些问题, 比如 token 输出速度不是特别快, 以及偶尔会有超时问题(已反馈给百度的同学). 我的使用建议是, 多利用它的多模态能力, 来完成之前不敢想象的任务, 它真的提升了使用场景的天花板. #文心大模型 #文心5 #百度 #文心一言 #ai教程

karminski-牙医

29,929 次观看 • 7 个月前

国产最新的多模态模型来了!! 前两周我刚体验过国产的阶跃星辰大模型,没想到这么快他们的新模型 Step 3.7 Flash 就出了。 现在大模型一发布必卷 benchmark 分数,但真正做 Agent 的人都清楚:跑分高 ≠ 能把活干完。 所以这次阶跃星辰的新模型 Step 3.7 Flash 它再不追求单点最聪明、也不只是单次最快,而是主打“生产任务端到端执行效率”。 一个真实的 Agent 任务从来不是一次问答,而是规划 → 搜索 → 工具调用 → 代码生成 → 多模态理解 → 反复校验的完整闭环,Step 3.7 Flash 这次升级的重点是整条链路的效率,而不是某个孤立指标。 提几个我觉得挺务实的点: 1. 原生多模态模型:它可以直接处理 UI 截图、图表、仪表盘、文档,原生读懂并转成结构化输出和可执行步骤,不需要像一些模型那样外挂视觉理解 MCP,而且现在多模态是顶级模型的标配。 2. 推理加入搜索和视觉检索:网页搜索、图像搜索、视觉验证、多源信息比对,让 Agent 在开放任务里边查边验证边行动,而不是事后再接个外部工具。 3. 198B MoE、约 11B 激活参数,最高 400 TPS:稀疏激活 + 这个速度,意味着高频交互、多步工作流、反复工具调用的场景下,单位任务的成本和延迟都压得很低——快和省是一起来的。 4. 开源、可部署:生产环境要的不只是 API,还有透明度、可控性和部署灵活性。 如果你在做 AI Agent、coding 工作流、搜索类应用或多模态系统,值得用 StepFun 试试这款新模型的能力。 想看更进阶的平台能力,可以了解 Step Plan。 海外平台: 国内平台:

耳朵

12,058 次观看 • 21 天前