Loading video...

Video Failed to Load

There was a problem loading this video. This could be due to a temporary network issue or the video might be unavailable.

这是哪个大模型生成的答对有奖

Sky G.cph

27,776 subscribers

36,206 views • 9 days ago •via X (Twitter)

Arts Science & Technology

Anya Rossi• Live Now

Private livecam show

0 Comments

No comments available

Comments from the original post will appear here

Related Videos

有好多同学问我想搞 AI Agent，但是不知道怎样选模型。这次给大家来一个自动评测大模型的框架 YourBench 这个框架允许你上传你需要的材料（比如病例），然后生成测试集，来测试你需要选取的大模型，看哪个大模型最适合你的场景。全程自动化完成。我给大家录制的这是网页demo，可以上传PDF或者其他格式的文本文件，然后生成评测题目，这些评测题目都是问答题，比如我直接塞了一本哈利波特与魔法石。它生成的测试题有一个是，守护魔法石的魔法中，有哪个施法者与哈利有个人关系。答案是海格。因为三头犬是海格布置的。可以看到它生成完毕测试集后，然后框架还可以进行自动测试。最后测试完毕，得到结果是前五个模型都回答得不错。感兴趣的同学可以关注下地址：

有好多同学问我想搞 AI Agent，但是不知道怎样选模型。这次给大家来一个自动评测大模型的框架 YourBench 这个框架允许你上传你需要的材料（比如病例），然后生成测试集，来测试你需要选取的大模型，看哪个大模型最适合你的场景。全程自动化完成。我给大家录制的这是网页demo，可以上传PDF或者其他格式的文本文件，然后生成评测题目，这些评测题目都是问答题，比如我直接塞了一本哈利波特与魔法石。它生成的测试题有一个是，守护魔法石的魔法中，有哪个施法者与哈利有个人关系。答案是海格。因为三头犬是海格布置的。可以看到它生成完毕测试集后，然后框架还可以进行自动测试。最后测试完毕，得到结果是前五个模型都回答得不错。感兴趣的同学可以关注下地址：

karminski-牙医

23,579 views • 1 year ago

对我这种不会 blender 的小白，要做这种 3D 模型，最好的方法竟然是 vibe 一个工具来生成

对我这种不会 blender 的小白，要做这种 3D 模型，最好的方法竟然是 vibe 一个工具来生成

CatsJuice

118,285 views • 2 months ago

现在图生视频都在5秒或10秒，10秒的看上去像5秒的慢放，这个无论是在开源模型还是闭源模型上都有类似效果。尤其对于商业闭源视频来说，如果花费一倍以上的成本生成的10秒视频却只是5秒的慢放版，那就显得太不划算了。这里尝试一个方案：从商业闭源模型生成5秒视频，然后用插帧模型生成10秒视频，以下是使用Topaz插帧和原生的对比，供这里尝试一个方案：从商业闭源模型生成5秒视频，然后用插帧模型生成10秒视频，以下是使用Topaz插帧和原生的对比，供大家参考。 #女s #les #女仆 #AI视频

Sensitive content

现在图生视频都在5秒或10秒，10秒的看上去像5秒的慢放，这个无论是在开源模型还是闭源模型上都有类似效果。尤其对于商业闭源视频来说，如果花费一倍以上的成本生成的10秒视频却只是5秒的慢放版，那就显得太不划算了。这里尝试一个方案：从商业闭源模型生成5秒视频，然后用插帧模型生成10秒视频，以下是使用Topaz插帧和原生的对比，供这里尝试一个方案：从商业闭源模型生成5秒视频，然后用插帧模型生成10秒视频，以下是使用Topaz插帧和原生的对比，供大家参考。 #女s #les #女仆 #AI视频

獨自懵逼

18,922 views • 1 year ago

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

karminski-牙医

12,255 views • 17 days ago

一个模型搞定视频+音频+口型! 你看到的这个就是 LTX 刚刚发布的 LTX-2 开放权重大模型, 这个模型可以文生视频或者图生视频, 这个模型最大的特点是在保证了画质和一致性的同时, 可以生成音频! 而且音频和口型完全适配! 并且说话人神态也非常棒! 模型大小是 19B, 相当可用! 演示视频是我用 HuggingFace Zero GPU 生成的 demo, 10秒视频大概需要5分钟左右生成时间. 我测试目前来看最大的优点就是口型和声音生成得非常好, 并且一致性很高. 指定人物使用什么样的银色就能稳定生成. 当然模型也有不足之处, 主要是还是偶尔能看到模型生成人物皮肤的那种油腻感. 当然官方的 pro 版本在这点上处理的更好, 并且 pro 版本支持4K分辨率输出, 当然 pro 版本是没有开源的.

一个模型搞定视频+音频+口型! 你看到的这个就是 LTX 刚刚发布的 LTX-2 开放权重大模型, 这个模型可以文生视频或者图生视频, 这个模型最大的特点是在保证了画质和一致性的同时, 可以生成音频! 而且音频和口型完全适配! 并且说话人神态也非常棒! 模型大小是 19B, 相当可用! 演示视频是我用 HuggingFace Zero GPU 生成的 demo, 10秒视频大概需要5分钟左右生成时间. 我测试目前来看最大的优点就是口型和声音生成得非常好, 并且一致性很高. 指定人物使用什么样的银色就能稳定生成. 当然模型也有不足之处, 主要是还是偶尔能看到模型生成人物皮肤的那种油腻感. 当然官方的 pro 版本在这点上处理的更好, 并且 pro 版本支持4K分辨率输出, 当然 pro 版本是没有开源的.

karminski-牙医

19,803 views • 5 months ago

来看苹果刚发布的视频模型——星流 starflow！苹果刚刚发布了一个新模型 starflow, 这个模型最大的特点是可以文生视频, 图生视频, 视频生成视频, 甚至还支持生成长视频. 模型大小7B, 视频部分使用 WAN-2.2-VAE 魔改, 图片部分使用 SD-VAE 魔改, 最高只支持生成 480p 的视频, 另外模型文件格式是pth, 通常是使用 PyTorch 炼丹的时候保存的原始检查点文件时 pth. 所以这个模型更可能是个技术探索? 并不是很实用.

来看苹果刚发布的视频模型——星流 starflow！苹果刚刚发布了一个新模型 starflow, 这个模型最大的特点是可以文生视频, 图生视频, 视频生成视频, 甚至还支持生成长视频. 模型大小7B, 视频部分使用 WAN-2.2-VAE 魔改, 图片部分使用 SD-VAE 魔改, 最高只支持生成 480p 的视频, 另外模型文件格式是pth, 通常是使用 PyTorch 炼丹的时候保存的原始检查点文件时 pth. 所以这个模型更可能是个技术探索? 并不是很实用.

karminski-牙医

42,175 views • 6 months ago

Rodin 发布 Gen-2 3D模型 🚀 史无前例的百亿级参数量&数据规模 4倍更高的网格质量升级：生成的3D模型更加精细、清晰，细节最牛P的功能是：递归部件生成它不是一次性生成整个模型，而是把一个模型拆成很多小部件，然后用“递归”的方式逐步生成和优化这些部件。所以模型可以直接拆分成各种“零件” 有点意思😂

Rodin 发布 Gen-2 3D模型 🚀 史无前例的百亿级参数量&数据规模 4倍更高的网格质量升级：生成的3D模型更加精细、清晰，细节最牛P的功能是：递归部件生成它不是一次性生成整个模型，而是把一个模型拆成很多小部件，然后用“递归”的方式逐步生成和优化这些部件。所以模型可以直接拆分成各种“零件” 有点意思😂

小互

22,120 views • 9 months ago

CAD大模型来啦！还记得 cursor 创业的时候说自己其实是搞 CAD 大模型的嘛？但是他们遇到的问题是全网 CAD 数据太少了，炼不出来好的模型。今天这个模型作者遇到了同样的问题，他使用了 OpenSCAD 数据集，但是质量太差，于是花了150刀使用AI辅助生成/修复数据，然后觉得太贵了，又用 Gemma3-12b 洗了2天，最后使用 Gemma3-1B 进行微调，得到了这个 CAD 大模型——k-1b 这个模型你只需输入想要什么，它就能生成 stl 格式的 3D模型，然后作者还写了个工具能转换为 OBJ 模型以及在 terminal 预览模型生成的怎么样模型地址：引擎地址：/github.com/ThomasVuNguyen/MakeMe

CAD大模型来啦！还记得 cursor 创业的时候说自己其实是搞 CAD 大模型的嘛？但是他们遇到的问题是全网 CAD 数据太少了，炼不出来好的模型。今天这个模型作者遇到了同样的问题，他使用了 OpenSCAD 数据集，但是质量太差，于是花了150刀使用AI辅助生成/修复数据，然后觉得太贵了，又用 Gemma3-12b 洗了2天，最后使用 Gemma3-1B 进行微调，得到了这个 CAD 大模型——k-1b 这个模型你只需输入想要什么，它就能生成 stl 格式的 3D模型，然后作者还写了个工具能转换为 OBJ 模型以及在 terminal 预览模型生成的怎么样模型地址：引擎地址：/github.com/ThomasVuNguyen/MakeMe

karminski-牙医

28,604 views • 8 months ago

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

如果你在做游戏, 那一定要看看这个大模型! 给大家带来腾讯刚刚发布的可以生成人物动作的大模型hunyuan-motion-1.0 实测这个模型最大的特性是可以通过文字描述生成动作, 并且它是端到端的模型, 生成的动作可以直接用于Blender、Unity、UE等主流3D工具我简单测试了几个极限场景, 这个模型对于日常场景的动作还原很不错, 甚至一些复杂一点的, 比如黑客帝国中的子弹时间的下腰动作还原得也不错. 那么极限在哪里呢? 简单来讲, 职业运动员的动作不太行, 比如跳台滑雪, 跳水, 小轮车这类. 总结, 这个模型用于快速生成游戏场景中NPC的日常生活动作是完全够用的, 不过主要角色的动作设计还是需要大量修改才能使用.

karminski-牙医

35,801 views • 6 months ago

问：这个视频一共出现多少个Ca ？答对有奖 👀👀👀

问：这个视频一共出现多少个Ca ？答对有奖 👀👀👀

小鱼Daisy🔶BNB

15,167 views • 5 months ago

顺藤摸瓜找到这个视频的作者了问了下一对一教学是3000元丢个视频你自己学是588元可以使用训练好的模型，也可以自己用SD生成定制自己独有的虚拟人模型一个模型一张脸，做好无法更换！显卡3060起步

顺藤摸瓜找到这个视频的作者了问了下一对一教学是3000元丢个视频你自己学是588元可以使用训练好的模型，也可以自己用SD生成定制自己独有的虚拟人模型一个模型一张脸，做好无法更换！显卡3060起步

小互

1,194,852 views • 2 years ago

一个对股票、对光模块一无所知的小白，是如何通过AI速学的？这个美女用一个巧妙的提问，让Claude以引导型的方式解答。这个方法适用于任何人。

一个对股票、对光模块一无所知的小白，是如何通过AI速学的？这个美女用一个巧妙的提问，让Claude以引导型的方式解答。这个方法适用于任何人。

0x鸣人

34,676 views • 22 days ago

Kokoro简直太疯狂了。🤯 这款AI是一个开创性的TTS模型，仅有8200万参数，却超越了更大的模型，可以在几秒钟内生成数分钟的语音。而且，它是开源的！快来试试：👇

Kokoro简直太疯狂了。🤯 这款AI是一个开创性的TTS模型，仅有8200万参数，却超越了更大的模型，可以在几秒钟内生成数分钟的语音。而且，它是开源的！快来试试：👇

AI Will

42,843 views • 1 year ago

在这一段演示当中很多人可能没有发现一个细节 4分20秒开始，GPT 4o是可以进行即兴创作歌曲并演唱的而且两个GPT 4o进行了即兴的创作和对唱这些都是实时进行发生的也就是OpenAI 实际上已经有了自己的音乐生成模型，而且还很先进。实际上OpenA确实有自己的音乐生成模型，叫：Jukebox 这个模型甚至在3年前就已经非常厉害了演示：见二楼↓

在这一段演示当中很多人可能没有发现一个细节 4分20秒开始，GPT 4o是可以进行即兴创作歌曲并演唱的而且两个GPT 4o进行了即兴的创作和对唱这些都是实时进行发生的也就是OpenAI 实际上已经有了自己的音乐生成模型，而且还很先进。实际上OpenA确实有自己的音乐生成模型，叫：Jukebox 这个模型甚至在3年前就已经非常厉害了演示：见二楼↓

小互

25,542 views • 2 years ago

这个小哥的这个工具有点帅，把图片直接做成3D 模型的效果很赞啊！

这个小哥的这个工具有点帅，把图片直接做成3D 模型的效果很赞啊！

Berryxia.AI

27,113 views • 3 months ago

国产视频生成框架！能让老黄唱野狼 Disco！大模型竞技场速报！17小时前发布的国产人类视频生成框架—— OmniHuman-1！（一定要开声音看这个视频才震撼！）这个模型的突破有： 1. 首次实现单模型支持音频/视频/文本/姿态任意组合生成视频，突破现有方法只能单一模式的限制。

国产视频生成框架！能让老黄唱野狼 Disco！大模型竞技场速报！17小时前发布的国产人类视频生成框架—— OmniHuman-1！（一定要开声音看这个视频才震撼！）这个模型的突破有： 1. 首次实现单模型支持音频/视频/文本/姿态任意组合生成视频，突破现有方法只能单一模式的限制。

karminski-牙医

185,688 views • 1 year ago

Krea AI开源其首个图像生成模型 FLUX.1 Krea [dev] 让生成的图像不再有“AI 味” 该模型是在与 Black Forest Labs 合作的基础上开发的指导蒸馏（guidance-distilled）扩散模型 FLUX.1 Krea [dev]的目标是：让 AI 生成的图片看起来更自然、更有艺术感、而不是“AI 味儿”太重。兼容现有的 FLUX.1-dev 生态系统，可无缝集成使用。

Krea AI开源其首个图像生成模型 FLUX.1 Krea [dev] 让生成的图像不再有“AI 味” 该模型是在与 Black Forest Labs 合作的基础上开发的指导蒸馏（guidance-distilled）扩散模型 FLUX.1 Krea [dev]的目标是：让 AI 生成的图片看起来更自然、更有艺术感、而不是“AI 味儿”太重。兼容现有的 FLUX.1-dev 生态系统，可无缝集成使用。

小互

15,907 views • 7 months ago

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

karminski-牙医

30,708 views • 9 months ago

哇！这设计绝对是天才，一度让我怀疑是AI生成的，可是有人说不是AI生成的，大家看看是不是！

哇！这设计绝对是天才，一度让我怀疑是AI生成的，可是有人说不是AI生成的，大家看看是不是！

MayHe

16,454 views • 2 months ago

🔥X 首席执行官：Grok 3.5 即将发布，它将成为全球最强大的 AI 模型！这将大幅提升个人和企业的生产力和创新能力！ 🚨Grok 是唯一拥有实时数据的大型语言模型，其他模型都有延迟。使用 Grok 的公司可以提前获取其他人无法掌握的数据！这对分析行业趋势、研发新产品都至关重要！

🔥X 首席执行官：Grok 3.5 即将发布，它将成为全球最强大的 AI 模型！这将大幅提升个人和企业的生产力和创新能力！ 🚨Grok 是唯一拥有实时数据的大型语言模型，其他模型都有延迟。使用 Grok 的公司可以提前获取其他人无法掌握的数据！这对分析行业趋势、研发新产品都至关重要！

谢嘉琪

10,895 views • 1 year ago