
AIGCLINK
@aigclink • 36,193 subscribers
致力于让每个想拥抱AI的人都能找到适合自己的AI产品,助力企业定制AIGC应用
Shorts
Videos

阿里上线了一款电商版OpenClaw:Accio Work,一人+Accio Work即是一个跨境电商团队 从商品设计、采购、谈判、店铺运营、营销到CRM,一个对话框全搞定 比如,一句“我想开一家卖丑萌毛绒玩具的Shopify店铺”,它即会去市场调研、选品、找货源、预估利润率、上架、做SEO优化、运营推广等等 你可以创建自己的智能体并组成一支AI Agent团队,比如营销、美工、文案团队,每个智能体的模型可选 它内置了电商相关的Skill,相对比较全,开箱即用 支持定时任务,比如晨报/日报、热点追踪、竞品动态、周度回顾等 可以通过微信、钉钉、Telegram、Discord等交互,所有连接数据存在本地 阿里等于把自己的经验在电商垂直场景AI化了,想搞电商的可以看看 #AI电商 #AI企业员工 #AccioWork
AIGCLINK244,669 просмотров • 2 месяцев назад

开源软件著作权申请Skill:SoftwareCopyright-Skill,自动生成申请材料,让你一个软著怒省几百块代办费 它会让AI读取本地项目,从项目分析、业务理解、申请表信息、操作手册到代码材料,自动生成全套软著申请材料 包括操作手册DOCX、代码材料DOCX、申请表信息TXT等 在理解代码结构和业务功能基础上,写操作手册并非直接套用模板 代码材料只来自开发者已有项目,禁止AI编造源码 源码足够时按常见鉴别材料要求生成前30页和后30页,不足60页时按规则生成全部代码材料 关键节点比如业务口径、申请表字段、代码选择等会让人工确认 默认在当前项目目录生成材料,代码、文档和草稿都留在本地 对于小团队或个人开发者比较实用,让AI做这些文书工作 #SoftwareCopyrightSkill #软著skill #skill
AIGCLINK41,184 просмотров • 20 дней назад

目前看到的在医疗方向最大的养虾OpenClaw技能库:OpenClaw-Medical-Skills,872个技能 涵盖临床医学、基因组学、药物发现、生物信息学、医疗器械等 用上,你的OpenClaw就可以变成专业的医学科研助手,能进行PubMed查询、临床试验检索、药物相互作用分析、基因变异解读、生成SOAP病历、出院小结等等 每个技能就是一个SKILL.md 文件,包含专业知识、连接API指令、结构化输出 实时数据连接PubMed、 具体包含:通用工具9个、临床与医疗30+、药物发现与安全20+、科学数据库35+、生物信息学 228个、组学工具50+、蛋白质设计15+、健康管理19、医疗器械法规47、BioOS扩展套件285+、ClawBio管道22、模拟与本体论17 #OpenClawMedicalSkills #医疗skill #AIskill
AIGCLINK106,135 просмотров • 2 месяцев назад

又一个Phone Use开源项目:android-action-kernel,让AI直接动手操作原生Android应用,单次调用成本降低95%、延迟<1秒 它主路径不用视觉模型,而是利用Android系统原生的Accessibility API,拿到界面XML树,包括按钮文字、坐标、是否可点状态等,直接获取屏幕语义信息给LLM决策 省掉截图-OCR-视觉模型的高成本,每次操作$0.01,便宜了95%;延迟从3-5秒缩短到<1秒,快了5倍;准确性提升至99%+ 项目来自 #phoneuse #AndroidUse #手机AI
AIGCLINK149,924 просмотров • 5 месяцев назад

复刻Manus,无需邀请码,开源版Manus! 支持在电脑上完成很多任务,包括网页浏览、文件操作、写代码等 OpenManus使用了传统的ReAct模式,优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理,需要注意,Manus有使用Plan进行规划 OpenManus目前也已初步加入了具有 Plan&ReAct的功能,正在优化调试,大家也可以尝试更改System Prompt 让OpenManus学会记录文档和Todo List的习惯 主要依赖的几个工具: 1. PythonExecute:执行Python代码与电脑系统交互,可以进行文件操作、数据处理、自动化任务等 2. FileSaver:保存文件到本地,比如txt、python、html等 3. BrowserUseTool:打开、浏览和控制浏览器 4. GoogleSearch:进行网络信息检索 开源链接见下条
AIGCLINK348,653 просмотров • 1 год назад

阿里刚刚发布了:Qwen3.5-Omni,原生全模态,自然涌现出Audio-Visual Vibe Coding能力 也就是说它能看着画面写代码,给它看一段界面需求视频,它能直接生成对应代码,不是专门训练来的,模型自己学会的 好比说你看一眼就会了,AI也做到了 Qwen3.5-Omni能无缝理解文本、图片、音频/音视频输入,支持细粒度、带时间戳的音视频Caption生成 支持256K上下文、113种语言识别,能处理10小时音频或1 小时视频 原生支持WebSearch和复杂Function Call 支持语义打断、音色克隆及语音控制 给了Plus、Flash、Light三个版本 #Qwen35Omni #LLM
AIGCLINK50,637 просмотров • 2 месяцев назад

发一下港大数据智能实验室搞的一款4000行代码版“Clawdbot”:nanobot,代码体量较43万行Clawdbot减少99% 体量小但核心智能体功能具足,网页搜索、代码与文件操作、定时任务、记忆等能力都有 内置了24h实时行情分析、全栈开发、日程管理、知识库四个场景模板,可以用来做24小时盯盘写行情分析,或者当程序员外挂用 已集成Telegram/WhatsApp,Telegram可直接用token,WhatsApp扫码接入 下一步会做多模态、长记忆、自改进,以及接入Discord、Slack等更多平台 #ClawdBot #Openclaw #nanobot #MoltBot
AIGCLINK59,620 просмотров • 3 месяцев назад

超酷,Gemini 3做的一个3D交互式网站,它通过摄像头识别手势并可实时交互,可以用手操控粒子 Gemini 3可以生成带three.js的3D交互场景,生成的场景可以用手进行互动 对线下的展会、橱窗或广告牌可以搞成隔空操控体验了 方法: 打开Google AI Studio,把提示词贴进去 把生成的代码复制出来 新建一个文本文件,把代码粘进去,然后把文件名从默认的 .txt 改成 index.html 最后双击用浏览器打开 提示词: Create a real-time interactive 3D particle system with Three.js. requirements: 1. Control the scaling and expansion of the particle group by detecting the tension and closing of both hands through the camera. 2. Provide panels that can choose hearts/flowers/saturn/Buddha statues/fireworks and other templates 3. Support the colour selector to adjust the particle colour 4. Particles need to respond to gesture changes in real time. The interface is simple and modern. 5. The interface is simple and modern 用例来自于 el.cine #Gemini3 #AI交互网页
AIGCLINK84,970 просмотров • 6 месяцев назад

超酷!Romain刚刚在OpenAI伦敦的DevDay现场,在Cursor里用o1 -MINI大约2分钟捏了一个应用,控制无人机在舞台上飞行,表演后空翻 #openai #openaio1 #DevDay
AIGCLINK160,542 просмотров • 1 год назад

一键给龙虾OpenClaw体检加固工具,检查你的龙虾有没有在裸奔,openclaw-security-hardening 对话式完成体检和修复,自动扫描配置、出报告、给三档加固方案,选完直接帮你改 OpenClaw安全隐患除了黑客攻击,还可能是配置不当,比如门禁没锁、权限过大、群聊不设防等 不想逐条对照配置文件的,可以用这套自动化skill 它可以: 自动检查OpenClaw配置文件中的安全风险 哪些配置有问题、风险等级是什么(CRITICAL/WARN 等) 给三档安全加固方案 选完方案后直接改配置,无需手动改JSON #OpenClaw #OpenClaw安全
AIGCLINK28,701 просмотров • 2 месяцев назад

腾讯优图出的一款主动式设备端AI助手:Youtu-Tip,可以桌面自动化、Agent调用,能离线使用 它可以模拟鼠标/键盘来实现桌面操纵,比如说,“帮我把Excel里低于60分的标红”、“总结文章发给XX微信” 支持热键、选中文本或者图像交互 也可以教它技能,比如给它演示一遍“去官网搜最低价航班”,它能记录步骤下次一句命令自动跑 还可以接入智能体、MCP服务器以及其他工具,来实现更复杂的任务 Tip基于Youtu-LLM驱动,1.96B,128K上下文,具备原生智能体能力,是开源的,也可以替换成其他模型 它还有一个4B的Youtu-VL端侧多模态模型也马上要开源 #AI设备端助手 #YoutuTip
AIGCLINK47,495 просмотров • 4 месяцев назад

牛,Mistral刚刚发布了号称地表最强OCR,给文档理解设立了新标准! Mistral OCR具备强大认知能力,能准确理解文档中包括文本、图像、表格、公式等在内的每个元素 特点: 1、原生多语言和多模态,支持数千种文字、字体以及语言 2、能准确理解复杂的文档元素,包括图像、数学公式、表格以及 LaTeX 格式等,尤其擅长处理包含图表、图形、公式和插图的科学论文等富文档 3、在多个文档分析方面的基准测试中优于其他OCR模型,尤其在扫描文档、表格和数学公式识别上表现出色 4、处理速度很快,单节点每分钟可处理2000页 5、支持使用文档作为提示,以结构化格式比如 JSON输出 6、可选择性自托管 #OCR #MistralOCR #Mistral
AIGCLINK111,848 просмотров • 1 год назад

字节发布了一款端到端同声传译模型:Seed LiveInterpret 2.0,中英双向端到端同传,延迟为2-3秒 从演示效果看,准确性、复杂场景的处理、声音情绪的表达、语音克隆音色转换的效果相对都还可以 性能上,语音到语音翻译,中英互译平均翻译质量到了66.3分,接近专业真人同传水平 延迟上,语音到文本输出首字平均延迟2.21秒,语音到语音输出延时2.53 秒 功能上支持实时声音复刻,复刻不同说话人的音色 擅长多人对话、非流利语音以及长音频场景 对绕口令、诗词、美食文化等可相对自然互译 #AI同传 #SeedLiveInterpret #字节同传
AIGCLINK78,165 просмотров • 10 месяцев назад

AI智能视频剪辑师:CutClaw,丢进去几小时的长视频和一段音乐,给文字指令,它能自动出踩点音乐的电影短片 搞旅拍的可以看看,比如拍了5-6小时素材,按BGM节奏,一键剪成一段1分钟抖音、小红书视频 Vlogger们可以快速从全天素材出片、搞营销的批量生成不同风格的宣传片等 剪出来视频的叙事性、节奏感、视觉上都还可以 它是音乐驱动剪辑决策,先分析音乐节拍、重拍、音高、能量曲线,然后让剪辑点落在拍子上,不是后配BGM 智能自动裁剪,内容感知裁剪,自动识别主体并调整画面比例适配各社交平台 一句风格描述,比如快节奏的赛博朋克风格城市夜景或温馨慢节奏的家庭回忆短片,AI自动理解并执行,无需手动操作时间轴 提供Streamlit可视化界面,也支持CLI命令行 #CutClaw #AI视频剪辑师 #视频自动化剪辑
AIGCLINK18,611 просмотров • 1 месяц назад

阿里刚刚放出来了一款环境音/音效模型:PrismAudio,5.18亿参数,生成9秒音频只需0.63秒 它把强化学习和思维链结合,先思考,再生成匹配的声音 声画同步、以及音质上的清晰度丰富度感觉还可以 #音效模型 #PrismAudio
AIGCLINK20,218 просмотров • 2 месяцев назад