生成

奇觅

奇觅是由美图公司推出的专注于游戏行业的广告AI制作与投放一体化平台。利用先进的AI技术,提供灵感生成、广告制作和广告投放等服务,帮助广告策划人员和广告主提升创意和投放效果...

WorldScore

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准,支持3D、4D、图像到视频(I2V)和文本到视频(T2V)等多种模态。它从可控性、质量和动态性三个维度进行评估,涵盖3000个测试样本,包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能,适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用,为研究

星火插件

星火插件是一款基于星火大模型的浏览器扩展工具,集成了讯飞星火V4.0的AI能力,支持划词搜索、翻译、网页内容摘要生成及信息收藏等功能。它通过轻量化设计兼容主流浏览器,注重个性化配置,可跨平台使用,适用于信息检索、阅读、知识管理等多种场景,致力于提升用户的工作效率。

Caveduck

一个AI角色扮演聊天服务,支持中、英、日韩等多语言,提供多种LLM选择,RWD支援良好,任何设备开启网页即用,无需App。

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型,通过帧上下文打包和抗漂移采样技术,实现高效、稳定的视频生成。其仅需 6GB 显存即可运行,支持实时高清视频生成,具备灵活的调度策略,适用于多种应用场景,如短视频制作、游戏开发、教育与广告等,显著降低了视频生成的硬件门槛。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

GaussianAnything

GaussianAnything 是一款基于多模态输入的 3D 内容生成框架,支持点云、文本和图像等多种输入方式,能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型,具备几何与纹理解耦特性,适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异,为 3D 内容创作提供了高效解决方案。

Quasar Alpha

Quasar Alpha是一款预发布AI模型,具备100万token的超大上下文窗口,可高效处理长文本和复杂文档。其在代码生成、指令遵循、多模态处理等方面表现出色,支持联网搜索以增强信息准确性。适用于代码开发、长文本分析、创意写作及智能问答等多种场景,目前可通过OpenRouter平台免费使用,存在一定请求限制。

Logome

Logome是一款基于AI技术的在线标志设计工具,能够根据用户输入的品牌信息快速生成多种标志方案,并支持风格、颜色和字体的自定义调整。同时提供品牌套件生成、智能设计建议以及高分辨率文件导出等功能,适用于初创企业、自由职业者和个人品牌建设,帮助用户高效打造专业且一致的品牌形象。

S2V.Ai

海螺AI推出的一款基于S2V-01模型的AI视频生成工具,只需输入一张图片即可生成具有高保真度、灵活性和可组合性的视频。