生成

海螺视频APP

海螺视频APP是一款基于AI技术的视频生成工具,支持文生视频和图生视频功能,提供丰富的镜头控制选项,让用户能像专业导演一样创作动态视频。该工具适用于多种场景,如社交媒体、广告营销、影视制作等,操作简便,适合各类用户使用。

InspireMusic

InspireMusic是由阿里巴巴通义实验室开发的AI音乐生成工具,支持通过文字描述或音频提示生成多种风格的音乐作品。其核心技术包括音频 tokenizer、自回归 Transformer 模型、扩散模型(CFM)和 Vocoder,实现文本到音乐的转换、音乐续写及高质量音频输出。该工具支持长音频生成、多种采样率,并提供快速与高音质两种推理模式,适用于音乐创作、音频处理及个性化音乐生成等场景。

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

S2V.Ai

海螺AI推出的一款基于S2V-01模型的AI视频生成工具,只需输入一张图片即可生成具有高保真度、灵活性和可组合性的视频。

ParGo

ParGo是一种由字节与中山大学联合开发的多模态大语言模型连接器,通过结合局部与全局token,提升视觉与语言模态的对齐效果。其核心模块PGP和CPP分别提取图像的局部和全局信息,增强细节感知能力。在多个基准测试中表现优异,尤其在文字识别和图像描述任务中优势明显。采用自监督学习策略,提高模型泛化能力,适用于视觉问答、图像字幕生成、跨模态检索等多种场景。

MusicFX DJ

MusicFX DJ是一款由Google DeepMind开发的人工智能音乐生成工具,利用实时文本提示生成多样化音乐作品。它支持多提示词混合、风格精细调控、乐器编排以及高质量音频输出等功能,适用于个人创作、现场表演、音乐教育及社交媒体内容制作等多个场景,为音乐爱好者和专业人士提供便捷高效的创意工具。

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

Trae国内版

Trae国内版是字节跳动推出的AI IDE,支持代码生成、补全、优化及自然语言指令生成。其核心功能包括Builder模式、智能体协作、多模型切换及上下文理解,提升开发效率。界面简洁易用,适配中文环境,适合从初学者到专业开发者使用。

Toorch

Toorch是一款基于人工智能技术的新闻阅读器,主要功能包括连续对话支持、搜索历史查询、快速内容生成、个性化体验(点赞与收藏)、划词搜索以及图片与链接展示。其设计旨在简化信息获取过程,提供直观且连贯的搜索服务。适用于即时新闻获取、信息追踪、研究学习、个性化内容发现及跨语言内容访问等多个场景。

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。