生成

Ideogram 2a

Ideogram 2a 是 AI 图像生成平台 Ideogram 推出的文生图模型,基于 Ideogram 2.0 优化升级,具备高效生成、成本降低、高质量文本渲染等特点。支持多种艺术风格和中文提示,适用于平面设计、数字营销、摄影及艺术创作等多个领域,是提升图像创作效率和质量的实用工具。

SongGen

SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型,能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出,可分别生成人声与伴奏,便于后期编辑。SongGen通过创新的音频标记化和训练策略,显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准,适用于音乐创作、视频配乐、教育辅助等多个领域。

CorrDiff

CorrDiff是NVIDIA开发的生成式AI模型,用于将低分辨率天气数据提升至高分辨率,提升天气预测的精度和效率。采用UNet与扩散模型结合的两步法,显著提升计算速度并降低能耗。支持多变量预测和极端天气模拟,适用于灾害预警和高精度气象分析,具备良好的部署灵活性。

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的高效AI模型,采用Hybrid-Mamba-Transformer架构,提升推理效率并降低计算成本。支持快速响应、多领域推理、内容创作及多模态生成,适用于对话、代码、逻辑推理等场景。兼具短思维链与长思维链能力,性能对标行业领先模型。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

a0.dev

a0.dev 是一款基于 AI 技术的 React Native 开发平台,可通过自然语言输入生成完整的应用代码,涵盖前端界面、状态管理、路由配置和后端云函数。支持组件级控制、云端开发、自动配置等功能,显著提升开发效率,适用于创意验证、MVP 构建和企业技术探索。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

救救图片

该AI图片处理工具提供去水印、抠图、去马赛克、无损放大、图片修复及生成相似图等功能,基于先进算法实现高效精准的图像编辑。支持多种格式下载,操作简便,适用于设计师、电商卖家及内容创作者,广泛应用于素材优化、商品展示和内容制作等领域。

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架,能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略,结合位置编码重用和无噪声条件范式,确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能,并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源,适用于数字艺术创作、商业设计、社交媒体等多个场景。

Landing

Landing 是一款基于 AI 技术的落地页生成工具,可快速创建美观高效的页面。用户输入品牌信息后,系统自动生成文案、图像和设计布局,支持可视化编辑与多版本测试。具备多语言支持、表单集成、数据分析等功能,适用于电商、数字营销、品牌宣传及活动推广等多种场景,提升转化效率与用户体验。