生成

豆包AI编程

豆包AI编程是一款基于AI技术的编程辅助工具,支持一键上传代码、实时接入GitHub项目,并提供沉浸式代码阅读和精准提问功能。它能生成、解释、修复和优化代码,提升编程效率与理解力,适用于学习、开发、代码审查及团队协作等场景。

DreamClear

DreamClear是一款由中国科学院自动化研究所与字节跳动团队联合开发的高性能图像修复工具,利用深度学习技术将低质量图像恢复为高质量图像,同时注重隐私保护。其核心技术包括深度扩散先验、方差保持采样和自适应调制器混合模块,广泛应用于图像质量提升、细节恢复、隐私保护及商业项目开发等领域。

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

LIGER

LIGER是一种由Meta AI等机构研发的混合检索模型,结合生成式检索与密集检索技术,提升推荐系统的效率与准确性。其核心功能包括高效生成候选项目、优化排序、处理冷启动问题及融合语义信息。LIGER通过多目标优化和语义融合机制,显著提高了推荐的精准度与适应性,广泛应用于电商、内容、社交及教育等领域。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架,支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制,实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能,适用于视频创作、后期制作、自动驾驶和虚拟现实等领域,提升视频内容的表现力与质量。

万彩商图

万彩商图是一款基于AI技术的图像处理工具,为电商行业提供商品背景替换、模特图生成、批量抠图、高清修复及无损放大等功能。它能够显著提升图片生产效率,优化电商视觉体验,适用于商品展示、广告制作及社交媒体推广等多个场景。

千绘AI

一款AI漫画创作平台,用户可以通过千绘AI生成分镜,并将其转化为图片。千绘AI支持角色引用,确保角色在不同分镜中保持一致。

Stipop

一种 AI 驱动的贴纸生成工具,Stipop根据用户的输入提示生成贴纸设计,从而产生可用于各种在线和离线应用程序的独特设计。

Pixelcut AI

Pixelcut 是一家提供各种基于 AI 技术的图片编辑工具服务商,支持 iOS、Android、Web,可以去背景、橡皮擦、无损放大等