生成

Light

Light-A-Video 是一种无需训练的视频重照明技术,由多所高校和研究机构联合开发。它通过 CLA 和 PLF 模块实现高质量、时间一致的光照调整,支持前景与背景分离处理,并具备零样本生成能力。适用于影视、游戏、视频创作等多种场景,兼容多种视频生成模型,提升视频表现力与创作效率。

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。

Director

Director是一款基于VideoDB的视频智能处理框架,利用自然语言指令实现视频搜索、编辑、合成及生成等功能,同时支持实时流式传输。它提供了聊天式用户界面和预构建的视频代理,便于开发者和创作者快速构建定制化解决方案。此外,Director适用于视频内容管理、编辑、创作以及教育等多个领域,为企业和内容生产者提升工作效率。

KeySync

KeySync是一种高分辨率口型同步工具,由帝国理工学院和弗罗茨瓦夫大学联合开发。其采用两阶段生成框架,结合掩码策略和视频分割模型,实现音频与唇部动作的精准对齐。支持高清视频生成,具备遮挡处理、减少表情泄露等功能,在视觉质量、时间连贯性和同步精度上优于现有方法,适用于自动配音、虚拟形象、视频会议等多场景应用。

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具,能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术,实现快速、精确的几何与纹理重建,并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

鹿班

根据商品图批量设计各类场景图片

bioloGPT

BioloGPT是一款基于AI技术的生物学问答工具,凭借对学术论文的广泛引用,为用户提供可靠的生物学知识解答。它不仅能生成新的科学假设和实验方案,还具备强大的文献检索能力,可为教育、科研、临床咨询及政策制定等多个场景提供支持。此外,定期发布的综述文章有助于用户及时跟进生物学领域的前沿进展。

OpenDream

Opendream.ai 是一个可让您在 AI 的帮助下创建令人惊叹的图像网站,您可以使用它在短短几秒钟内生成艺术、logo、设计等。

DeepWiki

DeepWiki是一款由Devin团队开发的AI代码阅读助手,基于自然语言处理技术,帮助用户理解GitHub代码库并提供详细的文档级解答。支持深度研究、交互式图表生成、私有仓库文档创建等功能,适用于开源项目学习、代码审查、团队协作及教育培训等场景。目前已索引超3万仓库,处理超40亿行代码,对开源项目免费开放。

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型,主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作,包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作,实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性,能够展示原始主体的不同动作和表情。此外,VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。