AI项目与工具

Insert Anything

Insert Anything是由多所高校联合开发的图像插入框架,支持多种场景下的对象无缝融合,如艺术创作、虚拟试穿和影视特效等。基于大规模数据集训练,具备高分辨率输出与语义一致性保障。用户可通过掩码或文本指令实现精准控制,适用于创意设计与数字内容生成领域。

Hello History

Hello History是一款基于AI技术的历史教育平台,通过模拟历史人物对话的形式,为用户提供沉浸式学习体验。它支持多领域历史人物互动,涵盖政治、经济、文化等领域,并具备个性化调整和教育辅助功能,旨在增强学生对历史的兴趣与理解,同时保护用户隐私。

FP Video

FP Video是一款基于人工智能技术的图像编辑工具,提供包括AI绘画、照片修复、发型变换、卡通化在内的多项创意功能。它能够帮助用户修复旧照片、调整照片风格、尝试虚拟发型,并通过智能算法实现背景替换和物体消除等操作,适用于个人美化、艺术创作及社交媒体内容制作等多个场景。

SynClub

SynClub是一款基于AI技术的社交应用,允许用户创建并定制个性化的AI角色,实现情感陪伴与互动交流。该工具支持文字和语音对话,具备自然语言处理能力,能根据用户行为进行学习与适应,提供更精准的互动体验。适用于情感支持、社交训练、兴趣交流及语言学习等多场景,注重用户隐私与安全感。

Webdone

Webdone 是一款基于人工智能的网站构建平台,支持用户通过简单描述快速生成专业落地页和网站,无需编程或设计技能。其提供拖拽式编辑器和 Next.js 开发环境,支持高度定制化与性能优化,适用于初创企业、开发者、自由职业者及教育机构等多种场景,助力高效建站与内容管理。

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架,专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标,采用解耦评测与推理的设计,提供统一的评测流程,集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

Trag

Trag是一款基于AI的代码审查工具,支持用户通过纯英文规则快速审查代码。它能够将团队的编码经验转化为可执行规则,实现自动化审查,提升代码质量和一致性。Trag还支持实时审查、精确匹配规则、简化配置流程,并能融入CI/CD流程,适用于团队协作和知识传承。

Magma

Magma是微软研究院开发的多模态AI基础模型,具备理解与执行多模态任务的能力,覆盖数字与物理环境。它融合语言、空间与时间智能,支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练,Magma在零样本和微调设置下表现优异,适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

DreamVideo

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架,能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块,这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

DreaMoving

DreaMoving是一个基于扩散模型的人类视频生成框架,由阿里巴巴集团研究团队开发。该框架通过视频控制网络(Video ControlNet)和内容引导器(Content Guider)实现对人物动作和外观的精确控制,允许用户通过文本或图像提示生成个性化视频内容。其主要功能包括定制化视频生成、高度可控性、身份保持、多样化的输入方式以及易于使用的架构设计。DreaMoving广泛应用于影视制作、游