AI项目与工具

BAG

BAG是一项由香港中文大学与腾讯联合研发的3D可穿戴资产生成技术,结合多视图图像扩散模型与控制网络,根据人体形状和姿态信息生成高质量的服装和配饰。该技术具备高效适配、多样化生成和物理模拟优化等特点,广泛应用于虚拟试衣、游戏开发、VR/AR及时尚设计等领域,有效提升用户体验与设计效率。

Piczoo

Piczoo是一款多功能图片编辑工具,具备智能拼图、滤镜相机、艺术字体及贴纸等功能,支持用户轻松美化图片并分享至社交平台,广泛应用于社交媒体分享、旅行记录、美食展示和个人生活点滴记录等多个场景。

MagicTailor

MagicTailor 是一款基于 DM-Deg 和 DS-Bal 技术的新型 AI 工具,支持组件可控的个性化图像生成。它能够动态干扰不需要的视觉语义,平衡概念与组件的学习,从而显著提升生成图像的质量和控制精度。MagicTailor 的核心功能包括组件可控个性化、动态掩码退化、双流平衡、解耦生成及多组件控制,适用于广告、游戏、电影制作等多个领域。

歌词爆改机

歌词爆改机是一款利用AI技术的小程序,允许用户通过简单操作快速改编歌曲歌词,生成个性化音乐内容。它支持多种风格的歌词创作,包括多版本迭代,并可通过平台合成功能实现歌词与旋律的无缝融合。凭借强大的万亿参数语言大模型,该工具不仅提升了创作效率,还为个人娱乐、教育学习及商业用途等场景提供了创新解决方案。

Granite 3.2

Granite 3.2是IBM推出的开源多模态AI模型系列,具备强大的推理、视觉理解和预测能力。其核心功能包括链式推理、多模态融合、稀疏嵌入和时间序列预测,适用于复杂任务自动化、文档理解、安全监控等领域。Granite 3.2通过优化资源利用和安全性设计,提升了模型性能与实用性。

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具,可根据文本生成Live2D格式的2D卡通角色,具备文本解析、外观生成、动画增强等功能。支持多语言输入,适用于游戏、影视、教育等多个场景,提升角色设计效率与表现力。

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型,通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术,实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展,并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

DeepSeek Engineer

DeepSeek Engineer 是一款基于命令行的 AI 编程辅助工具,集成 DeepSeek API 提供文件操作功能。它通过 Pydantic 实现类型安全,支持 JSON 格式输出,可读取、创建和编辑本地文件,适用于代码审查、文档生成、实时协作和自动化测试等多种应用场景。

Polymet

Polymet是一款基于AI的产品设计平台,支持用户通过描述需求或上传图片快速生成原型,并提供可直接部署的代码输出。它与Figma等工具无缝集成,具备强大的编辑与迭代能力,适用于产品开发、设计迭代、跨部门协作以及教育等领域,助力团队高效完成创意到产品的转化过程。

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法,专注于提升AI生成视频的质量,特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化,无需额外训练即可高效提升视频效果,适用于视频创作、学术研究、在线平台等多个领域。