Wonder Journey 只需输入一段文字描述或上传一张图片,WonderJourney就能从任意指定的地点开始,生成一连串既多样化又连贯的3D场景。 3D&游戏 2025年06月05日 70 点赞 0 评论 279 浏览
MSQA MSQA是一个包含251,000个问答对的大规模多模态情境推理数据集,支持文本、图像和点云等多种数据形式,旨在提升具身AI在三维场景中的理解与推理能力。通过设计MSQA和MSNN两个基准测试任务,该工具不仅能够评估模型性能,还能促进具身AI和3D场景理解领域的研究进展。同时,它为开发更强大的情境推理模型提供了丰富的预训练资源。 AI项目与工具 2025年06月12日 80 点赞 0 评论 279 浏览
Poify AI 快手推出的一款专为电商设计的高效AI作图工具,和普通AI工具一样,Poify具备“文生图”“图生图”功能,还支持AI戴饰品、AI试戴、模特试衣等功能。 Ai绘画生成 2025年06月05日 19 点赞 0 评论 279 浏览
Vinteo AI 一款AI电商产品摄影和可视化产品设计工具,可帮助零售商、制造商等快速生成专业的电商产品视觉图,2 分钟内完成创作,具备背景移除、颜色校正、场景定制等功能。 Ai图片处理 2025年06月05日 69 点赞 0 评论 278 浏览
Rope Rope是一款基于深度学习的开源AI换脸工具,利用insightface的inswapper_128模型提供直观的图形界面,支持图片和视频换脸。它具备强大的遮罩功能和参数调节选项,支持超分辨率算法,广泛应用于影视制作、游戏开发、虚拟现实等领域。 AI项目与工具 2025年06月12日 55 点赞 0 评论 276 浏览
CAT4D CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具,它利用多视图视频扩散模型,从单目视频中生成动态3D(4D)场景表示。该工具可以合成新视图、重建动态3D模型,并支持独立控制相机视点和场景动态,适用于电影制作、游戏开发、虚拟现实等多种领域。 AI项目与工具 2025年06月12日 72 点赞 0 评论 274 浏览
BlenderMCP BlenderMCP 是一款将 Blender 与 Claude AI 集成的工具,通过 socket 服务器实现双向通信,支持 3D 对象操作、材质控制、场景信息获取及 Python 代码执行。用户可通过自然语言指令高效完成建模任务,提升创作效率。工具由插件和服务器组成,采用 JSON 协议进行数据交互,适用于快速建模、场景优化及教育辅助等场景。 AI项目与工具 2025年06月11日 65 点赞 0 评论 274 浏览
StableAnimator StableAnimator是一款由复旦大学、微软亚洲研究院、虎牙公司及卡内基梅隆大学联合开发的高质量身份保持视频生成框架。它能够根据参考图像和姿态序列,直接生成高保真度、身份一致的视频内容,无需后处理工具。框架集成了图像与面部嵌入计算、全局内容感知面部编码器、分布感知ID适配器以及Hamilton-Jacobi-Bellman方程优化技术,确保生成视频的流畅性和真实性。StableAnimato AI项目与工具 2025年06月12日 14 点赞 0 评论 270 浏览
咕噜口语SpeakGuru SpeakGuru是一款由清华团队开发的AI口语练习工具,通过与虚拟人物对话提升英语口语能力。支持中文辅助、语法优化、发音评估等功能,涵盖100+真实场景,适配不同英语水平用户。内置错题本、词汇统计、个性化学习计划等模块,帮助用户全面掌握学习进度。已接入DeepSeek R1模型,提升智能化学习体验。 AI项目与工具 2025年03月17日 78 点赞 0 评论 269 浏览