Perception Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。 AI项目与工具 2025年06月12日 20 点赞 0 评论 480 浏览
Sparkify Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。其多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域,提升理解效率和传播效果。目前处于内测阶段,可通过官网加入等候列表。 AI项目与工具 2025年06月11日 24 点赞 0 评论 479 浏览
Vocol.Ai语音转文本神器 Vocol.Ai语音转文本神器,一个一体化语音协作平台,它使用人工智能将语音高精度地转换为文本并分享可操作的见解。它具有多种语言转录功能。 Ai语音工具 2025年06月05日 20 点赞 0 评论 479 浏览
SignGemma SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。 AI项目与工具 2025年06月11日 24 点赞 0 评论 478 浏览
Getfloorplan Getfloorplan 可随时创建 2D、3D 平面图和 360° 虚拟游览。使用我们的材料,您的普通房源可以变成您客户的梦想之家图片 生活创意 1970年01月01日 0 点赞 0 评论 477 浏览
RandomX.AI 一个免费的AI驱动的中文名字生成器,专为创建真实的中文名字而设计。用户可以根据性别、名字风格和灵感来源进行定制,将语言专业知识与创意天赋相结合,确保生成的名字符合个人需求。 生活创意 2025年06月05日 61 点赞 0 评论 477 浏览
FaceSwapEasy 免费AI换脸 AI写真,AI肖像,编辑照片,提供性别交换、发型、卡通效果、有趣的装扮,来自最新的专业AI算法。 Ai图片处理 2025年06月05日 55 点赞 0 评论 477 浏览
MeshifAI MeshifAI 是一款 AI 驱动的文本转 3D 模型生成工具,支持创建基础模型和 PBR 纹理模型,输出格式为 .glb,兼容多种 3D 软件和应用。用户可通过参数调整模型的创意性与质量,适合游戏开发、应用设计及网站展示等场景。 AI项目与工具 2025年06月12日 86 点赞 0 评论 475 浏览