人工智能

分离人声AI

移除人声并隔离用强大的人工智能算法将声音从音乐中分离出来

Getfloorplan

Getfloorplan 可随时创建 2D、3D 平面图和 360° 虚拟游览。使用我们的材料,您的普通房源可以变成您客户的梦想之家图片

RandomX.AI

一个免费的AI驱动的中文名字生成器,专为创建真实的中文名字而设计。用户可以根据性别、名字风格和灵感来源进行定制,将语言专业知识与创意天赋相结合,确保生成的名字符合个人需求。

FaceSwapEasy

免费AI换脸 AI写真,AI肖像,编辑照片,提供性别交换、发型、卡通效果、有趣的装扮,来自最新的专业AI算法。

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。

Sparkify

Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。其多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域,提升理解效率和传播效果。目前处于内测阶段,可通过官网加入等候列表。

Vocol.Ai语音转文本神器

Vocol.Ai语音转文本神器,一个一体化语音协作平台,它使用人工智能将语音高精度地转换为文本并分享可操作的见解。它具有多种语言转录功能。

原创猫

原创猫致力于构建人人皆可原创,人人都是创作者的经济社区。

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型,通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持,适用于虚拟游戏、VR/AR、自动驾驶等多个领域,具备高度真实性和可扩展性。

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。