AI - 智狐AI导航

RoboOS

RoboOS是智源研究院推出的跨本体具身大小脑协作框架，采用“大脑-小脑”分层架构，支持多类型机器人协同作业。具身大脑负责全局感知与决策，小脑技能库实现精准执行，跨机器人数据中枢确保信息共享与状态同步。系统具备即插即用、端云一体化、低延迟响应等优势，广泛应用于工业、物流、制造和服务机器人等领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 763 浏览

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型，支持1080p高清视频生成，具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异，包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构，融合文本、图像和视频信息，适用于影视制作、广告宣传及动画创作等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 654 浏览

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型，专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术，实现对光照、阴影和遮挡关系的精准控制。支持多任务学习，提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域，具备高效、真实的图像编辑能力。

AI项目与工具 2025年06月12日 91 点赞 0 评论 540 浏览

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术，支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域，提供高效且逼真的视觉内容生成能力。

AI项目与工具 2025年06月12日 51 点赞 0 评论 565 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 761 浏览

Vibe Draw

Vibe Draw是一款开源AI 3D建模工具，能将2D草图自动转换为高质量3D模型，并支持文本提示优化和模型编辑。用户可一键导出为glTF格式，适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术，具备高效的实时交互与异步处理能力。

AI项目与工具 2025年06月12日 68 点赞 0 评论 580 浏览

OmniSQL

OmniSQL 是一款开源的文本到 SQL 转换工具，能将自然语言问题精准转化为 SQL 查询语句。它基于大规模数据集 SynSQL-2.5M 进行训练，涵盖 250 万条样本，覆盖 16,000 余个跨领域数据库。支持多种复杂查询类型，提供思维链推理过程，并提供 7B、14B 和 32B 三种模型版本。适用于企业数据分析、教育及跨领域应用，提升数据访问效率与学习体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 736 浏览

Move AI

Move AI 是一款基于AI和计算机视觉的无标记动作捕捉工具，可将普通摄像头拍摄的2D视频转换为高精度3D运动数据。支持实时追踪、多摄像头配置及多种格式导出，适用于影视、游戏、体育分析、VR/AR等领域，提供高效、低成本的解决方案。

AI项目与工具 2025年06月12日 35 点赞 0 评论 729 浏览

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统，采用轻量级扩散模型，支持中英文及混合语音合成，具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模，可快速生成高质量语音，适用于教育、内容制作、语音交互等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 725 浏览

AutoGLM沉思

AutoGLM沉思是一款由智谱推出的AI代理工具，支持深度研究与多步骤推理，能自主调用浏览器进行信息检索与网页操作。适用于市场分析、技术比较、产品推荐、旅游规划及教育辅助等场景，完全免费且不限量使用，突破了传统API限制，覆盖多平台信息源。

AI项目与工具 2025年06月12日 25 点赞 0 评论 607 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期