Concept Lancet Concept Lancet(CoLan)是一种基于潜在空间稀疏分解的图像编辑框架,能够实现零样本、即插即用的精确概念替换、添加与移除。它通过构建视觉概念字典,结合扩散模型生成高质量图像,保持视觉一致性。适用于创意设计、影视制作、游戏开发等多个领域,提供高效的图像编辑解决方案。 AI项目与工具 2025年06月11日 28 点赞 0 评论 620 浏览
秘塔科技 上海秘塔网络科技有限公司是人工智能领域的一家新锐科技公司,致力于将重复脑力劳动AI化,以AI为杠杆撬动专业场景的百倍生产力提升。 Ai科技公司 2025年06月05日 56 点赞 0 评论 620 浏览
StockGPT 一款AI驱动的搜索工具,包含所有标准普尔 500 指数和纳斯达克公司的收益发布、财务报告和其他基本信息的知识。它允许用户询问摘要、分析不同时间范围内的公司绩效、获得有关产品更新的具体答案等等。 财经投资 2025年06月05日 70 点赞 0 评论 620 浏览
AgiBot Digital World AgiBot Digital World 是一款基于 NVIDIA Isaac-Sim 的高保真机器人仿真框架,支持多模态大模型驱动的任务与场景自动生成,具备真实感强的视觉与物理模拟能力。其提供多样化专家轨迹生成、域随机化与数据增强功能,助力机器人技能训练与算法优化,并开源了包含多种场景和技能的数据集,适用于工业自动化、服务机器人开发及人工智能研究等领域。 AI项目与工具 2025年06月12日 63 点赞 0 评论 619 浏览
北京大学人工智能研究院 北京大学人工智能研究院(Institute for Artificial Intelligence, Peking University)于2019年4月27日宣布成立,作为学校直属的独立实体机构,是统筹全校相关资源、建设世界一流... 教育学习 1970年01月01日 0 点赞 0 评论 618 浏览
Gemini Live Gemini Live是一款由谷歌开发的智能语音助手,拥有自然语言理解和多模态识别能力,支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外,Gemini Live还与谷歌的原生应用深度集成,提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。 AI项目与工具 2025年06月12日 13 点赞 0 评论 617 浏览
HumanOmni HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。 AI项目与工具 2025年06月12日 92 点赞 0 评论 617 浏览
OmniSync OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。 AI项目与工具 2025年06月11日 27 点赞 0 评论 617 浏览