增强 - 智狐AI导航

Vanna

Vanna 是一款开源的 Python RAG 框架，能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs，采用检索增强生成技术提高查询准确性，同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制，广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 503 浏览

MotionFix

MotionFix是一个开源的3D人体动作编辑工具，采用自然语言描述与条件扩散模型TMED相结合的方式，支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域，为动作编辑提供了灵活性与精确性。

AI项目与工具 2025年06月12日 13 点赞 0 评论 812 浏览

Genie 2

Genie 2是一款由DeepMind开发的大规模基础世界模型，其核心功能包括基于单一图片生成可交互3D游戏世界、模拟物体交互及物理效果、支持多类型动作控制、具备长时间记忆能力以及实时生成新场景内容。该工具不仅适用于智能体训练与评估，还广泛应用于游戏开发、模拟与训练、机器人学习以及虚拟现实和增强现实等领域。

AI项目与工具 2025年06月12日 40 点赞 0 评论 568 浏览

photoeditor

PhotoEditor是一款基于人工智能技术的在线图片编辑工具，支持多种格式的照片编辑，具备智能对象移除、自动图像增强、人像修饰、图像放大和多样化编辑工具等功能。凭借其对像素和上下文的精准分析，能够生成自然且高质量的结果，适用于社交媒体内容创作、电子商务产品图片处理、旅游照片优化和个人相册整理等多种应用场景。 ---

AI项目与工具 2025年06月12日 69 点赞 0 评论 817 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 766 浏览

VISION XL

VISION XL是一款基于潜在扩散模型的视频修复与超分辨率工具，支持视频去模糊、超分辨率提升、视频修复及帧平均等功能。它采用伪批一致性采样、批量一致性反演等技术，显著提高了处理效率和视频质量。VISION XL广泛应用于电影修复、监控视频增强、体育赛事直播等领域，能够满足高质量视频需求。

AI项目与工具 2025年06月12日 84 点赞 0 评论 589 浏览

PicPicAi

PicPicAi是一款集成了多项AI驱动功能的图片编辑工具，支持照片增强、背景移除、物体擦除、老照片修复及黑白照片上色等功能。凭借直观的操作界面和强大的算法支持，它满足了摄影师、社交媒体运营者及内容创作者等群体的专业需求，助力他们快速生成高质量视觉内容。

AI项目与工具 2025年06月12日 12 点赞 0 评论 750 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 620 浏览

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具，通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块，确保生成的音频与视频帧或文本描述时间轴完全对应，适用于影视制作、游戏开发、虚拟现实等多种场景，极大提升了跨模态数据处理的能力和应用效率。

AI项目与工具 2025年06月12日 68 点赞 0 评论 627 浏览

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 655 浏览

增强

首页

增强

列表

默认

浏览次数

发布日期