增强 - 智狐AI导航

Hunyuan

Hunyuan-Large是一款由腾讯开发的大规模混合专家（MoE）模型，以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构，擅长处理长文本任务，同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制，Hunyuan-Large实现了高效的推理吞吐量，并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

AI项目与工具 2025年06月12日 69 点赞 0 评论 755 浏览

Fast GraphRAG

Fast GraphRAG是微软推出的一款高效知识图谱检索框架，结合了RAG技术和知识图谱，用于提升大型语言模型在处理私有数据和复杂数据集时的表现。它具备可解释性、高精度、动态数据支持及实时更新能力，适用于多种应用场景如智能问答、企业知识管理、个性化推荐、医疗健康信息检索以及金融分析等领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 740 浏览

DeOldify

DeOldify是一款利用深度学习技术的AI工具，可为黑白照片和视频上色并增强其视觉效果。它支持静态图像转动态视频、跨时代人物模拟等功能，适用于家庭相册修复、历史档案管理、教育演示及影视制作等多个场景，帮助用户更生动地记录和分享历史记忆。

AI项目与工具 2025年06月12日 88 点赞 0 评论 730 浏览

TrustGraph Engine

TrustGraph Engine 是一款面向知识智能体开发的平台，提供包括批量文档摄入、自动化知识图谱构建、模型无关的 LLM 集成等在内的多项功能。它通过结合知识图谱和向量数据库增强检索能力，并具备企业级可靠性、可扩展性、模块化设计及数据隐私保护特性，适用于多种应用场景，包括企业数据分析、学术研究、法律事务、金融分析、IT 开发和网络安全等。

AI项目与工具 2025年06月12日 80 点赞 0 评论 780 浏览

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具，由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景，支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术，Wonder Animation在3D空间中重建场景，并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

AI项目与工具 2025年06月12日 43 点赞 0 评论 669 浏览

PromptFix

PromptFix是一款基于扩散模型的开源AI图像修复工具，支持多种图像处理任务，如上色、物体移除、去雾、去模糊等。它通过20步去噪过程精确修复图像缺陷，同时保持图像结构完整性和泛化能力。PromptFix具备高频细节保护、辅助提示适配器、零样本学习能力和大规模数据集构建等特点，适用于个人照片编辑、专业摄影、数字艺术创作、媒体广告及电影制作等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 580 浏览

DriveDreamer4D

DriveDreamer4D是一个专注于提升自动驾驶场景4D重建质量的框架，通过整合世界模型先验知识生成新的轨迹视频，同时确保时空一致性，从而增强训练数据集的多样性和真实性。它具备4D场景重建、新轨迹视频合成、时空一致性控制以及提升渲染质量等功能，广泛应用于自动驾驶系统开发、闭环仿真测试及传感器数据模拟等领域。 ---

AI项目与工具 2025年06月12日 83 点赞 0 评论 770 浏览

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架，通过Fast LAyered Gaussian Surfels（FLAGS）表示法与引导深度扩散技术，从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互，生成包括城市、自然、幻想等多种风格的3D环境，并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 472 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 941 浏览

FakeShield

FakeShield是一款由北京大学研发的多模态大型语言模型框架，主要用于检测和定位图像篡改。它通过结合视觉与文本信息，生成篡改区域掩码并提供详细的判断依据。其核心模块包括领域标签引导的检测模块和多模态定位模块，支持多种篡改技术的分析，具有较高的准确性与可解释性。FakeShield广泛应用于社交媒体内容审核、法律取证、新闻媒体真实性验证以及版权保护等领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 720 浏览

增强

首页

增强

列表

默认

浏览次数

发布日期