模型 - 智狐AI导航

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 320 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 320 浏览

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具，能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡，支持零样本学习和多轮编辑操作，确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域，提供从简单调整到复杂创意的全面解决方案。

AI项目与工具 2025年06月12日 27 点赞 0 评论 320 浏览

FigureToCartoon

FigureToCartoon是一个可以将您喜爱的照片即时转换为漫画、3D、素描、艺术或自由手绘风格卡通图片的在线工具。

Ai绘画生成 2025年06月05日 22 点赞 0 评论 319 浏览

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

Ai开源项目 2025年06月05日 33 点赞 0 评论 319 浏览

Llama Nemotron

Llama Nemotron是NVIDIA推出的推理模型系列，具备强大的复杂推理、多任务处理和高效对话能力，适用于企业级AI代理应用。模型基于Llama架构优化，采用神经架构搜索与知识蒸馏技术，提升计算效率。包含Nano、Super和Ultra三种版本，分别面向边缘设备、数据中心和高性能计算场景。广泛应用于科研、客服、医疗、物流和金融等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 318 浏览