开源 - 智狐AI导航

OuteTTS

OuteTTS是一款基于开源技术的文本到语音（TTS）工具，利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音，具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容，适用于有声读物、智能客服、语音导航等多种应用场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 527 浏览

II

II-Agent 是一个开源的 Agent 框架，通过与大型语言模型（LLM）交互，简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口，适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AI项目与工具 2025年06月11日 67 点赞 0 评论 527 浏览

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型，采用自回归架构，支持高效、高质量的视频生成，具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域，技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法，提升生成效率与稳定性。

AI项目与工具 2025年06月11日 37 点赞 0 评论 526 浏览

ImagePulse

ImagePulse是由魔搭社区推出的开源项目，专注于图像理解和生成模型的数据集支持。它通过将复杂任务拆解为“修改、添加、移除”“风格迁移”“人脸保持”等原子能力，构建专门的数据集，提升模型在特定任务上的性能。项目提供开源脚本，支持数据集的生成与扩展，并结合多种技术资源实现多模型协同，适用于艺术创作、视频制作、产品展示等多个领域。

AI项目与工具 2025年06月11日 71 点赞 0 评论 526 浏览

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型，支持多分辨率和多时长的视频生成，具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成，旨在降低动漫和游戏内容的开发周期和成本。目前，Ruyi-Mini-7B版本已开源。

AI项目与工具 2025年06月12日 17 点赞 0 评论 525 浏览

RAGFlow是一个开源的RAG（Retrieval-Augmented Generation）引擎，通过深度学习模型解析和理解文档内容，并增强生成能力。它提供了多种功能，包括自动化工作流、包管理、安全漏洞检测与修复、即时开发环境、AI辅助代码编写以及代码审查。RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制、多模态处理、上下文融合和优化算法。该工具适用于内容创作辅助、数据摘

AI项目与工具 2025年06月12日 10 点赞 0 评论 525 浏览

Anime gf

一个本地且开源的CharacterAI替代工具，提供了一个用户友好的界面，允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色，让每个虚拟角色都有自己的独特个性和语言风格。

AI写作对话 2025年06月05日 56 点赞 0 评论 523 浏览

VideoRAG

VideoRAG是一种基于检索增强生成（RAG）技术的工具，旨在提升长视频的理解能力。它通过提取视频中的多模态信息（如OCR、ASR和对象检测），并将其与视频帧和用户查询结合，增强大型视频语言模型的处理效果。该技术轻量高效，易于集成，适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 523 浏览

DeepSeek Artifacts

DeepSeek Artifacts是一款基于AI的前端开发工具，能够自动生成React和Tailwind CSS代码，同时支持构建开放的前端代码数据集。它提供沙盒环境、项目导出以及快速部署等功能，适用于快速原型开发、教育场景及SEO优化等多种用途，旨在提升前端开发效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 523 浏览

Reactive

一款免费开源的AI简历制作工具，支持OpenAI API集成，提供智能内容优化、语法修正、多语言简历翻译等功能。

招聘求职 2025年06月05日 38 点赞 0 评论 522 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期