开源 - 智狐AI导航

ScreenToGif

国外免费开源小巧实用的Gif动画录制工具

直播录屏 2025年06月05日 18 点赞 0 评论 743 浏览

量子位

量子位，一家专注于人工智能与前沿科技领域的产业服务平台，追踪人工智能新趋势，报道科技行业新突破。

媒体资讯 2025年06月05日 40 点赞 0 评论 743 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 744 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 745 浏览

谛韵DiffRhythm

DiffRhythm（谛韵）是一款由西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型技术，能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示，即可快速获得高质量音乐作品。其支持多语言输入，具备歌词对齐、风格定制、非自回归生成等技术优势，广泛应用于音乐创作、影视配乐、教育及个人创作等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 746 浏览

CodeGeeX

CodeGeeX是一款基于大模型的全能的智能编程助手。它可以实现代码的生成与补全、自动添加注释、代码翻译以及智能问答等功能，能够帮助开发者显著提高工作效率。

Ai编程建站 2025年06月05日 94 点赞 0 评论 746 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 747 浏览

Rasa

一个开源的AI机器学习框架，专注于构建自然语言对话系统，如聊天机器人和语音助手，Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。

Ai开源项目 2025年06月05日 50 点赞 0 评论 748 浏览

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具，支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术，提供自定义分辨率和生成步骤功能，适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发，具备良好的可扩展性和可观察性。

AI项目与工具 2025年06月12日 19 点赞 0 评论 748 浏览

LiberSonora

一个基于AI的、开源有声书工具集，LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能，并且支持 GPU 加速、批量离线处理。

Ai开源项目 2025年06月05日 65 点赞 0 评论 749 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期