开源 - 智狐AI导航

Lobe Vidol

Lobe Vidol是一个开源的数字人创作平台，支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能，还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术，Lobe Vidol实现了语音与文本的双向转换，提供沉浸式用户体验。 ---

AI项目与工具 2025年06月12日 60 点赞 0 评论 851 浏览

流畅阅读

FluentRead 是一款开源的浏览器翻译插件，基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示，具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读，兼容主流浏览器，保障用户数据安全。其开源特性增强了透明度与灵活性，满足多样化翻译需求。

AI项目与工具 2025年06月12日 68 点赞 0 评论 851 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 851 浏览

FreeMind

FreeMind是一款基于java的免费的脑图(mind mapping)制作与管理软件。支持的平台：Windows、Linux和Mac多种操作系统。

思维导图 2025年06月05日 20 点赞 0 评论 850 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 2026年06月21日 0 点赞 0 评论 849 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 849 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 848 浏览

LOKI

LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准，用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题，涵盖26个子类别，支持多层次标注和细粒度异常注释，并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现，揭示了这些模型在合成数据检测任务中的优势与不足。

AI项目与工具 2025年06月12日 50 点赞 0 评论 848 浏览

Fourier N1

Fourier N1是一款由傅利叶推出的开源人形机器人，具备23个自由度，可完成复杂动作如单足站立、坡道通行和楼梯攀爬。搭载自研控制系统和FSA 2.0执行器，支持高速稳定运行。支持多模态交互，适用于教学、康复辅助、物流搬运、家务服务及灾难救援等领域，提供全面的开源资源以支持开发与研究。

AI项目与工具 2025年06月11日 55 点赞 0 评论 846 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 845 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期