开源 - 智狐AI导航

PDF2Audio

PDF2Audio 是一款开源工具，支持将 PDF 文档转换为音频内容，适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等，支持批量处理和多种模板适配，方便用户根据需求生成高质量音频。

AI项目与工具 2025年06月12日 35 点赞 0 评论 839 浏览

FastExcel

FastExcel 是一个基于 Java 的开源 Excel 处理工具，具备高性能读写、流式操作和内存优化等特点。它兼容 EasyExcel 并在此基础上扩展了功能，如读取指定行数和 Excel 转换为 PDF，适用于大规模数据处理场景。FastExcel 提供简单易用的 API 和灵活的数据映射机制，广泛应用于财务报表生成、批量数据导入导出、ERP 系统集成及在线教育等领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 840 浏览

Napkins.dev

Napkins.dev 是一款基于 AI 技术的开源工具，能够将用户上传的截图或线框图快速转化为可运行的网页应用程序。它利用 Meta 的 Llama 系列模型和 Together.ai 的推理服务，支持代码生成、编辑和定制，并具备多主题选择及版本管理功能，适用于快速原型开发、教育学习、初创公司以及 UI/UX 设计验证等场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 840 浏览

AdaCache

AdaCache是一种开源的自适应缓存技术，由Meta开发，用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略，优化视频生成过程中的缓存决策，显著提升生成速度，同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中，并适用于多GPU环境，广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 840 浏览

BabelDOC

BabelDOC是一款专为科学论文翻译设计的开源PDF处理工具，支持双语对照显示，保留原文格式如公式、图表等。兼容多种翻译引擎，支持自定义模型接入，适用于学术、商业和技术文档翻译，提供在线和本地部署方式，保障翻译准确性和排版一致性。

AI项目与工具 2025年06月12日 24 点赞 0 评论 841 浏览

NotesGPT

NotesGPT是一款开源的AI语音笔记工具，具备语音转录、自动总结及任务生成等功能，采用先进技术保障转录准确性与任务生成效率，支持多语言并适配多种使用场景，如会议记录、学术研究及个人备忘等。

AI项目与工具 2025年06月12日 80 点赞 0 评论 841 浏览

YAYI2

中科闻歌研发的一款新一代开源大语言模型，中文名为“雅意”。该模型包含 Base 和 Chat 版本，参数规模达到 30B，基于 Transformer 架构构建。

Ai平台模型 2025年06月05日 11 点赞 0 评论 841 浏览

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具，支持通过简单拖拽操作调整人物头部姿态和面部表情，使静态图像更加生动。其采用深度学习技术，具备高分辨率输出和精确控制能力，适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发，支持本地和Docker部署，便于用户灵活使用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 842 浏览

Open NotebookLM

Open NotebookLM是一个开源工具，能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型，生成自然流畅的对话式音频，并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件，适用于教育、科研、商业分析等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 842 浏览

Circuit Tracer

Circuit Tracer 是 Anthropic 推出的开源工具，用于研究大型语言模型的内部工作机制。它通过生成归因图揭示模型在生成特定输出时的决策路径，帮助研究人员追踪模型的决策过程、可视化特征关系并测试假设。支持多种主流模型如 Gemma 和 Llama，提供交互式可视化界面，便于探索和分析模型行为。其功能包括生成归因图、可视化与交互、模型干预以及支持多种模型。

AI项目与工具 2025年06月11日 95 点赞 0 评论 842 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期