开源工具

流畅阅读

FluentRead 是一款开源的浏览器翻译插件,基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示,具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读,兼容主流浏览器,保障用户数据安全。其开源特性增强了透明度与灵活性,满足多样化翻译需求。

Vanna.AI

一个基于人工智能的Python软件包,只需提出问题即可从去数据库里找到相应的数据,帮助生成Snowflake、BigQuery、Athena和Postgres等数据库的SQL。

COMET

COMET是字节跳动开发的Mixture-of-Experts(MoE)模型优化系统,通过细粒度计算-通信重叠技术和自适应负载分配机制,显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速,具备强鲁棒性与泛化能力,支持多种硬件环境和并行策略,核心代码已开源并可无缝集成至主流训练框架。

FastExcel

FastExcel 是一个基于 Java 的开源 Excel 处理工具,具备高性能读写、流式操作和内存优化等特点。它兼容 EasyExcel 并在此基础上扩展了功能,如读取指定行数和 Excel 转换为 PDF,适用于大规模数据处理场景。FastExcel 提供简单易用的 API 和灵活的数据映射机制,广泛应用于财务报表生成、批量数据导入导出、ERP 系统集成及在线教育等领域。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。

VoiceCanvas

VoiceCanvas 是一款开源的多语言语音合成平台,基于 AI 技术提供高质量文字转语音服务,支持超过 50 种语言。用户可通过上传简短音频实现个性化声音克隆,并集成多种语音服务以保障输出质量。平台适用于内容创作、教育、企业及个人等多种场景,提升语音内容制作效率。

Lumina

Lumina-Image 2.0 是一款开源图像生成模型,基于扩散模型与 Transformer 架构,具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像,支持中英文提示词,并具备强大的复杂提示理解能力。模型支持多种推理求解器,适用于艺术创作、摄影风格图像生成及逻辑推理场景,兼具高效性和灵活性。

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型,拥有 328 亿参数和 16,000 token 上下文支持,以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能,适用于数学、科学、代码生成等多种推理任务。全面开源,提供模型权重、代码和数据集,支持研究与开发扩展。

Awesome

一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。