开源

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

Hugeicons

一个庞大的图标资源库,提供超过36,000个精美图标,适用于SaaS、网站、印刷等现代界面。它为开发者和设计师提供了丰富的选择,支持多种风格,包括描边、双色、实心等。

EmojiGen

EmojiGen是一个开源的表情符号生成器。用户只需要在输入框中输入一个词或短语,EmojiGen就会立即生成相关的表情符号。

DL4J

DL4J开源的使用JVM部署和训练...

DeerFlow

DeerFlow 是字节跳动推出的开源研究框架,结合语言模型与多种工具,支持高效完成复杂研究任务。具备多Agent架构,支持自然语言交互与智能协作,适用于研究报告、播客、演示文稿等内容生成。支持多种语言模型和外部工具集成,提供灵活配置与扩展能力,广泛应用于学术、市场、教育及个人知识管理等领域。

FlowiseAI

FlowiseAI 是一款开源的低代码 AI 工具,允许用户通过可视化拖拽方式快速构建大型语言模型应用。支持多模型集成、对话记忆、API 接口等功能,适用于聊天机器人、工作流自动化和文档问答等多种场景。提供本地、Docker 和云平台部署方式,适合开发者和企业用户进行灵活应用开发。

Diffree

一款通过AI技术可根据文本描述智能地向图像中添加新对象,Diffree让你只需一句话就可以为您的图片添加新元素,不需要复杂的操作就可以体验简单高效的图像编辑工具。

LMEval

LMEval是谷歌推出的开源框架,用于简化大型语言模型(LLMs)的跨提供商评估。它支持多模态(文本、图像、代码)和多指标评估,兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎,节省时间和计算资源,并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面,帮助用户分析模型性能并直观比较不同模型的优缺点。

Midscene.js

Midscene.js 是一款基于 AI 的自动化 SDK,利用自然语言处理技术简化 UI 测试流程。它支持用户通过自然语言描述操作步骤,自动执行动作、查询数据、断言页面状态,并生成可视化报告。Midscene.js 可无缝集成到现有项目中,适用于自动化测试、数据抓取、性能监控等多种场景。

PearAI

PearAI是一款开源的AI辅助代码编辑器,基于VSCode开发。它集成了自然语言处理、机器学习模型以及代码分析技术,能够帮助开发者快速生成代码、理解现有代码逻辑并进行有效维护。PearAI不仅支持本地代码存储以保障数据安全,还提供了友好的用户界面与高效的开发流程。其应用场景广泛,包括但不限于快速原型开发、团队协作、代码审查以及编程教育等。