开源

字玩FontPlayer

一款用于生成个人字库、图标字库的开源字体创意工具,通过字玩FontPlayer,用户可以自由绘制字形,设计个性化字体并能导出为OTF文件。

PDDON

Pddon,一款开源免费的多功能专业在线画图工具。提供低代码和 AI 智能辅助工具。

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型,由摩尔线程推出。它能够进行中文和英文的语音识别,并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数,接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式,具有强大的多语言处理能力和广泛的适用性。

OpenDeepResearcher

OpenDeepResearcher 是一款开源 AI 研究工具,通过迭代搜索和 LLM 驱动的推理,实现自动化信息查询、分析与报告生成。支持异步处理和去重功能,提升效率并减少重复工作。适用于金融、科研、政策等领域,为用户提供高效、低成本的研究解决方案。系统可自动完成从搜索到总结的全过程,广泛应用于文献综述、行业分析、公司研究等场景。

Zero123

一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。

GPT-SoVITS

一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。

AIdea

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架,旨在将静态图像中的角色或人物动态化。它采用扩散模型,结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术,确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用,包括角色动态化、时尚视频合成及人类舞蹈生成,用户可通过GitHub或Hugging Face社区轻松体验。

Qwen2.5

Qwen2.5-Coder是一款开源代码生成模型,覆盖多种规模参数,支持超过40种编程语言,擅长代码生成、推理、修复及多语言支持。其旗舰模型在多项基准测试中表现优异,具备强大的长上下文处理能力和人类偏好对齐特性。适用于日常编程、代码学习、教育、代码审查及自动化测试等场景。

AuraFlow

AuraFlow v0.1是一款由Fal团队开发的开源AI文生图模型,拥有6.8B参数量。该模型通过优化的MMDiT架构提升了计算效率和可扩展性。AuraFlow在生成精确图像方面表现出色,特别是在物体空间构成和色彩表现上具有优势。此外,它采用了最大更新参数化技术,增强了学习率迁移的稳定性。AuraFlow支持文本到图像的生成,适用于艺术创作、媒体内容生成、游戏开发及广告和营销等多种应用场景。