开源

Flame

Flame是一款开源的多模态AI模型,能够将UI设计截图转换为高质量的现代前端代码。它支持React等主流框架,具备动态交互、组件化开发和高代码质量的特点。Flame通过创新的数据合成方法提升代码多样性与准确性,适用于快速原型开发、提升开发效率及辅助学习等多种场景。其训练数据、模型和测试集均已开源,为前端开发提供了高效的工具支持。

Dialogue.moe

一个用于动漫台词对白搜索的在线搜索引擎,Dialogue收录了大量的动画和漫画的经典台词,可以通过搜索引擎来查找自己喜欢的作品,也可以通过浏览分类来查找相应的作品。

SFR-RAG

先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...

Phidata

Phidata 是一个开源的 AI 智能体框架,支持开发者构建具备记忆、知识和推理能力的智能代理系统。它提供多代理协作、用户界面交互、性能监控优化等功能,并广泛应用于网络搜索、财务分析、数据科学和自动化任务等领域。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具,提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑(如添加、删除和颜色调整),以及多种定制化工具(如添加笔刷、减去笔刷和颜色笔刷)。此外,它还具备实时意图预测和参数调整能力,支持多模态大语言模型和扩散模型的协作,适用于个人娱乐、教育、专业设计及商业应用等多个领域。

万相首尾帧模型

万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源视频生成工具,基于DiT架构和交叉注意力机制,可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效,适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能,且提供GitHub和HuggingFace开源资源供用户使用。

Lepton Search

Lepton Search 是一个基于对话式AI的搜索引擎,由前阿里巴巴技术副总裁及AI科学家贾扬清创立的Lepton AI应用构建平台开源。它通过集成大语言模型和调用Bing搜索API,实现了自然语言交互和精准搜索。其开源特性、对话式搜索能力、内置大语言模型支持、搜索引擎集成、可定制化用户界面以及搜索结果的高效管理,使其成为一款功能全面、灵活且高效的AI工具。

Hunyuan3D 2.0

Hunyuan3D 2.0是腾讯推出的3D资产生成系统,支持从文本和图像生成高分辨率3D模型。系统采用两阶段生成流程,包含几何生成与纹理合成两个核心模块,具备高精度、高质量输出能力。支持多平台使用,涵盖游戏开发、UGC创作、电商、工业设计等多个应用场景,并提供多个开源模型供研究与开发使用。

XVERSE

XVERSE-MoE-A36B是一款由中国元象公司开发的先进MoE(混合专家模型)开源大模型。该模型具备2550亿总参数和360亿激活参数,性能卓越,训练时间缩短30%,推理性能提升100%。它采用前沿的MoE架构,通过稀疏激活、专家网络和门控机制等技术,实现了高效性能和低成本部署。适用于自然语言处理、内容创作、智能客服、教育辅助、信息检索及数据分析等多个领域。