开源

clone

Clone-Voice是一款基于深度学习的声音克隆工具,支持16种语言的文本转语音及声音风格转换,具有友好的操作界面和较低的硬件要求。它被广泛应用于视频制作、语言学习、有声出版物创作、广告宣传及游戏开发等领域,为用户提供多样化的个性化声音解决方案。

Anus

Anus是一个开源自主智能体项目,支持自然语言指令执行、多代理协作、网络交互、文档处理、代码执行及多模态输入处理。其采用混合架构设计,兼容多种模型和部署方式,提供丰富的工具生态系统,适用于教育、原型开发、任务自动化等多个场景,为开发者和研究人员提供高效、灵活的AI开发平台。

MaxKB

MaxKB是一款开源AI知识库问答系统,支持文档上传、在线文档爬取、文本自动拆分和向量化。它兼容多种大语言模型,包括本地私有和公共模型,提供灵活的工作流引擎和多格式文档支持。MaxKB采用先进的技术如大型预训练语言模型、自动化文档处理、检索增强生成(RAG)技术和向量数据库技术,适用于企业内部知识库、客户服务、教育与培训等多个领域。

Aide

Aide 是一款开源的 AI 辅助编程工具,具备代码注释、代码转换、智能粘贴、批量处理和变量重命名等功能,支持多种 AI 模型。它能够帮助开发者提高代码的可读性、简化跨语言开发、加速设计到代码的转换过程,并提供代码审查建议,从而提升开发效率。 ---

Dialogue.moe

一个用于动漫台词对白搜索的在线搜索引擎,Dialogue收录了大量的动画和漫画的经典台词,可以通过搜索引擎来查找自己喜欢的作品,也可以通过浏览分类来查找相应的作品。

Reflection 70B

Reflection 70B是一款基于Meta的Llama 3.1 70B Instruct构建的开源AI大模型,采用“Reflection-Tuning”技术,能够在生成最终回答前检测并纠正错误,显著提高输出的准确性。该模型特别适用于需要高精度推理的任务,并具备出色的零样本推理能力。用户可以通过引入特殊token,以更结构化的方式与模型交互。此外,Reflection 70B支持通过Huggin

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包,涵盖语音识别(ASR)、语音活动检测(VAD)、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调,并提供预训练模型和易用接口,便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能,广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

MeloTTS

MeloTTS是一个高质量的多语言文本转语音(TTS)库,由MyShell AI开发。该工具支持多种语言的文本转语音任务,包括英语(含不同口音)、西班牙语、法语、中文、日语和韩语,并具备快速的语音合成速度。MeloTTS不仅支持中英混合发音,还易于安装和使用,适用于多种操作系统和环境。用户可以在GitHub和Hugging Face平台上获取和体验MeloTTS。

CogView4

CogView4是一款由智谱推出的开源文生图模型,具有60亿参数,支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异,达到当前开源模型的领先水平。模型具备强大的语义理解能力,尤其在中文文字生成方面表现突出,适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer,并采用显存优化技术提升推理效率。

MAI

MAI-DS-R1 是微软基于 DeepSeek R1 优化的 AI 模型,具备高敏感话题响应能力(99.3%),有害内容风险降低 50%,并保持与原版相同的推理水平。支持多语言输出,适用于国际组织、企业及教育机构。已开源,可用于研究与开发,适用于内容审核、多语言客服、学术研究等多种场景。