GPU

VideoProc Converter AI

一款全面的视频处理软件,允许用户增强、转换、编辑、压缩、下载和录制视频和图像。

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具,用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制,提升GPU利用率和训练效率。支持多层MoE模型,减少通信开销,适应不同场景需求。

LitServe

LitServe是一款基于FastAPI的高性能AI模型部署引擎,专为企业级AI服务设计。它支持批处理、流式处理和GPU自动扩展,简化了模型部署流程。LitServe易于安装和使用,提供灵活的API定义和强大的服务器控制能力。它兼容多种机器学习框架,具备自动扩展和身份验证等高级特性,适用于机器学习模型部署、大语言模型服务、视觉模型推理、音频和语音处理及自然语言处理等多个领域。

欧派算力云

欧派算力云是一家提供AI算力服务的平台,主要功能包括大模型API接口、GPU容器实例和Serverless服务。其核心技术涵盖分布式算力网络与自研推理加速引擎,显著提升模型推理性能并降低成本。平台支持多模态模型调用,适用于AI推理、训练、云渲染及元宇宙等场景,提供灵活计费与自动化管理功能,助力企业高效部署AI应用。

Mooncake

Mooncake是一个以KVCache为中心的分布式大模型推理架构,由Kimi联合清华大学等机构开源。它通过分离预填充和解码阶段,有效利用GPU集群的其他资源,显著提升推理吞吐量,降低算力消耗,同时保持低延迟。Mooncake支持长上下文处理、负载均衡及过载管理,适用于多种应用场景,包括自然语言处理、语音识别、搜索引擎优化等,推动大模型技术的高效应用。

NobodyWho

NobodyWho是一款专为Godot游戏引擎设计的AI插件,支持本地运行大型语言模型(LLM),提供高效、安全的互动叙事功能。其核心特性包括本地化处理、GPU加速、多上下文支持、流式输出、采样器调节、语义嵌入、工具调用及记忆功能。适用于互动小说、动态对话系统及多线叙事等场景,帮助开发者构建更真实、灵活的游戏内容。

novita.ai

Novita.ai是一个综合性的AI云服务平台,提供模型API、无服务器计算、GPU实例等服务。它集成了阿里巴巴的AnimateAnyone项目,支持静态图像动态化,并提供超过10,000个预训练模型,广泛应用于图像生成、动画制作等领域。其主要功能包括模型API支持、无服务器计算、GPU实例租赁、自定义模型添加以及高质量动画生成,适用于娱乐、教育、电商等多个行业。

RightNow AI

RightNow AI 是一款专注于 CUDA 代码优化的 AI 工具,能够自动分析并提升 GPU 性能。它支持多种 NVIDIA GPU 架构,提供无服务器的性能分析服务,并允许用户通过自然语言指令生成高性能代码。适用于模型训练、科学计算、金融建模等多个领域,显著降低 GPU 编程门槛,提升计算效率。