AI

DualPipe

DualPipe是由DeepSeek开发的开源双向流水线并行技术,通过将前向和反向计算分离为独立管道并行执行,显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠,降低内存峰值,提高资源利用率,并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具,用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制,提升GPU利用率和训练效率。支持多层MoE模型,减少通信开销,适应不同场景需求。

麦琪的花园

《麦琪的花园》是一款融合AI技术与沙盒玩法的冒险游戏,玩家可创建个性化AI伙伴并与之互动,同时建设营地、探索魔法大陆。游戏支持多语言对话和语音合成,提供沉浸式社交体验,适合沙盒、二次元及AI技术爱好者。

Profiling Data

Profiling Data是DeepSeek开发的开源性能分析工具,基于PyTorch Profiler收集程序运行数据,用于优化深度学习模型的训练和推理效率。它支持可视化分析,可定位性能瓶颈、分析资源利用情况、优化通信策略,并适用于分布式系统调优。通过提供详细的运行指标,帮助开发者提升计算与通信效率,实现更高效的系统性能。

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型,擅长处理图像与文本信息,具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异,支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术,提升推理准确性与可解释性,适用于科研、教育、医疗及自动驾驶等场景。

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统,专注于中文语音合成,支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法,结合汉字与拼音,提升发音准确性。系统具备零样本语音克隆能力,音质优秀,广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富,性能指标优异,包括低字词错误率、高扬声器相似性和高主观音质评分。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台,提供文本转语音、声音克隆、视频翻译、变声等多种功能,支持多语言及多音色转换。平台具备高精度的语音生成能力,可应用于内容创作、视频制作、教育及娱乐等领域,提升内容表现力与国际化传播效率。

a0.dev

a0.dev 是一款基于 AI 技术的 React Native 开发平台,可通过自然语言输入生成完整的应用代码,涵盖前端界面、状态管理、路由配置和后端云函数。支持组件级控制、云端开发、自动配置等功能,显著提升开发效率,适用于创意验证、MVP 构建和企业技术探索。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。