训练 - 智狐AI导航

DualPipe

DualPipe是由DeepSeek开发的开源双向流水线并行技术，通过将前向和反向计算分离为独立管道并行执行，显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠，降低内存峰值，提高资源利用率，并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。

AI项目与工具 2025年06月12日 92 点赞 0 评论 772 浏览

LineArt

LineArt是一种无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征准确转移到设计图纸上，同时保留结构细节。其技术基于模拟人类视觉认知过程，结合艺术经验指导扩散模型，支持工业设计、室内设计、服装设计等多个领域应用。具备高效、高保真和易用性等特点，适用于快速生成逼真效果和优化设计流程。

AI项目与工具 2025年06月12日 34 点赞 0 评论 772 浏览

Imagen

Google AI文字到图像生成模型

Ai平台模型 2026年06月21日 0 点赞 0 评论 774 浏览

CodeSquire.ai

CodeSquire.ai是一款针对数据科学领域的AI编程助手，基于大型语言模型开发，支持代码自动补全、注释转代码、基于库构建函数及自然语言转SQL查询等功能，旨在提升开发者效率与代码质量。它适用于数据预处理、特征工程、模型训练与评估以及数据可视化等多个场景，可无缝嵌入Google Colab、BigQuery和JupyterLab等常用平台。

AI项目与工具 2025年06月12日 54 点赞 0 评论 775 浏览

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集，通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务，如机器翻译和文本分类，旨在增强多语言模型的性能与普适性，并为研究者提供技术验证的工具与资源。

AI项目与工具 2025年06月12日 16 点赞 0 评论 777 浏览

DAMODEL

DAMODEL是一个基于GPU算力的AI开发云平台，支持多种主流AI框架和高性能GPU配置，提供开箱即用的开发环境和便捷的数据管理功能。平台具备可视化操作界面、JupyterLab在线访问及多种预置模型，适用于大模型训练、深度学习、数据科学和图像处理等多种应用场景。

AI项目与工具 2025年06月11日 19 点赞 0 评论 778 浏览

壁仞科技

致力于研发原创性的通用计算体系，建立高效的软硬件平台

创作工具 2026年06月21日 0 点赞 0 评论 780 浏览

3FS

3FS是DeepSeek推出的高性能分布式文件系统，专为AI训练和推理优化。采用SSD与RDMA技术，提供高达6.6 TiB/s的读取吞吐量，支持强一致性及通用文件接口。具备数据准备、加载、检查点和KVCache缓存功能，适用于大规模AI应用。在GraySort测试中表现优异，吞吐量达3.66 TiB/min，KVCache读取峰值达40 GiB/s，适用于多节点计算环境。

AI项目与工具 2025年06月12日 74 点赞 0 评论 781 浏览

Helix

Helix 是 Figure 公司推出的视觉-语言-动作（VLA）模型，专为人形机器人设计，支持对上半身的高精度、高频次控制，频率达 200Hz。它能基于自然语言指令执行未见过的物品操作，具备强大的泛化能力。系统采用端到端训练方式，可在低功耗设备上运行，适用于多机器人协作、家庭服务、工业自动化等多种场景，具有较高的商业化潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 782 浏览

Time

Time-MoE是一种基于混合专家架构的时间序列预测模型，通过稀疏激活机制提高计算效率并降低成本。该模型支持任意长度的输入和输出，能够在多个领域实现高精度的时序预测。经过大规模数据集Time-300B的预训练，Time-MoE展现出卓越的泛化能力和多任务适应性，广泛应用于能源管理、金融预测、电商销量分析、气象预报以及交通规划等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 784 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期