训练

BrushNet

BrushNet是一款基于扩散模型的图像修复工具,采用双分支架构处理遮罩区域。它能够实现像素级修复,保持修复区域与原始图像的一致性和高质量。BrushNet适用于多种场景和风格的图像,包括人类、动物、室内和室外场景,以及自然图像、铅笔画、动漫、插画和水彩画等。通过与预训练扩散模型结合,BrushNet提供灵活的修复控制,同时保留未遮罩区域的细节。

novita.ai

Novita.ai是一个综合性的AI云服务平台,提供模型API、无服务器计算、GPU实例等服务。它集成了阿里巴巴的AnimateAnyone项目,支持静态图像动态化,并提供超过10,000个预训练模型,广泛应用于图像生成、动画制作等领域。其主要功能包括模型API支持、无服务器计算、GPU实例租赁、自定义模型添加以及高质量动画生成,适用于娱乐、教育、电商等多个行业。

SnapGen

SnapGen是一款由Snap Inc、香港科技大学和墨尔本大学联合开发的文本到图像扩散模型,专为移动设备设计,支持在1.4秒内生成1024×1024像素的高分辨率图像。它通过优化网络架构、跨架构知识蒸馏和对抗性训练等技术,在保持小模型规模的同时,提供了高质量的图像生成能力,适用于社交媒体、移动应用、教育、新闻等多个领域。

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。

WeDraw

WeDraw专注于人工智能AI绘画和大模型语料数据合成领域,是一支充满激情和创意的团队。

Fox

Fox-1是一系列由TensorOpera开发的小型语言模型,基于大规模预训练和微调数据,具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色,适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。

面壁智能

面壁智能依托在自然语言处理方面的前沿技术,构建大规模预训练模型库及配套工具,推进大模型技术与应用的标准化。

商汤如影SenseAvatar

商汤如影作为商汤科技旗下的产品,展现了其在人工智能领域的深厚实力和创新能力。通过提供多功能的大模型服务,商汤如影有助于推动各行业的智能化升级,实现降本增效,促进创新。

《DeepSeek从入门到精通》

《DeepSeek从入门到精通》是一份系统介绍DeepSeek技术特点、应用场景及使用方法的指南。文章涵盖提示语设计、模型选择、AI伦理、实战案例等内容,旨在帮助用户提升AI交互效率,掌握高级提示语设计技巧,推动人机协作能力的发展。适用于开发者、研究人员及AI初学者。