模型 - 智狐AI导航

GenCast

GenCast是一款基于扩散模型的AI气象预测工具，可提供长达15天的高精度全球天气预报，尤其擅长预测极端天气事件。它采用0.25°纬度-经度分辨率生成高精度集合预报，并通过并行计算在8分钟内完成预测。GenCast已开源，支持学术界和行业用户进一步研究与应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 912 浏览

Motion Prompting

Motion Prompting 是一种利用点轨迹表示的视频生成技术，支持对象控制、相机控制及物理现象模拟等功能。它通过将用户输入转化为详细的运动轨迹，结合预训练的视频扩散模型与控制网络，在保持灵活性的同时提高生成质量。这项技术广泛应用于电影制作、游戏开发、虚拟现实等领域，为用户提供了强大的交互式视频生成工具。 ---

AI项目与工具 2025年06月12日 11 点赞 0 评论 838 浏览

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型，擅长处理复杂提示词，生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项，适用于艺术创作、广告设计、电商展示等多种场景，极大提升了相关行业的设计效率与成果质量。

AI项目与工具 2025年06月12日 19 点赞 0 评论 950 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 770 浏览

多面鹅

OfferGoose是一款基于AI的面试助手，旨在提升求职者的面试表现。它提供实时面试提醒、AI模拟面试、智能押题和深度复盘等功能，支持多语言和多种行业需求。无论是技术岗位还是非技术岗位，OfferGoose都能帮助用户增强技术能力和沟通技巧，提供定制化的面试建议和职业发展支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 792 浏览

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 733 浏览