模型 - 智狐AI导航

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型，擅长处理复杂提示词，生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项，适用于艺术创作、广告设计、电商展示等多种场景，极大提升了相关行业的设计效率与成果质量。

AI项目与工具 2025年06月12日 19 点赞 0 评论 952 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 772 浏览

多面鹅

OfferGoose是一款基于AI的面试助手，旨在提升求职者的面试表现。它提供实时面试提醒、AI模拟面试、智能押题和深度复盘等功能，支持多语言和多种行业需求。无论是技术岗位还是非技术岗位，OfferGoose都能帮助用户增强技术能力和沟通技巧，提供定制化的面试建议和职业发展支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 795 浏览

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 734 浏览

Fox

Fox-1是一系列由TensorOpera开发的小型语言模型，基于大规模预训练和微调数据，具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色，适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 636 浏览

Llama 3.3

Llama 3.3是一款由Meta AI开发的70B参数大型多语言预训练语言模型，支持英语、德语、法语等8种语言的输入输出。它具备长上下文窗口、高效运行和低成本的特点，可与第三方工具集成，广泛应用于聊天机器人、客户服务、语言翻译、内容创作及教育等领域。

AI项目与工具 2025年06月12日 71 点赞 0 评论 831 浏览

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架，通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色，包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 797 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 813 浏览

O1

O1-CODER是一款由北京交通大学研究团队开发的开源编码工具，专精于编程任务。它通过结合强化学习和蒙特卡洛树搜索技术，实现了从伪代码到完整代码的生成，并通过测试用例生成器和过程奖励模型优化代码质量。该工具支持自动化代码生成、代码质量提升、教育辅助以及软件测试等多种应用场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 732 浏览

OOTDiffusion

OOTDiffusion是一款开源AI虚拟试衣工具，支持根据用户上传的模特和服装图片生成自然贴合的试穿效果，具有智能适配、多种试穿模式及快速生成等特点。它通过预训练扩散模型、Outfitting UNet、Outfitting Fusion等技术实现高质量服装图像生成，适用于电商、设计、定制服务等多个领域。

AI项目与工具 2025年06月12日 81 点赞 0 评论 710 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期