模型 - 智狐AI导航

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型，具备130亿参数量，支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练，融合Causal 3D VAE与Transformer架构，实现图像和视频的统一生成，广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 752 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 752 浏览

ERA

ERA-42是一款由北京星动纪元开发的端到端原生机器人大模型，结合五指灵巧手星动XHAND1，可执行超过100种复杂灵巧操作任务。ERA-42无需预编程，具有快速学习能力，能在短时间内掌握新技能。该模型融合多模态信息，具备强大的跨模态能力和泛化能力，适用于工业自动化、医疗辅助、家庭服务、灾难救援和物流配送等多种场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 752 浏览

FisherAI

一款为提高学习效率而设计的Chrome插件，通过一键操作，支持自动摘要、网页及视频翻译、多轮对话等功能。

Ai办公效率 2025年06月05日 12 点赞 0 评论 752 浏览

Openart ai

OpenArt AI是一款AI图像生成器，旨在提升和实现您的创意视觉。它提供了各种AI模型和风格供您选择，让您的创造力和生产力提升10倍。它支持多种功能，如txt2img、img2img、ControlNet、修复等。

Ai绘画生成 2025年06月05日 71 点赞 0 评论 752 浏览

广电运通望道大模型

广电运通望道大模型是一个多功能的人工智能平台，它通过集成的高级自然语言处理和数据分析能力，为用户提供了从文本分析到创意生成的一系列服务。

创作工具 2026年06月23日 0 点赞 0 评论 753 浏览

F

F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 753 浏览

HiCo

HiCo是一款基于扩散模型的层次化可控布局到图像生成工具，采用多分支结构设计，能够精确控制对象的位置和文本描述，解决复杂布局中的常见问题。该工具支持高分辨率图像生成，兼容多种快速生成插件，并在多目标布局生成任务中表现出色，适用于图像编辑、游戏设计、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 754 浏览

Webdraw

Webdraw 是一款无代码 AI 应用开发平台，支持图像生成、视频制作、聊天助手等功能，用户可通过自然语言或可视化工具快速构建应用。平台集成多种 AI 模型，支持多模态内容创作，具备文件共享、实时协作和一键部署能力，适用于创意设计、个性化工具开发、教育及企业场景，降低 AI 技术使用门槛。

AI项目与工具 2025年06月12日 99 点赞 0 评论 754 浏览

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型，能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成，并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制，确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

AI项目与工具 2024年01月01日 30 点赞 0 评论 754 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期