模型 - 智狐AI导航

Flux.1 Lite

Flux.1 Lite是一款轻量级AI图像生成模型，基于Transformer架构，通过参数优化和精度保持技术，在减少内存占用的同时提升运行速度。其主要功能包括高质量图像生成、资源优化、快速部署及广泛适用性，适用于个人创作、教育、游戏开发、数字艺术以及广告营销等多个领域。

AI项目与工具 2025年06月12日 38 点赞 0 评论 596 浏览

VirtualWife

VirtualWife 是一款基于人工智能技术开发的虚拟角色项目，集成了自然语言处理、语音识别与合成、机器学习等功能，支持跨平台运行和个性化定制。其主要应用场景包括个人陪伴、心理健康辅导、在线教育、客户服务、娱乐互动和直播带货，致力于为用户提供智能化、多样化的交互体验。

AI项目与工具 2025年06月12日 100 点赞 0 评论 596 浏览

芝士饼

一款支持一站式AI原生应用的开发平台，芝士饼无需任何代码基础，只需通过自然语言，简单几步即可完成应用的创建与发布。

Ai平台模型 2025年06月05日 34 点赞 0 评论 596 浏览

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 596 浏览

万兴天幕大模型

万兴天幕大模型是万兴科技AILab的创新成果，展现了其在多媒体领域的深厚技术积累和前瞻性布局。通过自研技术和多年行业经验，天幕大模型为全球创作者提供了一个强大的工具，以实现...

创作工具 2026年06月22日 0 点赞 0 评论 595 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 595 浏览

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 推出的高性能人工智能模型，具备强大的编码能力和低延迟特性，适合复杂推理与问题解决任务。它通过“Unstructured Generalization”算法优化非结构化数据处理，并引入“宪法 AI”确保行为符合道德规范。此外，该模型支持“计算机使用”功能，能够模拟人类与计算机交互，广泛应用于自动化桌面任务、虚拟助手构建、医疗决策支持、教育及客

AI项目与工具 2025年06月12日 12 点赞 0 评论 595 浏览

MMSearch

MMSearch 是一款用于评估大型多模态模型（LMMs）搜索能力的基准测试工具，包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结，通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异，且增加计算量比扩大模型规模更具优势。

AI项目与工具 2025年06月12日 44 点赞 0 评论 595 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 595 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 595 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期