模型 - 智狐AI导航

AvatarFX

AvatarFX是由Character.AI开发的AI视频生成工具，通过上传图片和选择语音，可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成，具备高时间一致性。采用扩散模型与音频条件化技术，确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作，提供高效、高质量的视频生成体验。

AI项目与工具 2025年06月11日 12 点赞 0 评论 881 浏览

Miras

Miras是由谷歌开发的深度学习框架，专注于序列建模任务。它基于关联记忆和注意力偏差机制，整合多种序列模型并支持新型模型设计。Miras通过保留门机制优化记忆管理，提升模型在长序列任务中的表现，适用于语言建模、常识推理、长文本处理及多模态任务，具有高效且灵活的架构优势。

AI项目与工具 2025年06月11日 58 点赞 0 评论 665 浏览

SocioVerse

SocioVerse是由复旦大学等机构联合开发的社会模拟平台，基于大语言模型和1000万真实用户数据构建与现实对齐的模拟环境。系统包含社会环境、用户引擎、场景引擎和行为引擎四大模块，支持多场景应用，如政治选举预测、新闻传播分析、经济调查和政策评估。它能够模拟群体行为，预测事件趋势，为社会科学研究提供高效工具。

AI项目与工具 2025年06月11日 80 点赞 0 评论 690 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 500 浏览

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型，具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入，适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架，采用多通道输入处理和高效推理算法，可通过ComfyUI或Diffusers库集成使用，适合实验性开发和个性化定制。

AI项目与工具 2025年06月11日 20 点赞 0 评论 764 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 877 浏览

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

AI项目与工具 2025年06月11日 81 点赞 0 评论 692 浏览

文心大模型4.5 Turbo

文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型，支持文本、图像、视频等多种输入形式，具备强大的逻辑推理与去幻觉能力，可辅助代码编写。相比前代产品，其速度更快、成本更低，适用于内容创作、智能客服、电商营销、教育及办公自动化等多个场景，已在文心一言平台上线。

AI项目与工具 2025年06月11日 19 点赞 0 评论 730 浏览

文心大模型X1 Turbo

文心大模型X1 Turbo是百度推出的深度思考型AI模型，具备强大的逻辑推理和多模态处理能力，适用于内容创作、智能问答、任务规划等多个领域。相比前代产品，性能提升显著，价格更具竞争力，支持复杂场景下的高效应用。

AI项目与工具 2025年06月11日 39 点赞 0 评论 640 浏览

AI推理模型有哪些？13个支持深度思考的推理模型

本文介绍了13款支持深度思考的AI推理模型，涵盖数学、代码、自然语言推理等多个领域。这些模型通过强化学习和大数据分析，能够高效处理复杂问题，提供精准的决策支持。部分模型具备多模态处理能力、透明推理过程及开源特性，适用于不同应用场景，如教育、医疗和科研等。

AI项目与工具 2025年06月11日 88 点赞 0 评论 729 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期