模型 - 智狐AI导航

Transfusion

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 595 浏览

DMind

DMind是由DMind研究机构开发的专为Web3领域优化的大型语言模型，针对区块链、去中心化金融和智能合约等场景深度优化。采用RLHF技术对齐，性能在Web3专项测试中表现优异，推理成本仅为大模型的十分之一。提供DMind-1和DMind-1-mini两个版本，适用于复杂任务和轻量级部署。支持智能合约生成与验证、DeFi交易代理部署、多轮对话交互等功能，基于Transformer架构，结合专业数

AI项目与工具 2025年06月11日 70 点赞 0 评论 594 浏览

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 594 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 594 浏览

Poly Haven

基于CC0共享协议的高质量3D模型、纹理贴图资源下载网站，Poly Haven无需注册账户直接下载，可免费商用。

免商图片 2025年06月05日 78 点赞 0 评论 594 浏览

AbletonMCP

AbletonMCP 是一个开源工具，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现音乐制作过程中的 AI 辅助。支持双向通信，允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信，适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 592 浏览

阶跃星辰推出移动端AI智能问答助手跃问APP

跃问是一款基于阶跃星辰Step系列通用大模型开发的移动应用，具备强大的文本和图像处理能力，能够高效完成内容创作、逻辑推理、数据分析等任务。该应用支持联网搜索、文档解析、推理速度优化，并具备拍照识图和语音输入功能。跃问还提供了高效阅读、智能问答、写作翻译和多端同步等功能，为用户提供便捷的信息获取和处理体验。

AI项目与工具 2024年01月01日 61 点赞 0 评论 592 浏览

LMArena AI

前身为lmsys.org，是一个专注于众包AI基准测试的开放平台，用户可以在此平台上免费与AI聊天并进行投票，比较和测试不同的AI聊天机器人。

Ai平台模型 2025年06月05日 13 点赞 0 评论 592 浏览

POINTS 1.5

POINTS 1.5 是腾讯微信开发的多模态大模型，基于LLaVA架构设计，包含视觉编码器、投影器和大型语言模型。它在复杂场景OCR、推理、关键信息提取、数学问题解析及图片翻译等方面表现突出，适用于票据识别、自动客服、新闻摘要、学术论文处理、旅游翻译和在线教育等多个领域。该模型通过高效的数据处理和特征融合技术，实现了跨模态任务的精准处理与高效输出。

AI项目与工具 2025年06月12日 14 点赞 0 评论 592 浏览

SPAR

SPAR是一种自我博弈框架，专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动，利用树搜索技术和迭代优化，提升模型的自我完善能力。实验显示，SPAR在多个基准测试中表现出色，适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

AI项目与工具 2025年06月12日 64 点赞 0 评论 592 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期