计算 - 智狐AI导航

交交

交交是上海交通大学研发的口语对话情感大模型，支持多人对话、多语言交流、方言识别、角色扮演、情感互动及知识问答。具备端到端语音处理、多语言理解、实时音色克隆等功能，适用于教育、家庭、商务、客服等多个场景，展现出强大的语音交互能力与应用潜力。

AI项目与工具 2025年06月11日 12 点赞 0 评论 560 浏览

OpenAI o4

OpenAI o4-mini 是一款高性能、低成本的小型推理模型，专为快速处理数学、编程和视觉任务优化。它具备多模态能力，可结合图像与文本进行推理，并支持工具调用以提高准确性。在多项基准测试中表现优异，尤其在数学和编程领域接近完整版模型。适用于教育、数据分析、软件开发及内容创作等多个场景，是高效率与性价比兼备的AI工具。

AI项目与工具 2025年06月11日 27 点赞 0 评论 875 浏览

Image to Music

Image to Music 是一款基于AI的图像转音乐工具，通过分析图像的颜色、形状和纹理等元素，生成多种风格的音乐。用户可直接上传图片并选择模型，快速获得钢琴、吉他、管弦乐等音乐作品。无需注册，无使用限制，适用于音乐创作、广告营销、教育及个性化礼物制作等多种场景，为艺术创作提供新思路。

AI项目与工具 2025年06月11日 80 点赞 0 评论 587 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 937 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 604 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 760 浏览

SocioVerse

SocioVerse是由复旦大学等机构联合开发的社会模拟平台，基于大语言模型和1000万真实用户数据构建与现实对齐的模拟环境。系统包含社会环境、用户引擎、场景引擎和行为引擎四大模块，支持多场景应用，如政治选举预测、新闻传播分析、经济调查和政策评估。它能够模拟群体行为，预测事件趋势，为社会科学研究提供高效工具。

AI项目与工具 2025年06月11日 80 点赞 0 评论 680 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 493 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 872 浏览

基石智算

基石智算是青云科技推出的AI算力云服务平台，支持多种异构算力资源的统一调度与管理，具备弹性扩容、分布式任务调度、一站式AI开发及模型部署等功能。平台适用于AI模型训练、高性能计算、数据科学分析及模型推理等多种场景，提供灵活的服务模式和全面的资源监控与管理能力，助力用户高效开展人工智能相关工作。

AI项目与工具 2025年06月11日 49 点赞 0 评论 836 浏览

计算

首页

计算

列表

默认

浏览次数

发布日期

交交