模型 - 智狐AI导航

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具，利用CLIP模型实现剧本文本与电影画面的匹配，支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化，旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外，ScriptViz还提供情绪捕捉、场景细化及角色开发等应用，适用于剧本开发、故事板制作等多个场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 614 浏览

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 615 浏览

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Ai开源项目 2025年06月05日 42 点赞 0 评论 615 浏览

天壤小白大模型

天壤自研新一代通用语言大模型，具备面向多语言的对话互动、知识问答、逻辑推理等核心能力。

Ai平台模型 2025年06月05日 72 点赞 0 评论 615 浏览

AlphaQubit

AlphaQubit是一款由谷歌推出的基于人工智能的量子错误解码工具，主要功能包括错误识别与纠正、基于AI的解码、性能优化以及泛化能力提升。它采用量子纠错码（如表面码）、神经网络架构（Transformer）及软读出技术，通过一致性检查与实验数据微调，实现对量子比特状态的高精度预测与校正。AlphaQubit可广泛应用于量子计算机开发、药物发现、材料设计、密码学及优化问题解决等场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 616 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 616 浏览

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI 创作平台，提供视频生成、图片生成、图片agent编辑，数字人生成，3D模型等功能。

Ai绘画生成 2025年06月05日 12 点赞 0 评论 616 浏览

EMMA

EMMA是一款基于Gemini模型的端到端自动驾驶多模态模型，可直接从原始相机传感器数据生成驾驶轨迹并执行多种任务，如3D对象检测、道路图元素识别及场景理解。该模型利用自然语言处理技术实现跨任务协作，并展现出强大的泛化能力，但在某些方面仍需改进。

AI项目与工具 2025年06月12日 38 点赞 0 评论 617 浏览

Explorer

Explorer是一款由Odyssey公司研发的生成性世界模型，主要功能包括将图像转换为高质量的3D场景，并支持动态效果生成。它利用高斯溅射技术和先进的图像识别算法，实现逼真的视觉效果。Explorer生成的场景可无缝集成到主流创作软件中，广泛应用于电影、游戏开发、虚拟现实等领域，显著提升内容创作效率。

AI项目与工具 2025年06月12日 39 点赞 0 评论 618 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 618 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期