模型 - 智狐AI导航

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 616 浏览

AlphaQubit

AlphaQubit是一款由谷歌推出的基于人工智能的量子错误解码工具，主要功能包括错误识别与纠正、基于AI的解码、性能优化以及泛化能力提升。它采用量子纠错码（如表面码）、神经网络架构（Transformer）及软读出技术，通过一致性检查与实验数据微调，实现对量子比特状态的高精度预测与校正。AlphaQubit可广泛应用于量子计算机开发、药物发现、材料设计、密码学及优化问题解决等场景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 616 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 616 浏览

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Ai开源项目 2025年06月05日 42 点赞 0 评论 616 浏览

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI 创作平台，提供视频生成、图片生成、图片agent编辑，数字人生成，3D模型等功能。

Ai绘画生成 2025年06月05日 12 点赞 0 评论 616 浏览

天壤小白大模型

天壤自研新一代通用语言大模型，具备面向多语言的对话互动、知识问答、逻辑推理等核心能力。

Ai平台模型 2025年06月05日 72 点赞 0 评论 615 浏览

AIGCPanel

AIGCPanel是一款开源的AI数字人系统，支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法，实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能，可应用于影视制作、虚拟主播、教育培训等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 615 浏览

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具，利用CLIP模型实现剧本文本与电影画面的匹配，支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化，旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外，ScriptViz还提供情绪捕捉、场景细化及角色开发等应用，适用于剧本开发、故事板制作等多个场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 615 浏览

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术，能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状，并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域，为个性化定制提供了强大的技术支持。

AI项目与工具 2025年06月12日 23 点赞 0 评论 614 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 614 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期