人工智能 - 智狐AI导航

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型，具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互，适用于智能客服、教育、医疗等多个领域，提升人机对话的自然度与效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 882 浏览

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 655 浏览

PatentPal

PatentPal是一款基于AI的专利文件生成工具，可自动创建完整的专利申请草稿，包括图表、摘要和详细说明。用户可通过上传文档一键生成内容，并支持多种格式导出。工具具备高度可定制性，允许用户调整生成文本并管理多个配置文件，适用于专利撰写、知识产权管理和创新保护等场景。

AI项目与工具 2025年01月19日 47 点赞 0 评论 613 浏览

Websim

Websim是一款基于AI技术的网页开发工具，用户只需输入文本提示，即可快速生成网站或应用程序。它支持智能界面设计、自动代码生成及项目托管，适用于个人创意实现、企业开发、教育及市场营销等多个场景。无需编程基础，大幅降低开发门槛，提高项目构建效率。

AI项目与工具 2025年06月12日 69 点赞 0 评论 804 浏览

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型，采用仅解码器架构，支持处理长达2048个时间点的单变量序列，具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练，覆盖多个领域，具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景，为数据分析与决策提供支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 552 浏览

Video Ocean V2.0

Video Ocean V2.0是一款由潞晨科技推出的AI视频生成平台，支持文生视频、图生视频和角色生视频等多种创作方式。平台具备高画质、多风格切换及视频续写、重试等编辑功能，适用于个人创作、自媒体、教育及影视前期构思等多个场景，提升视频制作效率与创意表达能力。

AI项目与工具 2025年06月12日 81 点赞 0 评论 749 浏览

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架，支持对相机和物体运动的细粒度控制。它基于3D感知运动表示，结合U-Net架构的扩散模型，实现多种运动相关的视频合成任务，如运动生成、运动克隆、转移和编辑。通过三阶段训练策略，提升运动控制精度和稳定性，适用于影视、游戏、VR/AR、广告及教育等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 679 浏览

PPTAgent

PPTAgent是由中国科学院软件研究所研发的AI驱动演示文稿生成工具，采用两阶段编辑方法，从文档自动生成结构清晰、内容一致的PPT。它结合大型语言模型与幻灯片分析技术，支持大纲生成、内容编辑与质量评估，适用于教育、企业、市场等多个场景，显著提升演示文稿制作效率与质量。

AI项目与工具 2025年06月12日 78 点赞 0 评论 802 浏览

AI京医

AI京医是京东健康推出的医疗大模型产品体系，涵盖AI诊疗助手、数字医生智能体和AI科研助手，覆盖诊前、诊中、诊后全流程，提升医生工作效率与科研能力，同时优化患者就医体验，实现智能化、个性化的医疗服务。

AI项目与工具 2025年06月12日 54 点赞 0 评论 715 浏览

日日新融合大模型

日日新融合大模型（SenseNova）是商汤科技推出的多模态AI系统，支持文本、图像、视频等多种数据的融合处理，具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异，广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域，提升了多场景下的智能化水平。

AI项目与工具 2025年06月12日 88 点赞 0 评论 816 浏览

人工智能

首页

人工智能

列表

默认

浏览次数

发布日期