人工智能 - 智狐AI导航

Wan

Wan是阿里推出的AI创意平台，支持AI绘画与视频生成，能根据文字或图片生成高质量艺术图像和动态视频。提供多种风格选择与创意探索功能，用户可保存作品并分享。适用于艺术设计、内容创作、教育学习及商业营销等多个领域，助力提升创作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 544 浏览

Cardamon

Cardamon 是一款由 Y Combinator 推出的 AI 合规平台，专为金融机构设计。它利用人工智能技术自动解析法规文本，快速生成合规义务和控制措施，提升合规效率。支持风险评估、个性化标签生成及数据导出功能，适用于跨国合规、风险管理和监管变更管理等多种场景。

AI项目与工具 2025年06月12日 66 点赞 0 评论 745 浏览

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架，通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式，减少重复计算，支持跨应用复杂任务。基于视觉识别，无需API即可通用操作，适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异，为智能代理技术提供新思路。

AI项目与工具 2025年06月12日 28 点赞 0 评论 612 浏览

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架，用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块，解决了传统方法在生成多样姿态图像时的局限性，适用于虚拟现实、影视制作、电商展示等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 695 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 644 浏览

MeshPad

MeshPad 是一款基于草图输入的交互式 3D 网格生成与编辑工具，可将二维草图快速转化为高质量三维模型并支持实时修改。采用三角形序列表示和 Transformer 模型，实现高效、精准的网格生成与调整。通过推测性预测策略，提升计算效率，缩短编辑时间。生成的网格在精度上优于现有方法，适用于艺术设计、建筑设计和工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 816 浏览

GaussianAnything

GaussianAnything 是一款基于多模态输入的 3D 内容生成框架，支持点云、文本和图像等多种输入方式，能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型，具备几何与纹理解耦特性，适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异，为 3D 内容创作提供了高效解决方案。

AI项目与工具 2025年06月12日 41 点赞 0 评论 839 浏览

Seedream 2.0

Seedream 2.0 是字节跳动豆包团队推出的中英双语图像生成模型，具备强大的文本理解和渲染能力，可生成具有文化细节和美学表达的高质量图像。支持多分辨率生成、字符级文本处理，并通过强化学习优化性能，适用于海报设计、社交媒体、绘画创作等多领域应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 747 浏览

BEHAVIOR Robot Suite

BEHAVIOR Robot Suite（BRS）是斯坦福大学李飞飞团队研发的机器人操作框架，专注于实现全身协调与复杂家务任务。它结合了低成本遥操作接口JoyLo和多模态学习算法WB-VIMA，提升机器人在真实环境中的适应性和操作精度。适用于家务自动化、垃圾处理、衣物整理等多个场景，具备高度灵活性和故障恢复能力。

AI项目与工具 2025年06月12日 93 点赞 0 评论 683 浏览

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型，拥有 21 亿参数，支持多模态输入（文本、图像、视频、音频），并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持，适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署，支持 4 位量化以降低资源占用，适合广泛的应用需求。

AI项目与工具 2025年06月12日 70 点赞 0 评论 544 浏览

人工智能

首页

人工智能

列表

默认

浏览次数

发布日期

Wan