AI项目与工具

AGUVIS

AGUVIS是一款由香港大学与Salesforce联合开发的纯视觉框架，专为自主GUI智能体设计。它支持跨平台操作，通过图像观察与自然语言指令的关联，以及显式规划和推理能力，提高了代理在复杂数字环境中的交互效率。AGUVIS采用大规模数据集及两阶段训练方法，实现了在离线与在线场景中的高效性能，成为首个不依赖外部闭源模型即可独立完成任务的纯视觉GUI代理。

AI项目与工具 2025年06月12日 97 点赞 0 评论 543 浏览

Webdone

Webdone 是一款基于人工智能的网站构建平台，支持用户通过简单描述快速生成专业落地页和网站，无需编程或设计技能。其提供拖拽式编辑器和 Next.js 开发环境，支持高度定制化与性能优化，适用于初创企业、开发者、自由职业者及教育机构等多种场景，助力高效建站与内容管理。

AI项目与工具 2025年06月12日 78 点赞 0 评论 543 浏览

Allegro

Allegro 是一款由 Rhymes AI 开发的文本到视频生成工具，可将描述性文本快速转化为高质量的动态视频内容。支持 720p 分辨率、15 FPS 帧率和最长 6 秒的视频输出，具有高时间一致性，适用于内容创作、广告营销、教育培训等多个领域，凭借先进的技术架构和强大的功能，成为视频生成领域的领先解决方案之一。

AI项目与工具 2025年06月12日 41 点赞 0 评论 543 浏览

MimicMotion

MimicMotion是一款由腾讯研究团队开发的高质量人类动作视频生成框架。该框架利用置信度感知的姿态引导技术，确保视频帧的高质量和时间上的平滑过渡。通过区域损失放大和手部区域增强，显著减少了图像失真，增强了手部动作的细节表现。该框架还支持长视频生成，通过渐进式潜在融合策略，确保视频生成时的时间连贯性和细节丰富度。

AI项目与工具 2025年06月12日 62 点赞 0 评论 543 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 543 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 543 浏览

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架，采用“下一个X预测”和“噪声上下文学习”技术，提升视觉生成的准确性和效率。其支持多种预测单元，具备高性能生成能力，在ImageNet数据集上表现优异，适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 543 浏览

Zapier Agents

Zapier Agents 是一款基于 AI 的自动化工具，支持与 7000 多个应用集成，通过自然语言交互实现任务分配和自动化处理。具备预设模板、实时数据访问、任务触发机制及跨平台协作功能，适用于销售、客服、开发等多种场景，提升工作效率。

AI项目与工具 2025年06月12日 99 点赞 0 评论 543 浏览

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具，用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制，提升GPU利用率和训练效率。支持多层MoE模型，减少通信开销，适应不同场景需求。

AI项目与工具 2025年06月12日 10 点赞 0 评论 544 浏览

Arcade

Arcade是一个利用生成式AI技术构建的产品创作平台，允许用户通过文本或图像输入快速生成个性化产品设计。它集成了设计协作、即时生成、定制化生产以及社交分享等功能，并与全球制造商合作确保产品质量。Arcade适用于个人用户及企业，可用于礼品定制、家居装饰、时尚配饰等领域，同时也为教育和商业原型开发提供支持。

AI项目与工具 2025年06月12日 22 点赞 0 评论 544 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间