AI - 智狐AI导航

ScreenAI

ScreenAI是一款专为理解和处理用户界面（UI）及信息图表而设计的AI视觉语言模型。它能够识别和理解UI元素及其相互关系，并生成与屏幕UI元素相关的文本，如问题回答、UI导航指令和内容摘要。ScreenAI通过多模态编码器结合视觉和语言信息，并采用自回归解码器生成自然语言响应。此外，ScreenAI还能适应不同屏幕格式，提供精确的UI导航和内容摘要功能。

AI项目与工具 2024年01月01日 16 点赞 0 评论 771 浏览

CopyWeb

CopyWeb 是一款 AI 驱动的网页克隆与代码生成工具，支持通过 URL、截图或 Figma 导入设计，生成响应式 HTML/CSS 代码并导出为 React、Vue 等前端框架。内置智能组件识别和代码优化功能，提升开发效率，适用于原型开发、响应式设计验证及教学演示等场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 771 浏览

Faceswapper

尖端技术保证完美，自然的面部交换，无缝地隐藏任何编辑痕迹

Ai视频生成 1970年01月01日 0 点赞 0 评论 771 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 771 浏览

Maya.ai

maya.ai 是一个由 AI 驱动的，使用专有的 TasteGraph 根据客户的行为来了解和预测客户的偏好，可以跨多个渠道向每个客户提供个性化的推荐、优惠和体验的个性化平台。

创业营销 2025年06月05日 63 点赞 0 评论 772 浏览

AgenticSeek

AgenticSeek是一款完全本地化的开源AI助手，作为Manus的开源替代品，它能够在本地设备上自主执行任务，如浏览网页、编写代码和规划项目，确保用户隐私。支持多种编程语言，具备智能任务拆解与执行能力，用户可通过语音或文本交互。适用于注重隐私和希望在本地环境中使用AI工具的用户。

AI项目与工具 2025年06月11日 21 点赞 0 评论 772 浏览

KismeAI

一个旨在帮助每个人定制自己的超级AI智能体，仓颉智元KismetAI让生活和工作更高效。

GPTs应用 2025年06月05日 88 点赞 0 评论 772 浏览

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型，支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本，专注于广告视频创作，具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构，适用于广告、教育、娱乐等多个领域，提升了内容创作效率与质量。

AI项目与工具 2025年02月11日 29 点赞 0 评论 772 浏览

COMET

COMET是字节跳动开发的Mixture-of-Experts（MoE）模型优化系统，通过细粒度计算-通信重叠技术和自适应负载分配机制，显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速，具备强鲁棒性与泛化能力，支持多种硬件环境和并行策略，核心代码已开源并可无缝集成至主流训练框架。

AI项目与工具 2025年06月12日 12 点赞 0 评论 772 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 772 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期