AI - 智狐AI导航

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 665 浏览

Scam AI

Scam AI 是一款基于人工智能的防诈骗工具，支持快速验证视频、音频和文本内容的真实性，识别AI生成或深度伪造内容。它结合自然语言处理、视觉和音频分析技术，具备多格式支持、隐私保护和实时检测等功能，适用于个人、企业、媒体和金融等多个场景，帮助用户有效防范网络欺诈风险。

AI项目与工具 2025年06月12日 73 点赞 0 评论 665 浏览

MVoT

MVoT是一种多模态推理框架，通过生成图像形式的推理痕迹，增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制，有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 57 点赞 0 评论 665 浏览

StoriesForKids AI

StoriesForKids.ai 是一款使用AI为孩子们创建个性化的故事和插图工具。这是一种与孩子一起阅读和创作的有趣而简单的方法。

教育学习 2025年06月05日 59 点赞 0 评论 665 浏览

AI医学——PubMed中文版

PubMed中文版提供对PubMed的全中文实时访问。

创作工具 1970年01月01日 0 点赞 0 评论 665 浏览

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

创作工具 1970年01月01日 0 点赞 0 评论 665 浏览

SpinBot

SpinBot是一款基于AI的文本改写工具，支持文章重写、语法检查和摘要生成等功能，适用于内容创作、学术写作、市场营销及社交媒体管理等场景。用户可通过该工具提升写作效率，生成高质量、原创性内容，同时支持自定义设置以保留特定术语。SpinBot有助于避免内容重复，提高文本的准确性和可读性。

AI项目与工具 2025年06月12日 49 点赞 0 评论 665 浏览

声动视界SoundView

一款面向带货短视频的AI视频工具，声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

Ai语音工具 2025年06月05日 58 点赞 0 评论 665 浏览

AvatarGO

AvatarGO是由南洋理工大学、上海AI Lab和香港大学联合开发的AI框架，能够根据文本描述生成高质量的4D人体与物体交互场景。其核心在于利用LLM引导的接触重定位、空间感知的分数蒸馏采样和运动优化技术，实现精确的接触识别与动画生成，有效解决穿透问题。支持多种人物与物体组合，适用于虚拟导购、展厅讲解、VR/AR内容创作等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 665 浏览

Together AI

Together AI 是一家提供生成式 AI 云服务的平台，支持模型快速推理、微调及训练，具备高性能、低成本和可扩展性。平台提供无服务器或专用端点部署，支持企业级 VPC，确保数据安全。其 GPU 集群支持大规模 AI 计算，适用于内容创作、企业应用、网络安全等多个领域，满足从模型优化到定制开发的全流程需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 665 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期