多模态 - 智狐AI导航

海螺视频APP

海螺视频APP是一款基于AI技术的视频生成工具，支持文生视频和图生视频功能，提供丰富的镜头控制选项，让用户能像专业导演一样创作动态视频。该工具适用于多种场景，如社交媒体、广告营销、影视制作等，操作简便，适合各类用户使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 858 浏览

天谱乐

天谱乐是一款由趣丸科技推出的支持多模态输入的音乐生成工具，涵盖文本、图片及视频生成音乐功能。它能够准确理解音乐复杂特性并生成高契合度配乐，同时提供专家模式和音乐编辑功能，适用于音乐创作、短视频配乐、影视配乐及个人娱乐等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 859 浏览

从容大模型

从容大模型是云从科技推出的多模态AI模型，在国际评测中表现优异，具备视觉语言理解与推理能力。其核心技术包括多模态对齐、高效工程优化和原生多模态推理，支持复杂场景下的文本识别和开放域问答。该模型在医学健康、金融、制造、政务等多个领域实现规模化应用，助力智能化转型。

AI项目与工具 2025年06月11日 21 点赞 0 评论 859 浏览

《Manus没有秘密》70页PPT解读AI Agent（PDF文件）

本文详细解读了AI Agent技术从L1到L3的发展历程，涵盖了定义、实现原理、用户体验及未来趋势。文章以Manus为例，探讨了Agent技术的通用性、技术实现路径及用户感知变化，强调了提升通用性、性能和用户体验的重要性。同时，文章提出了对未来发展的期望和建议。

AI项目与工具 2025年06月12日 45 点赞 0 评论 859 浏览

Amazon Nova是亚马逊云服务推出的一套强大的AI基础模型系列，涵盖文本、图像和视频生成等多个领域。其核心产品包括Amazon Nova Micro（专注文本处理）、Amazon Nova Lite（多模态低成本模型）、Amazon Nova Pro（多模态平衡型模型）、Amazon Nova Premier（复杂推理模型）、Amazon Nova Canvas（图像生成模型）和Amazon

AI项目与工具 2025年06月12日 74 点赞 0 评论 860 浏览

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型，支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本，专注于广告视频创作，具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构，适用于广告、教育、娱乐等多个领域，提升了内容创作效率与质量。

AI项目与工具 2025年02月11日 29 点赞 0 评论 861 浏览

通义千问AI大模型

通义千问大模型AI开放平台，覆盖语言、听觉、多模态等领域；致力于实现接近人类智慧的通用智能，让AI从“单一感官”到“五官全开”

Ai平台模型 2025年06月05日 18 点赞 0 评论 861 浏览

Wegic.ai

一款面向未来的 AI网页设计师，通过简单的聊天等多模态交互来完成网站的设计、修改和上线全流程。

Ai编程建站 2025年06月05日 24 点赞 0 评论 863 浏览

智谱AI

智谱AI开放平台，GPT人工智能模型，基于领先的千亿级多语言、多模态预训练模型，打造高效率、通用化的“模型即服务”AI开发新范式。

Ai平台模型 2025年06月05日 51 点赞 0 评论 865 浏览

TITAN

TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型，通过视觉自监督学习和视觉-语言对齐预训练，能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色，包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成，尤其适用于资源有限的临床场景。

AI项目与工具 2025年06月12日 93 点赞 0 评论 866 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期