模型

共鸣Chat

一款智能AI文字语音聊天应用,共鸣Chat是您的个性化沟通伙伴,让技术的亲密无间触手可及。随时随地,只需一句话,共鸣便能启动,成为您的智能朋友和顾问。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。

VSI

VSI-Bench是一种用于评估多模态大型语言模型(MLLMs)视觉空间智能的基准测试工具,包含超过5000个问题-答案对,覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务,可全面评估模型的空间认知、理解和记忆能力,并提供标准化的测试集用于模型性能对比。 ---

Link·AI

Link·AI 是一款面向企业和个人的 AI 智能体开发平台,集成了多模态大模型、RAG 知识库和插件,支持零代码快速创建具备企业私有知识和高级任务执行能力的智能体。用户能够将 AI 应用轻松接入主流平台,广泛应用于客户服务、营销自动化、企业协作及个人助理等场景,助力提升运营效率和用户体验。

般若AI

提高你的工作效率,提供生活上的便利。般若AI可以帮助人们回答问题,解决诸如文章写作、语言翻译、客服对话、还有强大的AI绘画等多种场景下的需求。

Luma Ray2

Luma Ray2 是 Luma AI 推出的视频生成模型,基于多模态架构,支持文本和图像输入,生成高质量、连贯的视频内容。相较前代,视频时长从 5 秒提升至 1 分钟,支持电影级运镜和逼真特效,适用于影视制作、广告、游戏动画及教育等多个领域。

SDXL

SDXL-Lightning是一种基于扩散模型的文本到图像生成技术,由字节跳动的研究团队开发。该模型通过结合渐进式和对抗式蒸馏方法,能够在一至少数步骤内快速生成1024像素分辨率的高质量图像。该模型提供开源模型和权重,支持与现有的LoRA模块和控制插件兼容,可以轻松集成到现有的图片生成系统中。核心技术包括扩散模型、渐进式蒸馏、对抗式蒸馏和鉴别器设计,以确保生成图像的质量和多样性。

Act

Act-One是一款由Runway开发的AI生成式角色表演工具,能够基于简单视频输入生成逼真的虚拟角色动画。它简化了面部动画制作流程,无需复杂设备,仅需单一摄像头即可完成,同时支持多样化角色表现和多轮对话场景生成,广泛应用于电影、动画、角色设计及叙事内容创作等领域。

Large Action Models

Large Action Models(LAMs)是微软开发的一种智能系统框架,专注于执行真实世界任务。它通过整合数据收集、模型训练、环境交互和评估等阶段,将语言理解转化为具体行动,提升了AI在自动化和增强人类能力方面的影响力。LAMs具备动态规划、自主执行和专业化训练等特点,广泛应用于办公自动化、智能家居管理、客户服务、电子商务等领域。 ---

Audio

Audio-SDS是由NVIDIA研发的音频处理技术,基于文本提示引导音频生成,支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型,即可将预训练音频扩散模型扩展为多功能工具,具备高效推理能力,适用于游戏、音乐制作、教育及智能家居等多个领域。