生成

Phantom

Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。

龙猫LongCat

龙猫LongCat是美团自主研发的生成式AI大模型,具备多模态处理能力,可支持文本、图像等内容生成任务。其核心功能涵盖智能编程、会议记录、文档编辑、图形设计与视频脚本生成等,适用于多种办公场景。通过大规模预训练与混合训练策略,龙猫在实际应用中展现出高效、精准的特点,有效提升工作效率与创新能力。

Deepfakes Web

一个使用人工智能技术通过交换脸部来轻松生成视频的在线应用程序。该应用程序在云端运行,确保用户数据的隐私。

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集,包含4300万条样本,涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量,并采用合成数据生成技术扩展数据集规模。基于此数据集,智源研究院训练出了20亿参数的Aquila-VL-2B模型,在多项基准测试中表现出色,推动了多模态AI领域的研究与发展。

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架,支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入,结合Gemma模型和VAE技术,实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色,具备良好的下游任务迁移能力,适用于创意设计、内容创作等多个领域。

MiLoRA

MiLoRA是一种参数高效的大型语言模型微调方法,通过奇异值分解将权重矩阵分为主要和次要两部分,专注于次要部分的优化以降低计算成本,同时保持模型的高精度和高效性。它在自然语言处理任务中表现出色,适用于文本分类、情感分析、问答系统等多个领域,并在多租户环境和实时内容生成中展现出显著优势。 ---

AI Hugging

AI Hugging 是一款依托于AI技术开发的在线服务,其核心功能是将静态照片或文字描述转化为动态拥抱动画,从而实现情感表达的创新。平台支持多种自定义设置,如视频风格、动作设计等,同时保证输出质量卓越。无论用于个人情感传递还是商业用途,AI Hugging 均能提供高效便捷的服务体验。

GetGenie Ai

一款用于内容和SEO的AI助手。WordPress插件,它可以帮助您更快地撰写和优化内容,从而提高搜索引擎排名。

olly.bot

Olly.bot 是一款基于 OpenAI 技术的多合一 AI 助手,集成于 iMessage 和 SMS 平台,支持网络搜索、文档分析、图片生成等功能。它无需注册或下载,保护用户隐私,适用于多个操作系统。其核心功能包括任务管理、信息查询、文档分析及创意辅助,广泛应用于日常信息查询、学术研究、工作效率提升及创意工作等领域。

Dream Machine

Dream Machine是Luma AI开发的AI视频生成模型,能够快速将文本和图像转换为高质量、逼真的视频。Dream Machine可以在120秒内生成120帧视频,具备流畅的运动、电影摄影和戏剧效果。...