Cody Former 一个开源的人工智能图像处理工具,Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。 Ai图片处理 2025年06月05日 37 点赞 0 评论 278 浏览
FLOAT FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。 AI项目与工具 2025年06月12日 18 点赞 0 评论 275 浏览
Tora Tora是阿里推出的一个强大的视频生成工具,它通过集成多种条件来创造高质量的视频内容。其主要优势在于对运动轨迹的精确控制和对物理世界运动的真实模拟,这使得Tora在视频内容创... Ai视频生成 1970年01月01日 0 点赞 0 评论 274 浏览
Mellum Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型(LLM),通过深度集成 JetBrains IDE,提供低延迟、高精度的代码补全服务,支持多种编程语言,显著提升开发效率。其训练数据仅限于公开可用且许可宽松的代码,保障用户隐私。 AI项目与工具 2025年06月12日 85 点赞 0 评论 274 浏览
Flux.1 Lite Flux.1 Lite是一款轻量级AI图像生成模型,基于Transformer架构,通过参数优化和精度保持技术,在减少内存占用的同时提升运行速度。其主要功能包括高质量图像生成、资源优化、快速部署及广泛适用性,适用于个人创作、教育、游戏开发、数字艺术以及广告营销等多个领域。 AI项目与工具 2025年06月12日 38 点赞 0 评论 272 浏览
GLM GLM-4-Flash是一款由智谱AI开发的免费大模型API,具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术,尤其是Transformer架构,来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域,为用户提供了一个全面而高效的AI解决方案。 AI项目与工具 2025年06月12日 34 点赞 0 评论 268 浏览
VideoPoet VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应 AI项目与工具 2024年01月01日 98 点赞 0 评论 265 浏览
Video Alchemist Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧 AI项目与工具 2025年06月12日 26 点赞 0 评论 263 浏览
xLAM xLAM 是 Salesforce 开源的一款大型语言模型,专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能,并基于 Transformer 架构实现。它在多个基准测试中表现出色,适用于自动化任务、模板共享、插件开发和教育等多个应用场景。 AI项目与工具 2025年06月12日 55 点赞 0 评论 256 浏览
Vidu 1.5 Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。 AI项目与工具 2025年06月12日 80 点赞 0 评论 252 浏览