MM MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。 AI项目与工具 2025年06月12日 67 点赞 0 评论 804 浏览
Diffuse Diffuse 是一款基于 AI 技术的视频编辑工具,支持用户通过自拍照生成个性化虚拟角色,并结合文本或图像生成高质量视频内容。其功能包括动作模仿、文本到视频生成、预剪辑选择及提示编辑,适用于社交媒体、广告、教育等多种场景。该工具专注于移动端使用,提升视频创作的便捷性与灵活性。 AI项目与工具 2025年06月12日 78 点赞 0 评论 805 浏览
Publer AI Assist Publer AI Assist 使用最新的人工智能技术帮助您在几秒钟内生成内容、创建令人惊叹的图像并像专业人士一样回复评论。 裂变增长 2025年06月05日 66 点赞 0 评论 808 浏览
Chat Nio Chat Nio 是一款集成了丰富 AI 功能的一站式服务管理平台,支持文本、图像、音频和视频处理,兼容 OpenAI、Anthropic Claude 等多种 AI 模型。其主要功能包括文件解析、对话记忆、云端同步、多端适配等,同时提供开源版本以满足开发者的个性化需求。适用于个人用户、开发者及企业,支持多种应用场景,如客户服务、内容创作、数据分析和教育领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 812 浏览
Veo 3 Veo 3是谷歌推出的新一代视频生成模型,在I/O开发者大会上发布。它是首个能生成视频背景音效的模型,可合成画面并匹配人物对话和口型,支持1080P高质量视频生成,具备物理模拟与口型同步能力,可生成超过60秒的视频片段,并支持多种视觉风格。Veo 3整合了多项先进技术,适用于影视制作、广告营销及教育领域。 AI项目与工具 2025年06月11日 90 点赞 0 评论 815 浏览
LinFusion LinFusion 是一种创新的图像生成模型,基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长,显著提高生成效率。LinFusion 支持零样本跨分辨率生成,并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上,LinFusion 能够生成高达 16K 分辨率的图像,广泛应用于艺术创作、游戏设计、虚拟现实等领域。 AI项目与工具 2025年06月12日 96 点赞 0 评论 815 浏览
攻壳智能体 攻壳智能体是一个整合AI工具与智能体资源的平台,提供精选工具推荐、社区交流和前沿技术追踪等功能。涵盖智能体、AI浏览器、聊天助手、内容生成、数据分析等多个类别,适用于学习、办公、创作等多样化场景,助力用户高效利用人工智能技术。 AI项目与工具 2025年06月11日 85 点赞 0 评论 821 浏览
Kive Kive是一个基于AI技术的创意内容生成平台,帮助品牌和创作者快速生成、管理和扩展符合品牌形象的视觉内容。用户通过文字描述即可生成高质量的图片和视频,支持将真实产品图片融入AI生成场景中,提升视觉吸引力。平台提供创意资产管理功能,自动分类和索引视觉资产,提升工作效率。Kive适用于社交媒体内容创作、广告制作、品牌推广、创意设计和产品展示等多种场景。 AI项目与工具 2025年06月11日 90 点赞 0 评论 825 浏览