生成 - 智狐AI导航

DICE

DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架，能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模，结合情感关联增强和判别机制，确保生成内容的情感一致性与视觉质量。该工具支持多模态输入，具备良好的泛化能力和用户自定义功能，适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。

AI项目与工具 2025年06月11日 87 点赞 0 评论 639 浏览

Picsman

Picsman是一款集成了多种AI图像处理功能的在线工具，支持一键抠图换背景、消除笔、批量编辑、AI背景生成及图片高清化等功能。其操作简单，适用于电商、社交媒体等多种场景，能显著提升图像质量与视觉表现力，同时提供丰富的设计资源辅助内容创作。

AI项目与工具 2025年06月11日 90 点赞 0 评论 669 浏览

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具，支持文本、语音、草图等多种输入方式，具备实时生成能力。其采用单双流DiT架构和多模态大语言模型，生成图像写实性强、细节丰富，且响应速度快，适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作，实现高效的图像创作体验。

AI项目与工具 2025年06月11日 41 点赞 0 评论 559 浏览

Codex

Codex是OpenAI推出的AI编程工具，支持自然语言指令生成代码、代码补全、测试生成、错误修复等功能。它可在云端沙箱中并行处理任务，提升开发效率与安全性。适用于开发者、项目经理、教育者及非技术用户，能优化代码结构、提供实时反馈，并与主流开发工具集成，降低编程门槛。

AI项目与工具 2025年06月11日 57 点赞 0 评论 549 浏览

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型，结合自回归与扩散模型优势，实现高效图像理解和生成。基于CLIP语义特征，支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略，提升模型性能。完全开源，适用于创意设计、视觉问答、艺术生成等多种场景。

AI项目与工具 2025年06月11日 12 点赞 0 评论 671 浏览

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架，通过过渡标记和局部注意力掩码策略，实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景，适用于影视、广告、教育、游戏等领域，具备高效、灵活和可扩展的技术特点。

AI项目与工具 2025年06月11日 73 点赞 0 评论 538 浏览

Index

Index-AniSora是由哔哩哔哩开发的动漫视频生成模型，支持多种动画风格的生成，涵盖番剧、国创、VTuber等内容。其核心技术包括扩散模型、时空掩码模块和Transformer架构，具备图像到视频生成、帧插值、局部引导等能力。模型提供高质量数据集，适用于动画制作、创意验证、教育及营销等多个领域。

AI项目与工具 2025年06月11日 32 点赞 0 评论 763 浏览

Tersa

Tersa 是一款开源免费的 AI 工作流构建平台，提供直观的拖放界面，支持 77 个主流 AI 模型，如 GPT-4o、Claude 3.5 Sonnet、DALL-E 3 和 Whisper 等，适用于文本生成、图像视频创作、音频转录和代码优化等多种任务。用户可通过拖放文件快速构建复杂流程，无需编程基础，广泛应用于内容生成、代码审查、原型开发和多模态功能集成等领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 479 浏览

WorldPM

WorldPM是由阿里巴巴Qwen团队与复旦大学联合开发的偏好建模模型系列，基于1500万条数据训练，适用于对话系统、推荐系统等任务。模型支持多种微调版本，具备强大的泛化能力和鲁棒性，适用于低资源和高规模场景。支持Hugging Face平台部署，适用于语言生成优化、个性化推荐、智能客服及内容审核等应用场景。

AI项目与工具 2025年06月11日 51 点赞 0 评论 537 浏览

Fluig

Fluig 是一款基于 AI 的图表生成工具，可将文字、文档或代码快速转化为多种专业图表，如思维导图、流程图等。支持多模态输入和智能格式转换，操作简便，适合无设计背景的用户使用。提供实时协作功能，适用于教育、商业、研究等多个场景，提升信息可视化与团队协作效率。

AI项目与工具 2025年06月11日 35 点赞 0 评论 604 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期