实时 - 智狐AI导航

Claude 3

Claude 3是由Anthropic开发的一系列先进的人工智能模型，旨在提供强大的认知能力和处理复杂任务的能力。该模型家族包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，它们分别针对不同的应用场景进行了优化。Claude 3 Opus在多个基准测试中超越了GPT-4/3.5和Gemini 1.0 Ultra/Pro，展示了其在智能水平上的显著优势。该

AI项目与工具 2024年01月01日 65 点赞 0 评论 673 浏览

StreamMultiDiffusion

StreamMultiDiffusion是一款开源的实时交互式图像生成框架，结合了扩散模型的高质量图像合成能力和区域控制的灵活性。用户可以实时生成和编辑图像，通过文本提示和手绘区域生成特定部分的图像，提供高质量的图像输出。其主要功能包括实时图像生成、指定区域文本到图像生成、直观的用户界面、多提示流批处理架构、快速推理技术、区域控制、稳定化技术和Semantic Palette交互式图像生成。

AI项目与工具 2024年01月01日 95 点赞 0 评论 815 浏览

LATTE3D

LATTE3D 是由英伟达多伦多AI实验室开发的一种高效生成高质量3D对象的模型。它基于文本描述，能在约400毫秒内生成逼真的3D内容。LATTE3D采用摊销优化方法，增强了对新提示的适应能力。该模型支持文本到3D合成、快速生成、高质量渲染及3D风格化功能，适用于多种应用场景。

AI项目与工具 2024年01月01日 41 点赞 0 评论 718 浏览

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架，能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动，创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频，具有低延迟的特点，并且能够处理多种类型的输入，如艺术照片、歌唱音频和非英语语音。此外，通过灵活的生成控制，用户可以调整输出的多样性和适应性。

AI项目与工具 2025年06月12日 83 点赞 0 评论 721 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 854 浏览

MimicBrush

MimicBrush是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的AI图像编辑工具，通过参考图像模仿和自动区域识别功能，支持对象替换、样式转换和纹理调整等多种图像编辑操作。它具备实时预览、一键编辑和高度自适应的特点，广泛应用于产品设计、时尚、美容、广告、社交媒体内容创作及电子商务等多个领域。

AI项目与工具 2024年01月01日 77 点赞 0 评论 766 浏览

Poe AI新功能「Previews」

Poe AI是一个集成多个强大AI聊天机器人的平台，用户可以通过统一界面与多个AI聊天机器人互动，获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用，支持交互体验，简化编程和设计流程，提高开发效率。该功能支持多种类型的应用程序，包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话，并且可以无缝切换，获取不同的解决方案或优化

AI项目与工具 2025年06月12日 77 点赞 0 评论 855 浏览

墨问便签

墨问便签是一款专为创作者设计的AI便签工具，提供长达10分钟的语音录制和实时转录功能。用户可以即时查看并编辑语音转录的文字内容，享受AI自动润色服务，包括分段、纠正错别字及删除重复词等。该工具还具备笔记私密或公开选项，方便用户记录灵感，激发创作思维，其轻量级设计使用户能够随时随地捕捉灵感，成为创作者的理想助手。

AI项目与工具 2025年06月12日 41 点赞 0 评论 913 浏览

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序，集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型，它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译，适用于多语言环境。通过集成OCR技术，它能够生成图文并茂的多媒体记录，显著提高工作效率。

AI项目与工具 2025年06月12日 52 点赞 0 评论 488 浏览

Sync Labs

Sync Labs是一款基于AI技术的视频配音工具，其主要功能是实现实时唇形同步，支持多种语言。该工具无需用户进行额外的训练，通过简单的界面操作即可实现音频与视频的完美匹配。它适用于电影、播客、游戏和广告等多种视频内容制作，同时提供了开放API，方便集成到各类应用和服务中。

AI项目与工具 2025年06月12日 96 点赞 0 评论 502 浏览

实时

首页

实时

列表

默认

浏览次数

发布日期