AI - 智狐AI导航

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 887 浏览

Droidrun

Droidrun是一款基于AI的Android设备自动化工具，结合视觉识别、UI解析与LLM推理技术，支持自然语言控制和多平台部署。它能执行复杂任务自动化，具备自愈机制、多LLM兼容性及丰富的扩展接口，适用于AI助手、数据交互、测试验证等多种场景。

AI项目与工具 2025年06月11日 72 点赞 0 评论 887 浏览

TokenSwift

TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架，可在90分钟内生成10万Token文本，效率较传统模型提升3倍，且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术，支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 888 浏览

吐司AI换脸

吐司AI换脸是一款基于ComfyUI Workflow的图像处理工具，支持高质量人像换脸。用户只需上传目标图像和参考人脸图像，即可快速生成自然逼真的换脸效果。该工具提供精细化遮罩处理、面部修复、风格统一等功能，并兼容多种模型和版本。适用于影视、广告、艺术创作、社交媒体及游戏开发等多个领域，操作简便，效果出色。

AI项目与工具 2025年06月12日 83 点赞 0 评论 888 浏览

o3

o3-pro 是 OpenAI 开发的高级推理模型，继承并优化了 o3 的功能，在复杂问题解决和精确答案提供上表现出色。它集成了 ChatGPT 的多种工具，如网页搜索、文件分析、图像推理和编程等，适合科学研究、编程、教育和写作等领域。尽管响应速度稍慢，但在表达清晰度、逻辑准确性和答案完整性方面表现优异，并在数学、科学和编程等领域的性能上超越了前代模型。

AI项目与工具 2025年06月12日 44 点赞 0 评论 888 浏览

AndroidGen 是一个基于大语言模型（LLM）的智能代理框架，专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练，结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块，增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色，适用于自动化任务处理、

AI项目与工具 2025年06月12日 31 点赞 0 评论 888 浏览

Mokker AI背景生成器

Mokker，AI背景生成器，只需导入图片，即可完成从抠图到制作新图的过程。

Ai绘画生成 2025年06月05日 15 点赞 0 评论 888 浏览

智谱清言

智谱清言AI助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2，经过万亿字符的文本与代码预训练，并采用有监督微调技术，以通用对话的形式为用户提供智能化服务。

Ai办公效率 2025年06月05日 25 点赞 0 评论 888 浏览

海螺AI

海螺AI是一款由MiniMax打造的AI视频生成工具，凭借其强大的文本转视频能力和图像扩展功能，可快速生成高质量、情感丰富的视频内容。支持多种语言、风格和场景定制，具备高清画质输出、智能审核及模板选择等功能，广泛应用于社交媒体、营销、影视制作、教育等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 888 浏览

Motion Dreamer

Motion Dreamer是由香港科技大学（广州）研发的视频生成框架，采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制，支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能，已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 888 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期