生成 - 智狐AI导航

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具，可生成高质量、自然的说话人头部视频。支持多信号控制（如音频、表情），采用并行 Mamba 结构和门控机制，实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异，适用于虚拟主播、远程会议、在线教育等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 736 浏览

FoxBrain

FoxBrain是由鸿海研究院推出的大型语言模型，基于Meta Llama 3.1架构，拥有70B参数，专注于数学与逻辑推理领域。其采用高效训练策略，结合高质量中文数据与Adaptive Reasoning Reflection技术，提升推理能力。FoxBrain适用于智能制造、智慧教育、智能办公等多个场景，支持数据分析、代码生成、文书协作等功能，具备较强的上下文处理能力和稳定性。

AI项目与工具 2025年06月12日 97 点赞 0 评论 736 浏览

AI推理模型有哪些？13个支持深度思考的推理模型

本文介绍了13款支持深度思考的AI推理模型，涵盖数学、代码、自然语言推理等多个领域。这些模型通过强化学习和大数据分析，能够高效处理复杂问题，提供精准的决策支持。部分模型具备多模态处理能力、透明推理过程及开源特性，适用于不同应用场景，如教育、医疗和科研等。

AI项目与工具 2025年06月11日 88 点赞 0 评论 736 浏览

Onlook

Onlook 是一款开源的视觉编辑工具，专为 React 应用设计，支持设计师和开发人员在浏览器中实时修改 UI 并自动生成代码，提升协作效率。所有操作在本地完成，确保数据安全，兼容 React 和 TailwindCSS，未来将扩展至更多框架。适用于快速原型设计、设计与开发协作、设计系统维护等场景。

AI项目与工具 2025年06月12日 71 点赞 0 评论 736 浏览

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架，能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动，创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频，具有低延迟的特点，并且能够处理多种类型的输入，如艺术照片、歌唱音频和非英语语音。此外，通过灵活的生成控制，用户可以调整输出的多样性和适应性。

AI项目与工具 2025年06月12日 83 点赞 0 评论 736 浏览

Telescope 2.0

Telescope 2.0是一款基于AI技术的销售线索生成平台，支持用户自定义搜索条件并借助AI算法优化结果，提升线索质量。平台拥有庞大的全球B2B数据库，涵盖9亿个人和5000万家企业信息，支持多渠道数据整合与实时更新，适用于销售、市场、业务拓展和招聘等场景，提升客户定位与外联效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 736 浏览

Airtop

Airtop是一款AI浏览器自动化工具，基于低成本可扩展的云浏览器，让用户能轻松抓取和控制任何网站。其AI Agent能像人类一样登录浏览网页，支持OAuth、2FA和验证码解决。用户可通过自然语言指令引导浏览器完成任务，无需复杂脚本。Airtop提供实时人工干预功能，适用于数据抓取、自动化测试、内容生成、自动化营销等多种场景，帮助用户高效完成自动化任务。

AI项目与工具 2025年06月11日 67 点赞 0 评论 736 浏览

知乎直答

知乎推出的一款使用AI大模型技术的全新搜索问答智能产品。它以知乎社区的优质内容为核心，结合多种数据源，为用户提供简略和深入两种答案生成结果

AI搜索问答 2025年06月05日 36 点赞 0 评论 736 浏览

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型，具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程，支持FP16和Q4_K_M量化版本，确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域，为用户提供便捷、高效的语音交互体验。

AI项目与工具 2025年06月12日 95 点赞 0 评论 735 浏览

AIPaperPass

AI PaperPass，AI论文写作，千字大纲免费，10分钟三万字极速体验。

AI写作对话 2025年06月05日 14 点赞 0 评论 735 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期