IT - 智狐AI导航

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示，生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题，并采用部分参数训练和多任务训练策略，保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

AI项目与工具 2025年06月11日 11 点赞 0 评论 547 浏览

INFINITE ALBUM

适合游戏玩家的自适应 AI 音乐

创作工具 2026年06月21日 0 点赞 0 评论 548 浏览

AskBot员工AI助手

新一代企业级内部数智化解决方案

创业营销 2026年06月21日 0 点赞 0 评论 549 浏览

斯坦福大学

斯坦福大学（Stanford University），全名小利兰·斯坦福大学（Leland Stanford Junior University），简称“斯坦福”，位于美国加州旧金山湾区南部帕罗奥多市境内，临近高科技园区硅...

教育学习 2026年06月21日 0 点赞 0 评论 554 浏览

n8n

n8n是一款开源的自动化工作流管理系统，采用低代码平台设计，支持拖放式工作流创建，无需编程即可实现复杂业务流程的自动化。其核心功能包括工作流自动化、多应用集成、数据转换与错误处理，同时具备强大的调试和日志记录能力。n8n基于Docker容器化部署，支持事件驱动和数据流处理，广泛应用于数据集成、报告生成、客户支持自动化及社交媒体管理等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 555 浏览

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校（UIUC）研究人员开发的高效推理框架，旨在提升基于大型语言模型（LLM）的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术，显著提高系统吞吐量（1.3至3.4倍），降低延迟（降至原来的1/1.7至1/5），同时保持生成质量。该框架优化资源利用率，适用于智能客服、搜索引擎、企业知识管理等多种场景，为复杂A

AI项目与工具 2025年06月11日 56 点赞 0 评论 558 浏览

Pixite.Ai

Pixite是一个创新平台，它使用 AI 技术让您从T恤开始设计个性化服装，我们用户友好的界面将指导您选择设计元素、图案、颜色等，从而制作出反映您风格的独特时尚单品。

电商运营 2025年06月05日 44 点赞 0 评论 559 浏览

Open

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 559 浏览

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 559 浏览

iThinkScene

灵境之城旗下的产品，iThinkAi平台的产品涵盖多个领域，包括iThinkAi工具集、iThinkChat和iThinkScene

Ai学习资源 2025年06月05日 42 点赞 0 评论 559 浏览

IT

首页

IT

列表

默认

浏览次数

发布日期