IT

斯坦福大学

斯坦福大学(Stanford University),全名小利兰·斯坦福大学(Leland Stanford Junior University),简称“斯坦福”,位于美国加州旧金山湾区南部帕罗奥多市境内,临近高科技园区硅...

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校(UIUC)研究人员开发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术,显著提高系统吞吐量(1.3至3.4倍),降低延迟(降至原来的1/1.7至1/5),同时保持生成质量。该框架优化资源利用率,适用于智能客服、搜索引擎、企业知识管理等多种场景,为复杂A

GitHub MCP Server

GitHub MCP Server 是一款基于 Model Context Protocol (MCP) 的服务器工具,支持与 GitHub API 无缝集成,提供自动化工作流、问题管理、代码审查等功能。它可提升开发效率,简化仓库操作,并支持与多种开发工具集成,适用于代码管理、数据分析及智能审查等场景。

Reddit翻译助手

突破语言障碍,Reddit翻译助手让你可以用中文在Reddit上畅聊,无缝翻译帖子内容,,用中文写评论,自动转英文发布,支持一键翻译评论区。

n8n

n8n是一款开源的自动化工作流管理系统,采用低代码平台设计,支持拖放式工作流创建,无需编程即可实现复杂业务流程的自动化。其核心功能包括工作流自动化、多应用集成、数据转换与错误处理,同时具备强大的调试和日志记录能力。n8n基于Docker容器化部署,支持事件驱动和数据流处理,广泛应用于数据集成、报告生成、客户支持自动化及社交媒体管理等多个领域。

T

T-Rex Label是一款基于AI的自动标注工具,依托T-Rex2模型实现一键标注和零样本检测功能。它通过视觉提示简化标注流程,无需额外训练即可直接应用于多种场景,包括农业、工业、生物医药等。用户可通过GitHub账号快速登录并上传数据,利用AI自动生成初步标注结果,随后人工检查与修正,最终导出为常用格式供模型训练使用。

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

Open

Open-Sora是一个开源视频生成模型,基于DiT架构,通过三个阶段的训练(大规模图像预训练、大规模视频预训练和高质量视频数据微调),生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT(Spatial-Temporal Diffusion Transformer)核心组件,利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程,供