AI项目与工具

Glasp

Glasp是一款集高亮标注、笔记管理和AI辅助于一体的多功能工具,支持用户在网页和PDF文档上标记重要信息,并通过AI技术生成个性化见解。它具备社交共享功能,支持多平台集成,适合学术研究、在线学习及团队协作等多种场景,助力用户高效管理知识资产。

HMoE

HMoE(混合异构专家模型)是腾讯混元团队提出的一种新型神经网络架构,旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据,HMoE增强了模型的专业化程度,并采用了新的训练目标和策略,如P-Penalty Loss,以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色,适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型,支持实时交互与动态世界生成,确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠,有效解决多人游戏中的同步难题。模型训练成本低,可在普通PC上运行,且项目全面开源,适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

MyTeachers.ai

MyTeachers.ai是一款面向8岁以上学习者的AI辅助学习平台,集古诗文学习、写作辅导、作文批改、单词记忆等功能于一体。它通过智能化手段解决学生在学习过程中遇到的问题,尤其擅长处理古诗词与文言文相关内容,并提供个性化推荐和综合信息问答服务,助力家庭实现高效、全面的学习支持。

Shaped

Shaped 是一款基于人工智能技术的搜索引擎,能够根据用户行为和偏好提供个性化的推荐内容。它利用智能搜索技术来理解用户意图,并通过实时学习用户反馈不断优化推荐结果。此外,Shaped 支持多数据源集成,并且易于通过API接入。其应用场景包括电商平台的商品推荐、内容发现、搜索引擎优化、社交媒体分析以及市场动态监测等。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

A2E

A2E是一款基于AI技术的数字人视频创作平台,支持通过照片、视频或文本生成高度逼真的虚拟形象,具备声音克隆、多语言翻译、视频生成及形象换脸等功能。适用于内容创作、教育、营销等多个领域,帮助用户降低创作门槛,提升内容效率与表现力。

OneDiffusion

OneDiffusion是一种多功能的大规模扩散模型,支持文本到图像生成、条件图像生成、图像理解等多种任务。它通过序列建模和流匹配框架实现灵活的图像生成能力,适用于艺术创作、广告设计、游戏开发等多个领域,具备高度的扩展性和统一性。

CodeBuddy

CodeBuddy 是腾讯云推出的 AI 编程助手,支持代码补全、诊断、优化、重构、测试生成及代码评审。其 Craft 模式通过自然语言指令实现应用开发,降低编程门槛。兼容 MCP 生态,支持多语言与主流框架,提供智能体交互与工程理解能力,提升开发效率与代码质量。

Open Computer Agent

Open Computer Agent 是一款基于云端的 AI 工具,支持在 Linux 虚拟机中运行,能通过自然语言指令完成多种任务。结合视觉模型实现界面元素识别与交互,具备任务自动化、多任务处理能力,并提供云托管服务,适用于办公、教育、数据收集等场景。