学习

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型,专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题,并支持以即插即用的形式融入现有扩散模型,无需重新训练即可实现高效的空间控制。

Napkins.dev

Napkins.dev 是一款基于 AI 技术的开源工具,能够将用户上传的截图或线框图快速转化为可运行的网页应用程序。它利用 Meta 的 Llama 系列模型和 Together.ai 的推理服务,支持代码生成、编辑和定制,并具备多主题选择及版本管理功能,适用于快速原型开发、教育学习、初创公司以及 UI/UX 设计验证等场景。

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。

Concept Lancet

Concept Lancet(CoLan)是一种基于潜在空间稀疏分解的图像编辑框架,能够实现零样本、即插即用的精确概念替换、添加与移除。它通过构建视觉概念字典,结合扩散模型生成高质量图像,保持视觉一致性。适用于创意设计、影视制作、游戏开发等多个领域,提供高效的图像编辑解决方案。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

TMEStudio

腾讯音乐娱乐公司推出的一款在线音乐创作助手,包音乐分离、MIR计算、辅助写词、智能曲谱等创作工具。

Topaz Video AI 4

一家为专业人士提供基于人工智能的照片和视频增强软件的公司。他们的软件利用深度学习来提高图像质量,包括降噪、锐化、提升分辨率等功能。

PhotoMaker

PhotoMaker V2是腾讯推出的一款AI图像生成框架,能够快速生成逼真的人物照片。它在角色的一致性和可控性上取得了显著进步,用户可以通过文本指令进行精准控制。该工具利用深度学习技术和生成对抗网络(GANs),能够将文本描述转化为图像,并通过集成脚本增强生成过程的个性化和可控性。PhotoMaker V2广泛应用于游戏开发、电影制作、广告、社交媒体、艺术创作和教育等领域。

MyEssayWriter.ai

MyEssayWriter.ai 是一个创新的AI论文写作平台,提供高效、个性化的写作解决方案。平台采用先进的神经网络模型,生成符合学术标准的原创内容。用户可以节省时间,通过AI自动生成论文大纲和内容,并提高写作技能。该平台界面友好,支持多种论文类型,包括论证性、叙述性等,适用于学校、大学或任何学术需求。

北京大学人工智能研究院

北京大学人工智能研究院(Institute for Artificial Intelligence, Peking University)于2019年4月27日宣布成立,作为学校直属的独立实体机构,是统筹全校相关资源、建设世界一流...