工具

PhotoKit

PhotoKit 集成了强大的在线照片编辑器

ARC实验室

ARC实验室,即腾讯ARC Lab,是腾讯PCG下属的一个研究中心,专注于探索和挑战智能媒体相关的前沿技术。该实验室被称为腾讯PCG的“侦察兵”和“特种兵”,代表着其在探索智能媒体技术领...

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

VideoFusion

VideoFusion 是一款开源的短视频处理工具,支持自动去除黑边、水印和字幕,智能旋转视频方向,提升画质,并兼容多种视频格式。具备批量处理、自定义设置和实时进度反馈功能,适用于视频创作者、自媒体运营及企业等多场景应用。

HubSpot

HubSpot 是一款集市场营销、销售、客户服务和内容管理于一体的客户关系管理(CRM)平台,依托人工智能技术优化客户数据管理与业务流程。它提供从潜在客户捕捉到销售跟踪的全面解决方案,支持团队在客户旅程中协同工作。基础版和多种付费版本满足不同企业需求,帮助提升效率并实现客户价值最大化。

Vid2World

Vid2World是由清华大学和重庆大学联合开发的创新框架,能够将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术,解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理,适用于机器人操作、游戏模拟等复杂环境,具有广泛的应用前景。

配音神器PRO

配音神器官网_文字转语音神器_配音神器pro_语音合成软件_专业配音神器_AI配音神器

CountAnything

CountAnything是一款结合计算机视觉技术的计数工具,用户可通过拍照或上传图片标注样本,实现物品的自动计数。其功能涵盖工业、农业、物流及建筑等多个应用场景,支持历史数据保存、结果定制等功能,帮助用户提升工作效率与准确性。

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛

Love键盘

Love键盘是一款专为恋爱交流设计的智能聊天工具,提供高情商回复建议、个性化键盘设置及多种聊天场景支持。用户可选择或自定义人设,获取适合的对话模板,提升沟通效率与表达能力。支持智能联想、云同步等功能,适用于情侣、朋友及商务场合的交流需求。