WorldSense WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具,用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对,覆盖8大领域及26类认知任务,强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证,确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域,推动AI模型在多模态场景下的性能提升。 AI项目与工具 2025年06月12日 61 点赞 0 评论 224 浏览
CineMaster CineMaster是快手推出的3D感知视频生成框架,支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术,结合语义布局控制网络与摄像机适配器,提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。 AI项目与工具 2025年06月12日 68 点赞 0 评论 452 浏览
SeniorTalk SeniorTalk是全球首个面向中文超高龄老年人的语音数据集,涵盖202位75岁以上老人的55.53小时语音数据,覆盖16个省市,包含多种口音。数据通过两两自发对话采集,内容贴近真实交流场景,并附有多维标注,如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究,支持适老化设备、健康管理和辅助养老系统的开发,推动相关技术进步。 AI项目与工具 2025年06月12日 71 点赞 0 评论 297 浏览
小威智能Logo 小威智能LOGO是一款人工智能LOGO设计工具,兼具在线LOGO智能设计与商标注册查询功能,主要为创业者、中小微企业提供品牌LOGO设计服务。 图片处理 2025年06月05日 98 点赞 0 评论 270 浏览
Photor 一款简单易用且功能强大的在线截图美化工具,Photor提供了可以为截图添加背景颜色、阴影、圆角等元素,并支持多种标注方式。 图片处理 2025年06月05日 91 点赞 0 评论 429 浏览
Snipaste Snipaste是一款简单而强大的截图工具,能够帮助用户轻松截取屏幕内容并将其贴回到屏幕上。用户只需下载并打开Snipaste,按下F1键即可开始截图,按F3键 图片处理 2025年06月05日 38 点赞 0 评论 196 浏览
PixPin 一款功能强大、完全免费的截图、贴图工具,具备高效截图、图片标注、屏幕贴图、文字识别、屏幕录制、长截图等功能,可以满足办公等场景需求。 图片处理 2025年06月05日 40 点赞 0 评论 174 浏览