研究

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集,包含500个第一人称视角视频,涵盖77种日常活动,支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务,测试模型对长时间视频内容的信息识别与综合能力,推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制,使其成为学术研究的重要工具。

NextGenAI

NextGenAI是由OpenAI发起的全球合作项目,联合多所顶尖高校与机构,推动AI在教育、医疗、科研等领域的应用。该项目提供计算资源与技术支持,助力研究突破、教育革新与知识共享,强化学术与产业合作,促进AI技术的广泛应用与发展。

Text to Bark

Text to Bark 是由 ElevenLabs 推出的全球首个 AI 狗语文本转语音模型,能将文字转化为高度逼真的狗吠声,支持多种犬种选择和语气调整。技术基于深度学习和犬类语言学研究,适用于宠物训练、科研、娱乐及家庭互动等多种场景,具备良好的可扩展性和实用性。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

WebThinker

WebThinker是一款由多家科研机构联合开发的AI工具,旨在增强大型推理模型在复杂任务中的表现。它支持自主搜索、网页导航与实时报告生成,结合深度网页探索器和强化学习策略,提升信息获取与内容创作的效率与质量。适用于科学研究、数据分析、教育辅助等多种场景,显著增强了模型在知识密集型任务中的可靠性与实用性。

Hika AI搜索引擎

一款免费的知识获取AI搜索引擎,HIKA为你探索世界提供全新的方式与思路,你提出问题,HIKA会实时搜索网络,深度思考并给出答案。

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型,专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,实现对复杂视觉语言任务的高效处理,包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

BenTsao本草

BenTsao本草是一个专注于中文医学领域的大语言模型,它通过指令微调和丰富的医学知识库,为医疗健康专业人士提供了一个强大的信息处理和决策支持工具。

BeaGo

BeaGo是一款由零一万物开发的智能AI搜索助手,集文字与图像搜索于一体,具备强大的语义理解和个性化推荐功能。它能够快速生成简洁的信息摘要,提供可靠的搜索结果,并支持划词搜索和图文结合展示,广泛适用于日常生活、学术研究、工作辅助及学习辅导等多个场景。

谷歌趋势

一个由谷歌提供的免费分析工具,谷歌趋势允许用户搜索和比较关键词的趋势。它通过分析全球搜索数据,帮助用户了解不同地区和时间段的搜索热度。