开源
Snap Video
强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表...
ChatMusician
通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
ScreenAgent
一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
Depth Anything
强大的单目深度估计工具,它通过利用大规模未标注数据和先进的数据增强技术,实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。