AI项目与工具

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

居然设计家

居然设计家是一款融合AI、3D、VR和大数据技术的家装设计平台,提供户型识别、智能设计、自由建模、全屋定制、海量模型资源及AI辅助设计等功能。用户可通过自然语言交互快速生成个性化设计方案,并支持多工具协同与实时渲染,适用于DIY、智能装修、导购、电商等多种场景,提升设计效率与用户体验。

Butterflies AI

Butterflies AI是一款支持用户定制个性化AI角色的社交平台。AI角色能够自主发布动态并与用户及其他AI角色互动。该平台允许用户通过定制外观、背景故事和性格来创造独特的虚拟形象,并通过深度社交互动、内容生成和情感交流提供丰富的用户体验。未来,该平台计划探索更多商业模式,并在游戏等领域提供更多元化的社交体验。

Vid2World

Vid2World是由清华大学和重庆大学联合开发的创新框架,能够将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术,解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理,适用于机器人操作、游戏模拟等复杂环境,具有广泛的应用前景。

Memoripy

Memoripy 是一款基于 Python 的开源库,专为 AI 应用设计,提供上下文感知的记忆管理功能。它支持短期和长期记忆存储,具备记忆检索、概念提取、图谱关联、层次聚类以及记忆衰减与强化等核心特性。Memoripy 可帮助 AI 系统更有效地理解用户交互,优化对话体验,广泛适用于聊天机器人、虚拟助手、教育软件、推荐系统及健康监测等领域。 ---

Kimi浏览器插件

Kimi浏览器插件是一款集成即时问答、全文摘要和划线互动功能的工具,支持用户通过划线提问获取上下文相关答案,并可一键生成文章摘要,提高阅读效率。划线互动功能还允许用户查看其他用户对特定文本的疑问和解答,增强社区互动。插件兼容多种浏览器,提供简洁的用户体验,适用于学术研究、资料查询、学习新知识、专业信息检索、内容创作等多个应用场景。

NMT

NMT是一种由UC Berkeley和阿里巴巴联合开发的多任务学习框架,通过将多任务优化问题转化为约束优化问题,实现高优先级任务性能的保障。它基于拉格朗日乘数法,结合梯度下降与上升算法,简化了超参数调整流程,提高了模型训练效率和稳定性。NMT适用于推荐系统、搜索引擎、自然语言处理和金融风控等多个领域,具有良好的兼容性和扩展性。

OminiControl

OminiControl是一款高效且参数节约的图像生成框架,专为扩散变换器模型设计,支持主题驱动和空间控制。通过增加少量参数,它能够生成高质量图像并保持主题一致性,适用于多种应用场景,包括艺术创作、游戏开发和广告设计等。其强大的多模态注意力机制和灵活的架构使其成为图像生成领域的创新工具。

MyLens

MyLens是一款AI驱动的可视化工具,支持将文字、数据或想法转化为时间线、思维导图、象限图等多种图表形式。具备多输入格式支持、智能生成和高可定制性,适用于内容创作、商业营销、教育及数据分析等多个场景。用户可根据需求选择不同版本,满足从个人到企业级的多样化需求。

OCode

OCode 是终端原生 AI 编程助手,为开发者提供深度代码库智能和自动任务执行功能。它与本地 Ollama 模型无缝集成,支持多文件重构、项目理解、开发自动化、数据处理、系统操作、交互式操作、文件操作、文本处理和开发工具等功能。OCode 通过终端原生工作流、深度代码库智能、自动任务执行、直接 Ollama 集成和可扩展插件层提升编程效率和质量,适用于前端开发、设计与开发协作、无代码开发、数据管