AI项目与工具

Knowt

Knowt 是一款人工智能学习工具,可将笔记、PDF 和视频内容转化为抽认卡,支持多种学习模式如练习测试和间隔重复。具备实时讲座笔记、PPT/PDF 摘要、拍照解题等功能,适合备考复习、课堂笔记和自主学习,提供丰富的学习资源和多设备同步支持。

GenXD

GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架,能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息,基于多视角时序模块分离相机与物体运动,并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合,适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。

MusicMint

MusicMint 是一款基于人工智能的音乐创作工具,支持多种音乐风格并提供高度自定义选项,如乐器、情绪、主题和结构等。用户可通过简单描述或选择参数快速生成原创音乐,并支持下载与分享。适用于个人创作、视频配乐、MV 制作及艺术项目等多种场景,是音乐爱好者和创作者的理想工具。

LANDR

LANDR是一款基于人工智能的音乐制作平台,提供从创作到分发的一站式解决方案。它通过AI母带处理优化音质,利用协作平台促进团队合作,借助样本库和插件丰富创作资源,并通过分发网络将作品推向全球市场。此外,LANDR还推出了“公平贸易AI”计划,支持艺术家参与工具开发并分享收益。

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型,结合了离散与连续视觉表示,实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务,并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

Read AI

Read AI是一款基于先进AI技术的全场景助手,主要功能涵盖自动会议记录、邮件管理、数据分析等,并可与多个主流平台无缝集成。它支持多语言操作,强调数据安全性,广泛适用于远程会议、办公室协作、项目管理、客户服务以及销售营销等领域,为企业和个人用户提供高效的工作体验。

Slide Dish

Slide Dish是一款旨在提升家庭烹饪与摆盘技能的移动应用,其核心功能包括AI驱动的食谱生成、详细的烹饪指导、摆盘创意以及购物清单管理。用户可依据现有食材或个人偏好获取定制化食谱,并通过社交平台与其他烹饪爱好者交流心得。此应用适用于家庭厨师、食材管理者、特殊饮食需求者以及烹饪初学者,帮助他们在日常烹饪、节庆宴请及技能提升中实现更佳表现。

Sweep AI

Sweep AI 是一款利用人工智能技术优化软件开发流程的工具,集成了大型语言模型与代码分析引擎,主要功能涵盖代码搜索、重构、测试生成以及文档创建等。它旨在帮助开发者提高工作效率,简化代码管理,并支持灵活定制化设置以满足不同团队的需求。

LayerDiffusion

LayerDiffusion是一种创新的AI工具,利用大规模预训练的潜在扩散模型生成具有透明度的图像。该技术引入了“潜在透明度”的概念,将图像的alpha通道透明度信息编码到潜在空间中。LayerDiffusion不仅可以生成单个透明图像,还能生成多个透明图层,支持条件控制生成和图层内容结构控制,确保高质量的图像输出。此外,它还能够生成多个透明图层,并通过共享注意力机制和低秩适应确保图层间的和谐混