R

BnbIcons

BnbIcons是一款AI驱动的图标生成工具,能够创建类似Airbnb风格的等轴测图标。用户可通过文字描述或上传参考图片生成图标,提供464+个预设图标,支持批量生成和图标动画功能,适用于界面设计、原型设计、社交媒体内容等多种场景。

SurfSense

SurfSense是一款开源的AI研究工具,具备强大的搜索功能和自然语言交互能力。它支持多种外部数据源集成,如搜索引擎、Slack、Notion等,并允许用户上传多种格式的文件,整合到个人知识库中。SurfSense采用RAG技术,结合语义和全文搜索,提升检索效率和准确性。同时支持本地部署,保障数据隐私,适用于个人知识管理、学术研究、企业协作等多种场景。

Rork

Rork是一款AI驱动的无代码开发工具,能够根据用户自然语言描述快速生成跨平台移动应用。它支持iOS和Android平台,基于React Native技术,可一键发布到App Store和Google Play,并与多种后端数据库集成。Rork适合初创企业、非技术用户及快速原型开发,降低应用开发门槛,提升效率。

Morphik

Morphik是一款开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持图像、PDF、视频等多种格式的文档搜索,采用ColPali技术理解文档中的视觉内容,具备快速元数据提取功能,可提取边界框、标签、分类等信息。其主要功能包括多模态数据处理、智能解析文件、知识图谱构建、自然语言规则引擎和数据管理与集成,适用于技术文档处理、企业知识管理和智能应用开发等场景。

Slidev

Slidev 是一款基于 Markdown + Vue 技术栈的开源幻灯片制作工具,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能。它提供丰富的主题和样式选项,支持在线编辑器和快速启动命令,适合技术分享、教学培训、产品演示等场景。Slidev 还具备交互性强、开发友好、演讲者模式、绘图注解和多种导出格式等优势。

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架,能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术,支持多种物理材质和动作类型,实现逼真的动态效果。用户可通过简单操作与场景互动,生成丰富的物理响应。该工具具备交互式查看器,适用于AR/VR、影视特效、教育、游戏开发等多个领域。

Opera Neon

Opera Neon是Opera推出的AI Agent浏览器,基于智能Agent技术重新定义浏览器功能。它支持浏览网页、与用户合作完成任务,如研究主题、自动化工作流程和创建内容。核心功能包括聊天、执行任务和创作内容。用户可通过官网加入等待名单,目前处于邀请制。Opera Neon提供多种应用场景,如旅行规划、金融分析、内容创作、教育研究和任务自动化。其功能涵盖即时答案、研究、内容生成、导航网页完成

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略,将风格学习与一致性学习解耦,并支持与任意风格的 LoRA 模块集成,实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性,具备更高的灵活性和泛化能力,在实验中表现出与 GPT-4o 相当的性能。

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容

MagicTryOn

MagicTryOn是由浙江大学和vivo等机构开发的视频虚拟试穿框架,采用扩散Transformer(DiT)架构替代传统U-Net,结合全自注意力机制实现视频时空一致性建模。通过粗到细的服装保持策略,整合服装标记与多条件引导,有效保留服装细节。该工具在图像和视频试穿任务中表现优异,适用于在线购物、时尚设计、虚拟试衣间等多种场景。