AI

星搭

星搭致力于构建一套基础设施,将AI模型搭建与应用开发的过程可视化地整合在一起

书生·浦像

书生·浦像是由多家科研机构联合开发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。它结合AIGC与HDR技术,在极端光照条件下实现图像细节修复和高质量输出,有效解决动态场景中的运动伪影问题。适用于摄影、手机成像和自动驾驶等领域,具有多曝光融合、动态处理、色调映射等功能,提升了图像的鲁棒性与真实感。

NotebookMLX

NotebookMLX 是一款基于 MLX 技术开发的开源工具,支持将 PDF 文档转换为音频播客。它通过 PDF 预处理、播客脚本生成、文本优化以及文本转语音等功能,实现了从 PDF 文件到高质量音频内容的全流程自动化处理,适用于教育、播客创作、有声书制作等多个领域,显著提升了信息传播效率和用户体验。

Bild AI

Bild AI 是一款面向建筑行业的智能工具,利用人工智能技术解析建筑图纸,自动生成材料清单与成本估算,并检测图纸是否符合建筑规范。它具备蓝图一致性验证、材料统计、合规性审查及智能修正建议等功能,适用于建筑设计、招投标、施工准备及许可证申请等多个环节,提升项目前期工作的效率与准确性。

YT Navigator

YT Navigator 是一款基于 AI 的 YouTube 内容检索工具,支持自然语言查询、语义搜索和视频内容交互。用户可快速定位视频片段并获取时间戳,提升信息获取效率。适用于研究、学习、创作和分析等场景,具备频道管理、安全会话等功能。采用向量嵌入与 BM25 算法结合的搜索机制,提高搜索准确率,项目已开源。

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型,具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互,适用于智能客服、教育、医疗等多个领域,提升人机对话的自然度与效率。

Fourier N1

Fourier N1是一款由傅利叶推出的开源人形机器人,具备23个自由度,可完成复杂动作如单足站立、坡道通行和楼梯攀爬。搭载自研控制系统和FSA 2.0执行器,支持高速稳定运行。支持多模态交互,适用于教学、康复辅助、物流搬运、家务服务及灾难救援等领域,提供全面的开源资源以支持开发与研究。

codeAI

一款革命性的VS Code插件,为开发人员提供了基于人工智能的代码生成、单元测试创建和文档生成能力。

kadoa

Kadoa是一款基于AI技术的网络数据抓取工具,支持从网页、PDF等多种非结构化数据源中自动化提取并处理信息。其主要特点包括无代码操作界面、数据工作流自动化、对数据源变化的高度适应性以及强大的数据转换功能。Kadoa广泛应用于金融数据分析、零售行业竞争情报、大规模语言模型的数据准备以及品牌声誉管理等领域,为企业提供高效且实用的数据支持。

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型,支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能,适用于自动化任务执行和复杂交互场景。支持云端与本地部署,提供丰富的开发接口,便于集成与扩展。