开源

Pixtral Large

Pixtral Large是一款由Mistral AI开源的超大规模多模态模型,具备1240亿参数,支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口,能在多语言环境中处理复杂文档和多图像场景,广泛应用于教育、医疗、客服和内容审核等领域。

FoloUp

FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。

AgiBot World

AgiBot World是一个由智元机器人开发的百万真机数据集,专注于具身智能技术的研究。它涵盖了80多种日常生活技能,涉及家居、餐饮、工业、商超及办公五大场景,数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地,通过8个摄像头和6自由度灵巧手等先进硬件,确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

Surya

Surya是一款开源OCR工具包,专注于文档识别,支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素,并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法,Surya在处理复杂文档时表现出色,广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

XVERSE

XVERSE-MoE-A36B是一款由中国元象公司开发的先进MoE(混合专家模型)开源大模型。该模型具备2550亿总参数和360亿激活参数,性能卓越,训练时间缩短30%,推理性能提升100%。它采用前沿的MoE架构,通过稀疏激活、专家网络和门控机制等技术,实现了高效性能和低成本部署。适用于自然语言处理、内容创作、智能客服、教育辅助、信息检索及数据分析等多个领域。

Mermaid Chart

一个应用于协作式文本图表的平台,它利用人工智能生成复杂思想的可视化图表。

PeterCat

PeterCat是一款基于开源技术的智能问答机器人,能够通过自动构建的知识库与GitHub相关功能交互,提供对话式答疑服务。它支持多模型适配、多集成方式,并具备强大的自然语言处理能力和自动化工具支持。主要应用场景涵盖开源项目支持、企业内部论坛、在线教育平台以及客户服务等领域,旨在提升技术交流与问题解决效率。

HuggingChat macOS

HuggingChat macOS是一款基于开源语言模型的聊天应用程序,专为macOS平台打造。它支持多款顶级开源大语言模型,具备网络搜索、代码高亮等功能,同时提供模型管理及本地推理引擎支持。这款工具适用于日常交流、信息查询、语言学习、编程辅助及内容创作等多种场景。

万相首尾帧模型

万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源视频生成工具,基于DiT架构和交叉注意力机制,可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效,适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能,且提供GitHub和HuggingFace开源资源供用户使用。

Lepton Search

Lepton Search 是一个基于对话式AI的搜索引擎,由前阿里巴巴技术副总裁及AI科学家贾扬清创立的Lepton AI应用构建平台开源。它通过集成大语言模型和调用Bing搜索API,实现了自然语言交互和精准搜索。其开源特性、对话式搜索能力、内置大语言模型支持、搜索引擎集成、可定制化用户界面以及搜索结果的高效管理,使其成为一款功能全面、灵活且高效的AI工具。