R

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

Steamer

Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型,能够将静态图像转化为动态视频,具备卓越的视觉生成能力。该模型基于 Transformer 扩散架构,支持多模态输入,包括中文文本提示和参考图像,实现像素级的画面控制与电影级构图效果。在 VBench 评测中荣获榜首,生成高清 1080P 视频,优化时间一致性与运动规律性,适用于广告、影视、游戏开发和内容创作等多个领域。

Compo AI

Compo AI,它是一个web组件驱动的平台,可让您通过一行文本创建、设计、管理和开发您的页眉、页脚、按钮、表单等组件。

Objaverse

Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。

MaskSearch

MaskSearch是阿里巴巴通义实验室推出的新型通用预训练框架,通过检索增强掩码预测(RAMP)任务提升大型语言模型(LLM)的智能体搜索能力。该工具利用外部知识库和搜索工具预测被掩盖的关键信息,增强模型对复杂问题的理解和回答能力。结合SFT和强化学习(RL)训练方法,采用多智能体协同生成思维链数据,并引入课程学习策略优化模型性能。适用于智能客服、教育、企业搜索及机器学习模型调试等多个场景。

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型,具备结构化推理和透明性,支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试,涵盖4000多个推理步骤,用于全面评估推理能力。其性能优于多个开源模型,适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景,具有高准确性和可解释性。

Resume Matcher

Resume Matcher 是一个免费的开源项目,专门为开发者设计,以简化简历创建过程并加速求职搜索。

SurfSense

SurfSense是一款开源的AI研究工具,具备强大的搜索功能和自然语言交互能力。它支持多种外部数据源集成,如搜索引擎、Slack、Notion等,并允许用户上传多种格式的文件,整合到个人知识库中。SurfSense采用RAG技术,结合语义和全文搜索,提升检索效率和准确性。同时支持本地部署,保障数据隐私,适用于个人知识管理、学术研究、企业协作等多种场景。

马萨诸塞大学阿默斯特分校

马萨诸塞大学,又译麻省大学(University of Massachusetts,简称UMASS),是美国公立大学系统。马萨诸塞大学起源于1863年建立在美国麻省安姆斯特镇(Amherst)的马萨诸塞大学阿默...

iConStore

一个提供免费矢量图标的在线资源库,由一流设计师创作,iConStore提供多种格式的图标,包括 SVG 格式,适合个人和商业项目使用。