AI项目与工具

Mora

Mora是一个多智能体框架,专为视频生成任务设计,通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora,Mora仍能在生成高分辨率视频方面表现出色。

potis.ai

Potis.ai 是一款基于 AI 技术的招聘平台,通过自动化行为面试、智能面试协助和人才评分系统,帮助企业提升招聘效率,降低时间和成本支出。平台支持无缝集成至现有流程,提供详尽的候选人反馈和团队协作优化功能,适用于远程招聘、大规模招聘及技术岗位评估等多种场景。

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型,基于 Qwen2.5-VL 架构,结合强化学习优化技术,具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析,支持自然语言指令定位图像目标,并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

Shop like a Pro

Shop Like a Pro是一款基于AI技术的购物助手,支持用户在Perplexity平台上完成商品搜索、分析与购买的一站式服务。它通过整合全网评论数据,为用户提供个性化推荐和全面的产品信息,同时具备一键结账、视觉搜索及商家信息展示等功能,旨在提升购物效率并帮助用户做出明智决策。

easypic

Easypic 是一款基于人工智能的在线图片处理工具,专为快速去除图片背景而设计。它支持多种图片格式和应用场景,如人像、电商产品、动植物及设计元素等。工具具备高效的AI抠图能力,可保持图像主体完整性,并提供背景替换和高清导出功能。目前,Easypic 为用户提供免费服务,适合各类图像编辑需求。

LightRAG

LightRAG是一种由香港大学研究团队设计的检索增强生成系统,融合了图结构索引与双层检索机制,显著提高了大型语言模型的信息检索精度和效率。其核心功能包括复杂查询处理、准确答案生成、动态数据适应以及检索效率优化。通过增量更新算法和实体关系提取技术,LightRAG在多领域如搜索引擎优化、智能客服、个性化推荐、教育科研及医疗咨询中展现出广泛应用前景。

HoloTime

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架,可将单张全景图像转化为动态视频,并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器(Panoramic Animator)和时空重建技术,结合 360World 数据集进行训练,实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用,适用于虚拟旅游、影视制作、游戏开发等多个领域,提供高效的沉

Pocket Flow

Pocket Flow 是一个极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。它具有轻量级、无依赖、无厂商锁定的特点,支持多 Agents、工作流、检索增强生成(RAG)等功能,帮助开发者快速构建基于 LLM 的应用程序。基于 Agentic Coding 范式,AI Agents 协助开发,提升效率。适用于多种编程语言,适合希望用极简方式开发 LLM 应用的开发者。

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架,基于DINOv2模型,能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态,支持身份和表情的解耦,并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。