AI项目与工具

FeedMe

FeedMe是一款面向Android用户的离线RSS阅读工具,支持多种订阅源,具备内容聚合、自动更新和AI摘要功能。用户可离线阅读文章和播客,提升信息获取效率。基于Web技术构建,支持跨平台使用和个性化部署,适用于日常信息浏览、学习研究、行业跟踪和个人兴趣管理等多种场景。

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型,具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程,支持FP16和Q4_K_M量化版本,确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域,为用户提供便捷、高效的语音交互体验。

HMA

HMA(Heterogeneous Masked Autoregression)是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法,支持离散与连续生成模式,可处理不同动作空间的异构性。该工具具备高效实时交互能力,广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域,适用于机器人学习与控制任务,提升策略泛化与执行效率。

Janus

Janus是一种由DeepSeek AI开发的自回归框架,专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能,支持多种输入模态如图像、文本等,并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力,适用于图像创作、自动标注、视觉问答等多个领域。

Project Turntable

Project Turntable是一款由Adobe发布的AI工具,支持用户在三维空间中旋转二维矢量图像,并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率,减少了重复性劳动,适用于平面设计、插画创作、动画制作及游戏开发等领域,同时保持了图像的二维特性和平滑过渡效果。

Hiwaifu

Hiwaifu是一款利用AI技术打造的互动平台,支持用户与AI进行深度对话,并允许用户根据个人偏好定制AI伴侣的外貌、性格及兴趣。平台注重隐私保护,提供安全的交流环境,适用于情感陪伴、名人模拟对话、个性化定制以及社交技能提升等场景。

Onlook

Onlook 是一款开源的视觉编辑工具,专为 React 应用设计,支持设计师和开发人员在浏览器中实时修改 UI 并自动生成代码,提升协作效率。所有操作在本地完成,确保数据安全,兼容 React 和 TailwindCSS,未来将扩展至更多框架。适用于快速原型设计、设计与开发协作、设计系统维护等场景。

ShowBiz AI

ShowBiz AI是一款基于BlackEye多模态视听大模型的专业级AI视频创作平台,专注于文本转动画、全流程AI赋能以及多种视频编辑功能。它支持从文案生成到分镜脚本设计再到编辑工具的一站式服务,涵盖横屏转竖屏、慢动作生成、抠像、扩图、擦除、高光处理、语音转写及语音生成等功能,旨在提升视频制作效率并降低创作成本,同时激发创意灵感。

Jobscan

Jobscan 是一款专注于简历优化的 AI 工具,主要功能包括 ATS 匹配分析、关键词优化、简历生成和 LinkedIn 优化。它帮助求职者提升简历通过招聘系统的概率,并提供实时编辑建议。适用于求职准备、简历调整及职业发展等多个场景,支持免费和付费版本,满足不同用户需求。

MCP

MCP(Model Context Protocol)是一项由Anthropic开源的协议,专注于实现大型语言模型(LLM)与外部数据源和工具的无缝集成。其核心功能包括数据集成、工具集成、模板化交互、安全性、开发者支持及上下文维护,支持双向数据流并内置安全机制。MCP适用于AI驱动的集成开发环境、增强聊天界面、自定义AI工作流、ERP系统集成及CRM系统增强等场景。