模型

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

AxBench

AxBench是斯坦福大学推出的语言模型可解释性评估框架,支持概念检测与模型转向任务。它通过合成数据生成训练集,评估模型对特定概念的识别能力和干预后的表现。提供统一的评估平台,支持多种控制方法,如提示、微调和稀疏自编码器,并采用多维评分机制,适用于AI安全、伦理及内容生成等场景。

AISmartCube

AISmartCube是一个低代码平台,专为简化AI工具开发与业务流程自动化设计。它支持无代码构建AI工具,集成多种功能节点(如LLMs、图像处理、数据抓取等),并提供AI助手及共享知识库服务。该平台适用于自动化工作流、客户服务、内容创作、市场分析以及个性化推荐等多个领域。

FramePainter

FramePainter 是一款基于AI的交互式图像编辑工具,结合视频扩散模型与草图控制技术,支持用户通过简单操作实现精准图像修改。其核心优势包括高效训练机制、强泛化能力及高质量输出。适用于概念艺术、产品展示、社交媒体内容创作等场景,具备低训练成本和自然的图像变换能力。

Cherry Studio

Cherry Studio 是一款支持多平台的 AI 工具客户端,集成主流云模型与本地模型运行功能,允许用户自由切换并对比不同模型输出。内置 300 多个预设 AI 助手,涵盖写作、编程、设计等领域,支持自定义配置。支持多种文件格式处理、代码高亮、图表可视化及数据备份,适用于文本创作、代码生成、数据分析等场景。

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI建筑设计-Stable Diffusion

15课时以案例实操的方式,结合实际工作场景需求讲解包括室内设计、建筑鸟瞰、人视角,规划,景观等相关操作流程。

V-JEPA

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。

AI提示语学习教程

learning prompt,这是一份教你如何更好地使用 ChatGPT 和 Midjourney 免费AI提示语学习教程。

anime.gf

Anime.gf 是一款基于开源技术开发的本地应用程序,支持用户创建和管理个性化虚拟角色。它利用先进的自然语言处理技术和多种大型语言模型 API,提供智能化的对话体验。主要功能涵盖角色创建、编辑与删除、多 API 接入、聊天记录管理以及响应再生成等。适用于娱乐、情感陪伴、语言学习、故事创作、教育辅助以及心理治疗等多个领域。