模型

MiniMax

MiniMax-01是由MiniMax推出的高性能AI模型系列,包含语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列采用线性注意力机制,支持处理长达400万token的上下文,性能接近国际领先模型。具备强大的语言理解、多模态处理及长文本分析能力,适用于企业、教育、科研及开发等多个领域。API定价合理,提供高效的长文本处理与多模态交互解决方案。

卡奥斯智能交互引擎

一款基于工业大模型技术开发的的工业知识智能搜索和解决方案精准生成平台,融合了智能检索、智能应用和多模态连续交互等多种功能。

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

ChatMCP

ChatMCP是一款基于模型上下文协议(MCP)的AI聊天客户端,支持与多种大型语言模型(LLM)交互。它提供自动化安装MCP服务器、SSE传输支持、自动选择服务器及聊天记录管理等功能,并通过MCP服务器市场实现与不同数据源的聊天。用户可配置LLM API密钥和端点,界面友好且功能强大,适用于客户服务、个人助理、教育学习、企业内部沟通及信息检索等多种场景。

PersonaCraft

PersonaCraft是一种结合扩散模型和3D人体建模的全身图像合成技术,能够从单一参考图像生成多个逼真的个性化全身图像。它支持遮挡处理、用户自定义身体形状,并通过3D感知姿态条件控制提高生成图像的质量。该工具广泛应用于社交媒体、广告、时尚、游戏及电影等领域,为个性化定制提供了强大的技术支持。

Vidu Q1

Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。

无限画

无限画是一款方便、快捷并基于人工智能技术的免费AI绘画和创作平台,提供多种AI绘画工具和AIGC创作功能,如文生图、图生图等。

ACE++

ACE++ 是阿里巴巴通义实验室推出的图像生成与编辑工具,支持指令化操作和上下文感知内容填充。其包含多个专用模型,如 ACE++ Portrait 用于人物肖像生成,ACE++ Subject 保证主题一致性,ACE++ LocalEditing 实现局部图像修改。支持虚拟试穿、风格化编辑、照片修复等多种任务,适用于艺术创作、广告设计及影视制作等领域。技术上采用改进的 LCU++ 架构与两阶段训练

REEF

REEF是一种用于大型语言模型的指纹识别技术,通过在训练中嵌入编码信息生成唯一“指纹”,实现高精度、低开销的模型识别。具备鲁棒性、兼容性强等特点,适用于版权保护、模型溯源、非法行为打击等场景,广泛应用于学术、商业和监管领域。

AbletonMCP

AbletonMCP 是一个开源工具,通过模型上下文协议(MCP)将 Ableton Live 与 Claude AI 连接,实现音乐制作过程中的 AI 辅助。支持双向通信,允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信,适用于音乐创作、实时制作、教学及音频后期处理等多种场景。