优化

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架,通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式,减少重复计算,支持跨应用复杂任务。基于视觉识别,无需API即可通用操作,适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异,为智能代理技术提供新思路。

Mercury Coder

Mercury Coder 是 Inception Labs 推出的扩散型大语言模型,专为代码生成设计。它采用“从粗到细”机制,支持并行生成,每秒可处理超过 1000 个 token,效率显著高于传统模型。具备代码生成、补全、优化、多语言支持及可控生成等功能,适用于开发效率提升、教育辅助、代码优化及低代码平台集成等场景。

tellers.ai

Tellers.ai 是一款AI驱动的视频生成工具,能够将文本快速转化为高质量视频。它通过智能分析文本内容并匹配真实视频素材,支持多种自定义选项,包括风格设置、剪辑编辑和多语言字幕。用户可将视频直接发布至主流社交平台,适用于内容创作、教育、企业营销和新闻媒体等多种场景。

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型,支持 23 种语言,具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术,确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景,具有广泛的实用价值。

Archon

Archon 是一个开源 AI 智能体构建与优化平台,支持多智能体协作、领域知识集成、本地 LLM 集成等功能。它提供自动化代码生成、语义搜索、Streamlit 界面交互及 Docker 部署能力,适用于企业、教育、智能家居等多个场景。技术上融合 Pydantic AI 和 LangGraph,强调框架无关性和高效开发流程。

Promptimize AI

Promptimize AI 是一款用于优化AI提示词的浏览器插件,支持多平台使用,可一键增强提示词、管理变量并实时提供建议,提高AI交互效率与输出质量。用户可保存常用提示词,方便调用,并享受隐私保护功能,适合内容创作、企业运营及教育等场景。

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集,包含约20万个多模态样本,涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力,并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量,适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

UX Pilot

UX Pilot 是一款 AI 驱动的 UX/UI 设计工具,支持高保真界面生成、线框图探索、Figma 整合及全流程设计管理。它通过智能算法提升设计效率,支持团队协作与多平台适配,适用于产品原型验证、设计迭代与开发交付,助力用户实现高效、精准的设计流程。

SuperGPQA

SuperGPQA是由字节跳动豆包团队与M-A-P联合开发的知识推理基准测试集,覆盖285个研究生级学科,包含26529道题目。其核心功能是评估大语言模型的泛化能力和真实推理水平,42.33%的题目涉及数学计算或形式推理。该测试集采用专家与大语言模型协同构建的方式,确保题目质量,并涵盖STEM与非STEM领域,填补了长尾学科评估的空白。适用于模型性能评估、优化指导及跨学科研究等多种应用场景。

MiniMind

MiniMind 是一款轻量级开源语言模型项目,具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数,可在普通 GPU 上运行,支持多模态能力,如视觉语言模型 MiniMind-V。项目提供完整的训练代码,涵盖预训练、微调、LoRA、DPO 和模型蒸馏,兼容主流框架,适合初学者和开发者快速上手并应用于多个领域。