优化

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法,通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点,实现精准优化,同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域,具有良好的可扩展性和实用性。

DanceGRPO

DanceGRPO 是由字节跳动与香港大学联合开发的视觉生成强化学习框架,支持文本到图像、文本到视频、图像到视频等多种任务,兼容多种生成模型与奖励机制。其通过强化学习优化生成过程,提升视觉内容质量与一致性,降低显存压力,提高训练效率与稳定性,适用于视频生成和多模态内容创作。

BeautyPlus

BeautyPlus是一款结合AI技术的照片编辑软件,支持iOS、Android及网页端操作。它提供AI图像生成、视频编辑、人像优化等功能,可将普通照片转化为创意艺术作品,并包含裁剪、格式转换、滤镜增强等实用工具,适用于社交媒体内容创作、个人肖像美化、艺术创作及商业用途等多个场景。

LazyGraphRAG

LazyGraphRAG是微软研究院推出的一种图形增强生成增强检索框架,旨在降低数据索引成本并提升查询效率。相比GraphRAG,其索引成本仅为其0.1%,并通过混合搜索策略优化查询性能。该工具支持本地与全局查询,适用于多种应用场景,包括内容推荐、项目管理和客户服务等,且计划开源以促进技术普及。

ScienceOne

ScienceOne是由中国科学院自动化研究所研发的智能科研平台,基于科学基础大模型,支持科研全流程的智能化管理。平台包含S1-Literature文献助手和S1-ToolChain科学工具调度台,分别用于文献综述生成、论文精读辅助及跨学科工具协同调用,提升科研效率与质量。

DeepGEMM

DeepGEMM是DeepSeek开发的高效FP8矩阵乘法库,专为NVIDIA Hopper架构优化,支持普通与分组GEMM操作。采用即时编译技术,实现运行时动态优化,提升计算性能与精度。通过细粒度缩放和双级累加技术解决FP8精度问题,结合TMA特性提升数据传输效率。代码简洁,仅约300行,适用于大规模AI推理、MoE模型优化及高性能计算场景。

SWEET

SWEET-RL是Meta开发的多轮强化学习框架,专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型,实现精准的信用分配与策略优化。在ColBench基准测试中,其在后端编程和前端设计任务中表现出色,成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景,具备高度的通用性和适应性。

LongShot Ai

一个 AI 驱动的内容写作助手,可帮助研究、生成和优化高质量的长篇内容。它使用户能够利用人工智能的力量快速有效地创建内容。

AgentSquare

AgentSquare是一款由清华大学团队研发的模块化设计工具,专注于在大型语言模型代理的设计空间内实现高效搜索。其核心功能包括模块化设计、模块重组与进化、性能预测及自动化搜索等,通过标准化接口支持模块间无缝集成,广泛应用于客户服务、个人助理、教育、医疗及金融等多个领域,旨在提升智能体性能并降低推理成本。

SimplifyAI

SimplifyAI 是一款支持多格式文档翻译的 AI 工具,可保持原文排版并提供术语管理、实时翻译及语言优化功能。适用于学术研究、商业文件处理、跨境电商、教育和个人学习等多种场景,确保翻译准确、高效且安全。