AI项目与工具

BrowseComp

BrowseComp 是 OpenAI 开源的 AI 浏览能力评估基准,包含 1266 个高难度问题,覆盖多个领域。它要求 AI 代理进行多步骤推理和跨网站信息整合,测试其搜索、分析和适应能力。Deep Research 模型在其中表现优异,准确率达 51.5%。该工具适用于企业知识库、电商导购、政府服务及 AI 研究等领域,推动智能浏览技术发展。

阿拉丁论文

阿拉丁论文是一款集文献检索、智能写作、引文管理、语言润色和原创性检测于一体的学术辅助工具。它基于海量文献数据,提供一键生成论文、智能选题分析、自动格式规范等功能,帮助用户提高写作效率和质量。适用于毕业论文、科研论文等多种场景,支持团队协作与进度管理,是学术研究的重要助手。

PaperFine

PaperFine是一款AI驱动的论文写作辅助工具,支持从选题到成稿的全流程操作。用户可一键生成结构完整的论文内容,涵盖摘要、正文、文献综述、开题报告等模块,并提供在线修改、数据分析与可视化功能。适用于各类学术研究场景,提升写作效率与质量。

MotionCLR

MotionCLR是一款利用自注意力和交叉注意力机制的人体动作生成与编辑工具。它能够根据文本提示生成动作,并支持多种编辑操作,如动作强调、减弱、替换、擦除及风格迁移。MotionCLR在动作生成的精度、多样性及编辑灵活性上表现出色,广泛应用于游戏开发、动画制作、虚拟现实等领域。

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。

Evo 2

Evo 2 是一款基于 StripedHyena 2 架构的 DNA 语言模型,可处理长达 100 万个碱基对的基因序列,支持长序列建模、DNA 生成、嵌入向量提取及零样本预测等功能。其基于大规模基因组数据训练,适用于基因治疗、合成生物学和进化研究等多个领域,为基因组学研究提供强大支持。

Migician

Migician是一款由多所高校联合开发的多模态大语言模型,专为多图像定位任务设计。它基于大规模数据集MGrounding-630k,采用端到端架构和两阶段训练方法,支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域,具有高效的推理能力和灵活的输入方式。

Komiko

Komiko是一款基于先进生成式AI技术的动漫创作工具,支持用户在无限画布上轻松完成漫画创作,涵盖角色设计、对话气泡添加、视觉效果调整等多功能模块。其核心优势在于降低创作门槛,促进创意落地,并通过角色一致性维护保证作品质量,适用于个人创作、教育学习、市场营销等多个领域。

Briefly

Briefly是一款由AI驱动的会议管理工具,可自动转录通话并生成智能总结,同时支持将关键信息直接同步至CRM系统。该工具提供了个性化健康评分、自定义数据管理和交易机会识别等功能,并可通过多种集成方式无缝融入日常工作流,适用于销售、客户服务、项目管理和业务发展等多个领域。

谛韵DiffRhythm

DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。