教育

看典古籍

一个致力于古籍数字化和保护文化遗产的平台。看典古籍通过先进的OCR算法,将不同版式、年代和字体的古籍转化为数字化内容,提供图文对比阅读和全文搜索功能。

MedReason

MedReason是由多所高校联合开发的医学推理框架,通过知识图谱增强大型语言模型在医学领域的推理能力。其核心功能包括生成高质量推理数据、提升模型性能、确保医学准确性,并支持多种医学任务。MedReason采用医学实体提取、路径搜索、链式推理生成和质量过滤等技术,有效提升模型在复杂临床场景中的表现。项目提供开源代码、模型和论文,适用于医学问答、辅助诊断、教育培训及研究等领域。

AI Youtube Shorts Generator

AI Youtube Shorts Generator是一款基于AI技术的开源视频编辑工具,通过自动化流程实现长视频到短视频的高效转化。它支持视频下载、音频转录、亮点提取、声源检测及格式适配等功能,广泛应用于社交媒体营销、教育培训、新闻传播等领域,为内容创作者提供便捷高效的短视频生产解决方案。

Tarsier

字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。

汉语新解TextHuman

一个基于李继刚Prompt模板的项目,汉语新解对中文名词进行二次翻译,并生成美观的图像。TextHuman提供智能词汇解释,用户可以输入任何汉语词汇,获得AI生成的新颖解释。

文鳐MaaS

文鳐MaaS是一个综合性的AI模型训练平台,它通过提供易操作的界面和强大的自监督学习能力,使用户能够根据自己的特定需求快速定制和部署AI模型。

StoryGenius

允许用户创建以他们的孩子为主角的故事书,只需上传一张照片就可以生成一本独特的个性化的故事书。

SlidesGPT

SlidesGPT是一款利用AI技术快速生成高质量演示文稿的工具,支持从文本到幻灯片的自动化转换,具备智能内容生成、图片匹配、专业排版设计等功能。其应用场景广泛,涵盖教育、商务、培训等多个领域,帮助用户节省时间并提升工作效率。

豆包视觉理解模型

豆包视觉理解模型是一款集视觉识别、理解推理和复杂逻辑计算于一体的先进AI工具。它具备强大的视觉定位能力,支持多目标、小目标和3D定位,并能识别物体的类别、形状、纹理等属性,理解物体间的关系和场景含义。此外,模型在视频理解方面表现出色,能够进行记忆、总结、速度感知和长视频分析。凭借其高效性和成本优势,该模型广泛应用于图片问答、医疗影像分析、教育科研、电商零售及内容审核等领域。