开源
FaceFusion
FaceFusion是一款开源AI工具,支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术,FaceFusion能够实现精准的人脸识别与对齐,广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。
StarVector
StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。
Vision Parse
Vision Parse 是一款开源工具,旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力,包括文本和表格,并能保持原有格式与结构。此外,Vision Parse 支持多种视觉语言模型,确保解析的高精度与高速度。其应用场景广泛,涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。
AI Dev Gallery
AI Dev Gallery 是一款由微软开发的开源 AI 工具集,集成于 Visual Studio 中,旨在帮助开发者快速集成端侧 AI 功能。它提供超过 25 个交互式示例,涵盖文本、图像、音频和视频领域,支持从 GitHub 和 Hugging Face 下载模型,并能在本地设备上高效运行。此外,工具集还具备代码导出功能,便于开发者将示例集成至自有项目中。
EXAONE 3.5
EXAONE 3.5是一款由LG AI研究院开发的开源AI模型,包含多种参数规模版本,专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理,可显著减少错误信息并提升准确性。此外,EXAONE 3.5还具备双语支持及强大的上下文理解能力,适用于聊天机器人、语言翻译、内容创作等多个领域。
