LanDiff LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架,采用粗到细的生成策略,有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成,降低计算成本,适用于视频制作、VR/AR、教育及社交媒体等多个领域。 AI项目与工具 2025年06月12日 92 点赞 0 评论 374 浏览
SANA 1.5 SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。 AI项目与工具 2025年06月12日 56 点赞 0 评论 365 浏览
PDFtoPDF PDFtoPDF是一款基于AI和OCR技术的PDF转换工具,支持高精度文字识别(准确率达99.5%),并能保留原始文档排版。具备多语言支持、文件压缩、跨平台使用及翻译功能,适用于学术、办公、教育和个人文档管理等多种场景,显著提升文档处理效率与便捷性。 AI项目与工具 2025年06月12日 51 点赞 0 评论 354 浏览
PDF2Go 一款由德国软件公司QaamGo开发的在线PDF工具,PDF2Go提供一系列便捷的PDF处理功能,包括编辑、合并、拆分、转换等。 格式转换 2025年06月05日 42 点赞 0 评论 338 浏览
UltraMem UltraMem是字节跳动推出的超稀疏模型架构,通过优化内存访问和计算效率,显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE,使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。 AI项目与工具 2025年06月12日 11 点赞 0 评论 335 浏览
HiCompress 一个在线图片压缩和转换工具,支持PNG,WEBP图片无损压缩,支持将JPG, JPEG, PNG, WEBP, TIF, DDS, AVIF, PSD, HEIC,RAW, JFIF等几十种图片格式转换成PG, JPEG, PNG图片。 格式转换 2025年06月05日 52 点赞 0 评论 335 浏览
biliLive 一款专为B站录播设计的一站式工具,提供弹幕转换、视频压制及一键上传至B站功能。它支持录播姬和blrec的webhook,适合录播达人和切片爱好者。 直播录屏 2025年06月05日 71 点赞 0 评论 319 浏览