NSFW Detector NSFW Detector是一款基于深度学习的开源工具,利用Google的`vit-base-patch16-224-in21k`模型,能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署,具备多CPU加速特性,可实现快速且安全的本地化内容分类,广泛应用于社交媒体、内容共享平台、企业网络等多个领域。 AI项目与工具 2025年06月12日 46 点赞 0 评论 543 浏览
sCM sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型,通过简化理论框架与优化采样流程,实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像,且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进,sCM不仅提高了训练稳定性,还提升了生成质量。其应用场景广泛,包括视频生成、3D建模、音频处理及跨媒介内容创作,适用于艺术设计、游戏开发、影视制作等多个行业。 AI项目与工具 2025年06月12日 50 点赞 0 评论 542 浏览
OceanDoc OceanDoc是科大讯飞推出的AI智能办公工具,基于大语言模型和自然语言处理技术,可自动将文本转化为高质量PPT幻灯片,并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景,简化演示文稿制作流程,提升效率与专业性。 AI项目与工具 2025年06月11日 44 点赞 0 评论 540 浏览
联通元景 联通元景(UniT2IXL)是一款基于国产昇腾AI平台开发的中文原生文生图模型,具备卓越的中文语义理解和高质量图像生成能力。它通过复合语言编码模块优化中文长文本处理,并利用大量中文图文数据进行预训练,确保信息完整性和生成质量。该模型支持国产化算力环境,适配多种应用场景,包括文物数字化、个性化服装定制、智能家居设计、广告创意生成及在线教育等,为企业提供高效解决方案。 AI项目与工具 2025年06月12日 54 点赞 0 评论 539 浏览
Tripo3D AI 一个由VAST发布的在线3D建模平台,利用先进的AI技术,可以在几秒钟内生成高质量的3D模型。用户可以通过文本描述或上传图片来生成模型。 3D&游戏 2025年06月05日 63 点赞 0 评论 539 浏览
Markable AI Markable AI 是一款基于AI技术的电商营销工具,支持图像与视频商品识别,并提供深度链接生成、拼贴图制作、亚马逊集成等功能。适用于创作者进行内容推广、电商营销和数据分析,提升内容转化率与收入。平台兼容多个电商平台,优化推广策略,提高运营效率。 AI项目与工具 2025年06月11日 92 点赞 0 评论 538 浏览
PixArt PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和 AI项目与工具 2024年01月01日 82 点赞 0 评论 538 浏览
VILA VILA-U 是一款由 MIT 汉实验室开发的统一基础模型,整合了视频、图像和语言的理解与生成能力。它通过自回归框架简化模型结构,支持视觉理解、视觉生成、多模态学习和零样本学习等功能。VILA-U 在预训练阶段采用混合数据集,利用残差向量量化和深度变换器提升表示能力,适用于图像生成、内容创作辅助、自动化设计、教育和残障人士辅助等多种场景。 AI项目与工具 2025年06月12日 40 点赞 0 评论 538 浏览
MagicVideo MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率,而且在视觉质量和运动流畅度方面表现出色,为用户提供卓越的观看体验。 AI项目与工具 2024年01月01日 56 点赞 0 评论 538 浏览
RepText RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。 AI项目与工具 2025年06月11日 85 点赞 0 评论 537 浏览