Poetry2Image Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架,专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制,提升了诗歌与图像的一致性,解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能,与多种图像生成模型结合使用时,其元素完整性和语义一致性表现优异,适用于古诗词 AI项目与工具 2025年06月12日 55 点赞 0 评论 649 浏览
TokenSwift TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架,可在90分钟内生成10万Token文本,效率较传统模型提升3倍,且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术,支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。 AI项目与工具 2025年06月12日 98 点赞 0 评论 648 浏览
AdaCache AdaCache是一种开源的自适应缓存技术,由Meta开发,用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略,优化视频生成过程中的缓存决策,显著提升生成速度,同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中,并适用于多GPU环境,广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。 AI项目与工具 2025年06月12日 96 点赞 0 评论 648 浏览
Fotographer AI Fotographer AI是一款基于AI技术的图像生成工具,能够快速生成专业级产品图像,并提供多样化的广告模特图像。该工具支持文本和模板定制,简化创作流程。此外,它还能即时生成博客、新闻稿等营销材料。试用期免费,同时提供企业级服务选项,包括图像生成和账户管理。 AI项目与工具 2025年06月12日 26 点赞 0 评论 647 浏览
Playground v3 Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。 AI项目与工具 2025年06月12日 52 点赞 0 评论 647 浏览
Wisecut Wisecut 是一款利用人工智能技术的在线视频编辑工具,其核心功能包括 AI 高光检测、自动字幕生成与多语言翻译、基于语音的故事板编辑、智能背景音乐匹配以及静音段落自动移除等。它特别适合用于社交媒体内容创作、视频博客、在线教育、产品营销和企业培训等领域,帮助用户快速制作高质量的短视频或音频内容。 AI项目与工具 2025年06月12日 26 点赞 0 评论 647 浏览
TITAN TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。 AI项目与工具 2025年06月12日 93 点赞 0 评论 646 浏览
MinMo MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型,具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互,适用于智能客服、教育、医疗等多个领域,提升人机对话的自然度与效率。 AI项目与工具 2025年06月12日 59 点赞 0 评论 646 浏览
Musick Ai 一款AI音乐生成器,Musick Ai可以创作跨流派的高品质、情感丰富的音乐,提供具有不同音乐风格的个性化、专业级作品。 Ai语音工具 2025年06月05日 96 点赞 0 评论 646 浏览
Amuse AI Amuse 2.0是一款由AMD开发的AI图像生成工具,专为AMD硬件优化,支持在PC上生成高质量图像。它具备设计模式,可将用户的草图和文本提示转化为图像,并提供AI滤镜功能,便于个性化风格的创作。Amuse 2.0 Beta版本集成了AMD XDNA超级分辨率技术,能有效提升图像分辨率。此外,该工具还提供了平衡、快速和质量三种模式,以满足不同用户的需求和偏好。 AI项目与工具 2025年06月12日 94 点赞 0 评论 645 浏览