Joyland Joyland 是一款支持 AI 角色创建与互动的平台,用户可自定义角色外观、性格与背景,构建文本冒险世界并与 AI 进行深度对话。该工具适用于创意写作、虚拟社交、情感陪伴、语言学习等多个场景,提供沉浸式体验与个性化内容生成功能,助力用户探索 AI 在叙事与互动中的潜力。 AI项目与工具 2025年06月12日 49 点赞 0 评论 240 浏览
PP PP-DocBee是百度飞桨推出的多模态文档理解模型,基于ViT+MLP+LLM架构,支持文字、表格、图表等多类型文档内容的精准识别与解析。具备高效的推理性能和高质量输出,适用于文档问答、信息提取等场景,支持灵活部署,为文档处理提供智能化解决方案。 AI项目与工具 2025年06月12日 56 点赞 0 评论 239 浏览
Hertz Hertz-Dev是一款由Standard Intelligence开发的开源音频模型,专注于低延迟实时对话AI。它具备强大的音频生成与处理能力,能够处理和生成高质量的音频信号,并支持多任务微调,适用于语音识别、语音合成等多种应用场景。此外,Hertz-Dev还提供了音频自动编码、流式生成等功能,广泛应用于智能助手、客户服务、语音识别及合成等领域。 AI项目与工具 2025年06月12日 48 点赞 0 评论 239 浏览
scite scite是一款利用深度学习技术的文献分析工具,具备智能引文分类、上下文分析及可视化引文网络等功能。它支持用户快速评估文献质量,追踪引用动态,适用于文献综述、研究验证及学术出版等场景。通过支持、反对和提及分类,scite显著提升了文献引用的效率和准确性,同时提供了强大的自定义面板和消息提醒功能。 AI项目与工具 2025年06月12日 65 点赞 0 评论 239 浏览
Liquid Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。 AI项目与工具 2025年06月12日 82 点赞 0 评论 239 浏览
音刻 Inkr 是一款高效的 AI 语音转录工具,支持超过 100 种语言,具备快速转录、多语言支持、说话人识别、高准确率等功能。其“FLASH”模式可在几秒内完成转录,适用于会议记录、采访整理、字幕制作及学习辅助等多种场景,提升信息处理效率。 AI项目与工具 2025年06月11日 47 点赞 0 评论 239 浏览
AudioX AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。 AI项目与工具 2025年06月12日 68 点赞 0 评论 238 浏览
AnyCharV AnyCharV是一款由多所高校联合研发的角色可控视频生成框架,能够将任意角色图像与目标场景结合,生成高质量视频。它采用两阶段训练策略,确保角色细节的高保真保留,并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型,具备良好的泛化能力,适用于影视制作、艺术创作、虚拟现实等多个领域。 AI项目与工具 2025年06月12日 73 点赞 0 评论 238 浏览
Explainpaper Explainpaper是一款基于人工智能的文献阅读工具,通过自然语言处理技术帮助用户解析学术论文。它允许用户高亮并获取对难解内容的简化解释,提供深度解析和在线问答服务。此外,该工具还能推荐相关参考文献,并根据不同用户的学术背景提供适配的解释深度。其应用场景包括学术研究、教育支持、跨学科学习、行业分析和技术预研等领域。 --- AI项目与工具 2025年06月12日 93 点赞 0 评论 237 浏览