GOT-OCR2.0 创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。 Ai平台模型 1970年01月01日 0 点赞 0 评论 196 浏览
ChatAA 一款基于OpenAi的GPT3.5和4.0接口开发的聊天网站,旨在为用户提供高效便捷的沟通体验,使用体验和ChatGPT一致。 AI写作对话 2025年06月05日 67 点赞 0 评论 523 浏览
Loudly 一种允许用户使用人工智能技术创作原创音乐的AI音乐生成器、Ai编曲软件。用户可以选择特定的流派和所需的音乐长度,Loudly AI将在几秒钟内生成独特的曲目。 Ai语音工具 2025年06月05日 16 点赞 0 评论 403 浏览
Paint By Text Paint by Text 是一个允许您在 AI 的帮助下使用书面说明编辑照片的网站。您可以上传图像,键入描述如何更改图像的文本提示,并根据提示生成新图像。例如,您可以添加帽子、更改颜色或从照片中移除对象。 Ai图片处理 2025年06月05日 46 点赞 0 评论 227 浏览
Genspark AI幻灯片 一款能够快速将如PDF、Excel、Word等数据格式转化为专业PPT幻灯片的工具,支持一句话交互修改、艺术风格化设计,并可导出为PPTX、PDF等格式 PPT资源 2025年06月05日 71 点赞 0 评论 467 浏览
DICE DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架,能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模,结合情感关联增强和判别机制,确保生成内容的情感一致性与视觉质量。该工具支持多模态输入,具备良好的泛化能力和用户自定义功能,适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。 AI项目与工具 2025年06月11日 87 点赞 0 评论 229 浏览
ChatAnyone ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。 AI项目与工具 2025年06月12日 72 点赞 0 评论 268 浏览
Liquid Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。 AI项目与工具 2025年06月12日 82 点赞 0 评论 158 浏览