从容大模型 从容大模型是云从科技推出的多模态AI模型,在国际评测中表现优异,具备视觉语言理解与推理能力。其核心技术包括多模态对齐、高效工程优化和原生多模态推理,支持复杂场景下的文本识别和开放域问答。该模型在医学健康、金融、制造、政务等多个领域实现规模化应用,助力智能化转型。 AI项目与工具 2025年06月11日 21 点赞 0 评论 492 浏览
FLORA AI 一款为创意专业人士打造的集成多模型、支持实时协作的 AI 画布工具。提供无限画布、多模型集成、节点式系统和实时协作等功能,快速生成创意草图、文案、图像。 Ai绘画生成 2025年06月05日 61 点赞 0 评论 492 浏览
MedRAG MedRAG是由南洋理工大学研发的医学诊断模型,结合知识图谱与大语言模型(LLM),提升医学诊断的精准度与效率。该模型构建了四层细粒度知识图谱,支持多模态输入,具备主动补问机制,能有效补充患者信息,提升诊断准确性。在真实数据集上,其诊断准确率提升了11.32%。MedRAG可应用于急诊、慢病管理、医学教育等多个领域,为医疗决策提供科学依据。 AI项目与工具 2025年06月12日 79 点赞 0 评论 493 浏览
FUZZ 由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。 Ai语音工具 2025年06月05日 33 点赞 0 评论 493 浏览
SmoothCache SmoothCache是一种针对Diffusion Transformers(DiT)模型的推理加速技术,通过分析层输出的相似性实现自适应缓存和特征重用,有效减少计算成本并提升生成效率。该技术具有模型无关性、跨模态适用性和易于集成的特点,支持图像、视频、音频及3D模型生成,并在多种应用场景中展现出卓越的性能表现。 AI项目与工具 2025年06月12日 52 点赞 0 评论 494 浏览
AvatarFX AvatarFX是由Character.AI开发的AI视频生成工具,通过上传图片和选择语音,可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成,具备高时间一致性。采用扩散模型与音频条件化技术,确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作,提供高效、高质量的视频生成体验。 AI项目与工具 2025年06月11日 12 点赞 0 评论 494 浏览
Kimina Kimina-Prover是由月之暗面与Numina团队联合开发的大型数学定理证明模型,采用强化学习技术,在Lean 4语言中实现类人逻辑推理与严谨证明。其“形式化推理模式”结合非形式化推理与代码片段,提升解题效率。在miniF2F基准测试中达到80.7%准确率,显著优于现有模型。具备高样本效率与良好可扩展性,适用于科研、软件测试、算法验证等多个领域。1.5B和7B参数版本已开源。 AI项目与工具 2025年06月11日 33 点赞 0 评论 494 浏览
TrackGo TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。 AI项目与工具 2025年06月12日 64 点赞 0 评论 494 浏览
YAYI YAYI-Ultra是中科闻歌研发的企业级大语言模型,具备多领域专业能力与多模态内容生成能力,支持数学、代码、金融、中医等领域。模型支持超长文本处理、数据分析、任务规划及联网创作,适用于媒体、医疗、财税等行业。采用混合专家架构,结合指令微调技术,在多项评测中表现优异,提供高效、精准的智能化服务。 AI项目与工具 2025年06月12日 25 点赞 0 评论 495 浏览
Ai PDF Ai PDF 是一款强大的工具,可在GPTs平台上运行,旨在有效管理和操作 PDF 文件。它可以处理很大尺寸的PDF文档,Ai PDF的开发重点是提高用户满意度和生产力,无需重复上传文件。 GPTs应用 2025年06月05日 15 点赞 0 评论 495 浏览