编码 - 智狐AI导航

reclaimai

ReclaimAI是一款基于人工智能的智能日程管理工具，提供自动化日程安排、日历集成、任务管理和智能提醒等功能，帮助用户优化时间管理并提升工作效率。适用于个人、团队及大型项目的日程协调，支持多种日历系统和跨时区会议安排，具有高度灵活性和多功能性。

AI项目与工具 2025年06月12日 73 点赞 0 评论 721 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 804 浏览

MV

MV-Adapter是一款基于文本到图像扩散模型的多视图一致图像生成工具，通过创新的注意力机制和条件编码器，实现了高分辨率多视角图像生成。其核心功能包括多视图图像生成、适配定制模型、3D模型重建以及高质量3D贴图生成，适用于2D/3D内容创作、虚拟现实、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 622 浏览

Valley

Valley是一款由字节跳动开发的多模态大语言模型，擅长处理文本、图像和视频数据，广泛应用于内容分析、图像和视频描述、电子商务及短视频平台等领域。其Eagle版本通过引入VisionEncoder增强了模型性能，支持灵活调整令牌数量，实现了更高效的多模态数据处理。Valley在多项基准测试中表现出色，尤其在参数规模较小的情况下依然保持优异的成绩。

AI项目与工具 2025年06月12日 60 点赞 0 评论 842 浏览

联通元景

联通元景（UniT2IXL）是一款基于国产昇腾AI平台开发的中文原生文生图模型，具备卓越的中文语义理解和高质量图像生成能力。它通过复合语言编码模块优化中文长文本处理，并利用大量中文图文数据进行预训练，确保信息完整性和生成质量。该模型支持国产化算力环境，适配多种应用场景，包括文物数字化、个性化服装定制、智能家居设计、广告创意生成及在线教育等，为企业提供高效解决方案。

AI项目与工具 2025年06月12日 54 点赞 0 评论 889 浏览

The Language of Motion是一款由斯坦福大学李飞飞团队开发的多模态语言模型，能够处理文本、语音和动作数据，生成对应的输出模态。该模型在共同语音手势生成任务上表现出色，且支持情感预测等创新任务。它采用编码器-解码器架构，并通过端到端训练实现跨模态信息对齐。The Language of Motion广泛应用于游戏开发、电影制作、虚拟现实、增强现实及社交机器人等领域，推动了虚拟角色自

AI项目与工具 2025年06月12日 100 点赞 0 评论 547 浏览

Tennr

Tennr是一款利用AI技术优化医疗文档处理的平台，核心为RaeLM™视觉语言模型，支持文档分类、信息提取、资格审核等功能，广泛应用于患者入院、转诊管理、保险索赔等场景，显著提高医疗服务效率并降低人力依赖。

AI项目与工具 2025年06月12日 93 点赞 0 评论 536 浏览

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型，具备强大的图像与视频处理能力，涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统，支持多种视觉任务，广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 622 浏览

Gemini Coder

Gemini Coder 是一款基于 Google Gemini API 的 Web 开发工具，支持通过自然语言描述快速生成完整应用代码，并提供实时编辑与预览功能。它整合了 Next.js 和 Tailwind CSS，提升开发效率与用户体验。兼容多种 Gemini 模型，适用于原型开发、教育学习、小型应用构建等场景，是提高开发速度和灵活性的实用工具。

AI项目与工具 2025年06月12日 46 点赞 0 评论 586 浏览

EmoLLM

EmoLLM 是一款基于多模态技术的心理健康支持工具，能通过文本、图像和视频分析用户情绪，提供情绪识别、心理辅导和情感支持。其核心包括多视角视觉投影、情感引导提示和指令微调技术，支持个性化辅导、角色扮演及多轮对话，适用于心理健康评估与干预场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 473 浏览

编码

首页

编码

列表

默认

浏览次数

发布日期