语言模型 - 智狐AI导航

ComfyGen

ComfyGen是一款基于大型语言模型（LLM）的文本到图像生成系统，能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流，并采用两种基于LLM的方法优化图像生成质量，适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 804 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 804 浏览

小虫快读

小虫快读（BugQR）是一款集成OCR技术和AI大语言模型的高效阅读工具，支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式（Summary、Explain、Note）满足多样化阅读需求，适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能，高级版本支持内容导出。

AI项目与工具 2025年06月12日 24 点赞 0 评论 806 浏览

HelloBench

HelloBench 是一款开源基准测试工具，专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务，并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用，包括模型开发、学术研究、产品测试等，同时揭示了现有模型在长文本生成中的局限性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 806 浏览

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型，能够处理文本和语音数据，支持跨模态学习。其基础版（BASE）和表达版（EXPRESSIVE）分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别（ASR）、文本到语音（TTS）、语音分类及情感分析等任务，在语音助手、语音转写、有声读物等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 807 浏览

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型，采用分布式强化学习技术，在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能，适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案，推动 RL 在 LLM 中的应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 810 浏览

SlideChat

SlideChat是一款先进的视觉语言助手，专注于处理和分析千兆像素级别的全切片病理图像。它具备强大的多模态对话能力和复杂指令响应能力，在显微镜检查、诊断等领域展现出卓越性能。通过两阶段训练机制，SlideChat实现了视觉与语言特征的有效对齐，并被广泛应用于病理诊断、医学教育、研究开发以及临床决策支持。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 810 浏览

元象大模型XChat

元象大模型XChat是元象XVERSE推出的高性能AI产品，它通过自研技术，能够满足不同复杂度任务的需求，并在中文领域表现突出。

Ai平台模型 2026年06月21日 0 点赞 0 评论 810 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 810 浏览

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型，具备中文知识问答、逻辑推理、文学创作等能力，支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术，结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域，提供高性价比的AI服务。

AI项目与工具 2025年06月12日 64 点赞 0 评论 811 浏览

语言模型

首页

语言模型

列表

默认

浏览次数

发布日期