Scenethesis Scenethesis是NVIDIA推出的AI框架,可通过文本生成高质量的3D场景。它结合LLM与视觉技术,经过布局规划、视觉细化、物理优化和场景验证四个阶段,确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建,广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。 AI项目与工具 2025年06月11日 13 点赞 0 评论 562 浏览
Sana SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架,支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器(Linear DiT)和小型语言模型作为文本编码器,并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势,适合多种应用场景,包括艺术创作、游戏开发、广告设计和科学研究等。 AI项目与工具 2025年06月12日 11 点赞 0 评论 561 浏览
k1 视觉思考模型 K1视觉思考模型是一款基于强化学习的AI工具,支持端到端图像理解和思维链技术,适用于数学、物理、化学等基础科学领域。该模型可直接处理图像信息并生成推理思维链,具有优秀的字符识别能力和跨学科问题解决能力,广泛应用于教育、科研、艺术等领域。 AI项目与工具 2025年06月12日 65 点赞 0 评论 560 浏览
猎户星空大模型 百亿级模型SOTA,支持 32万 tokens 的上下文能够一次性接受并处理约 45 万汉字的输入内容准确提取关键信息。 创作工具 1970年01月01日 0 点赞 0 评论 556 浏览
QwenLong QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型,基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略,显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异,平均准确率达70.7%,超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现,适用于法律、金融、科研等多个领域。 AI项目与工具 2025年06月11日 24 点赞 0 评论 547 浏览
媒介匣 媒介匣全媒体服务及优化解决方案提供商,专业从事数字基建、媒体营销、搜索营销.场景营销以及效果营销等互联网优化服务,为客户实现大数据时代的精准网络营销。 数据分析 2025年06月05日 78 点赞 0 评论 547 浏览