CreatiLayout CreatiLayout 是一种先进的布局到图像生成技术,由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM,结合 SiamLayout 框架和 MM-DiT 架构,实现高质量、细粒度可控的图像生成。同时,其 LayoutDesigner 工具支持多种输入方式,帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。 AI项目与工具 2025年06月12日 56 点赞 0 评论 160 浏览
ChatLearn ChatLearn是一款由阿里云开发的高效对齐训练框架,支持多种对齐训练方法,包括RLHF、DPO、OnlineDPO和GRPO。它提供灵活的编程接口、资源调度机制和分布式计算支持,适用于自动化对话系统训练及复杂多模型训练场景。用户可以自定义模型执行流程,实现个性化训练策略。 AI项目与工具 2025年06月12日 90 点赞 0 评论 156 浏览
Lovable Lovable是一款利用自然语言处理技术的AI编程工具,支持用户通过对话生成代码并快速构建网站和Web应用程序。它具备数据库集成、代码同步、大型代码库处理等核心功能,适用于原型开发、非技术团队、独立开发者及企业软件开发等多种场景,显著提升开发效率并降低技术门槛。 AI项目与工具 2025年06月12日 50 点赞 0 评论 153 浏览
D-ID D-ID是一个利用生成式AI技术的平台,专注于为专业人士和内容创作者提供视频内容的创新解决方案。它允许用户从文本生成逼真的数字人物,从而简化大规模视频制作的流程。 Ai视频生成 1970年01月01日 0 点赞 0 评论 146 浏览
AGUVIS AGUVIS是一款由香港大学与Salesforce联合开发的纯视觉框架,专为自主GUI智能体设计。它支持跨平台操作,通过图像观察与自然语言指令的关联,以及显式规划和推理能力,提高了代理在复杂数字环境中的交互效率。AGUVIS采用大规模数据集及两阶段训练方法,实现了在离线与在线场景中的高效性能,成为首个不依赖外部闭源模型即可独立完成任务的纯视觉GUI代理。 AI项目与工具 2025年06月12日 97 点赞 0 评论 138 浏览
Tarsier2 Tarsier2是字节跳动研发的大规模视觉语言模型,擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化(DPO)。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩,支持多语言处理,具有广泛的应用潜力。 AI项目与工具 2025年06月12日 59 点赞 0 评论 138 浏览
OpenAI o1模型 OpenAI的最新推理系列AI大模型“Strawberry”,包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练,具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制,增强推理透明度,具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色,展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 --- AI项目与工具 2025年06月12日 14 点赞 0 评论 124 浏览
YuLan YuLan-OneSim是一款基于大型语言模型的社会模拟工具,支持自然语言交互构建模拟场景,无需编程即可生成代码。提供50多个社会科学领域预设场景,支持大规模智能体模拟,具备自动优化和报告生成能力,适用于经济、社会学、政治学等多个研究领域,推动AI与社会科学的融合应用。 AI项目与工具 2025年06月11日 55 点赞 0 评论 119 浏览
D D-ID是一个利用生成式AI技术的平台,专注于为专业人士和内容创作者提供视频内容的创新解决方案。它允许用户从文本生成逼真的数字人物,从而简化大规模视频制作的流程。 Ai视频生成 1970年01月01日 0 点赞 0 评论 108 浏览