Claude 3.7 Sonnet Claude 3.7 Sonnet 是由 Anthropic 推出的混合推理模型,支持标准模式与扩展思考模式,适用于复杂任务处理和日常交互。其在数学、物理、编程等领域表现卓越,尤其在代码生成与理解方面领先。模型优化了安全性,减少误拒率,并支持多平台接入。适用于软件开发、前端设计、科学计算及企业自动化等多个场景。 AI项目与工具 2025年06月12日 37 点赞 0 评论 412 浏览
SimpleAR SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型,采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法,提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成,兼容加速技术,推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。 AI项目与工具 2025年06月11日 76 点赞 0 评论 412 浏览
Search Search-o1是由中国人民大学和清华大学联合开发的AI工具,旨在提升大型推理模型在复杂任务中的表现。其核心在于结合RAG机制与Reason-in-Documents模块,实现动态知识检索与精炼处理,增强推理的准确性和连贯性。该工具在科研、数学、编程、问答等多个领域展现出广泛适用性,为构建更可靠的智能系统提供了新路径。 AI项目与工具 2025年06月12日 16 点赞 0 评论 411 浏览
VisoMaster VisoMaster 是一款基于 AI 的面部编辑与换脸工具,支持图片、视频及直播场景,能生成自然逼真的换脸效果。采用 GPU 加速与自定义模型功能,适用于影视、广告、视频创作等领域。核心技术包括深度学习与 GANs,实现高精度面部特征提取与图像合成,支持实时预览与参数调整,提升用户体验与效率。 AI项目与工具 2025年06月12日 82 点赞 0 评论 411 浏览
讯飞星火 科大讯飞推出的新一代GPT人工智能模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。 Ai平台模型 2025年06月05日 86 点赞 0 评论 411 浏览
ZeroSearch ZeroSearch 是阿里巴巴通义实验室开发的基于大模型的搜索引擎框架,通过强化学习技术提升搜索能力,无需依赖真实搜索引擎。它能动态生成相关或噪声文档,显著降低训练成本(超80%),并支持多种模型和算法,适用于问答、内容创作、教育等多个场景。 AI项目与工具 2025年06月11日 90 点赞 0 评论 411 浏览
Pix2Gif Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型,能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成,并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制,确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。 AI项目与工具 2024年01月01日 30 点赞 0 评论 410 浏览
Wonderland Wonderland是一项由多伦多大学、Snap和UCLA联合开发的技术,能够基于单张图像生成高质量的3D场景,并支持精确的摄像轨迹控制。它结合了视频扩散模型和大规模3D重建模型,解决了传统3D重建技术中的视角失真问题,实现了高效的三维场景生成。Wonderland在多个基准数据集上的3D场景重建质量均优于现有方法,广泛应用于建筑设计、虚拟现实、影视特效、游戏开发等领域。 AI项目与工具 2025年06月12日 23 点赞 0 评论 410 浏览
PrimitiveAnything PrimitiveAnything是由腾讯AIPD与清华大学联合开发的3D形状生成框架,通过将复杂3D形状分解为基本基元并自回归生成,实现高质量、高保真度的3D模型重建。其支持从文本或图像生成内容,具备高效存储、模块化设计及良好的泛化能力,适用于3D建模、游戏开发、UGC创作及VR/AR应用等领域。 AI项目与工具 2025年06月11日 14 点赞 0 评论 410 浏览
文心大模型4.5 文心大模型4.5是百度推出的原生多模态大模型,具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理,适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台,企业与开发者可通过API调用,满足多样化业务需求。 AI项目与工具 2025年06月12日 32 点赞 0 评论 409 浏览