深度学习

Avaturn

Avaturn是一款基于AI的3D虚拟形象生成平台,支持用户通过上传照片生成逼真的3D头像和全身模型。它提供丰富的定制选项,如面部特征、发型、肤色、服装和配饰,并具备实时预览功能。Avaturn适用于社交媒体、在线游戏、虚拟会议、电子商务、教育培训及健康医疗等领域,旨在推动虚拟互动和数字身份的发展。

Wear

Wear-Any-Way是阿里巴巴拍立淘团队研发的虚拟试穿框架,通过稀疏对应对齐机制实现高保真、可定制的试穿效果。用户可自由调整服装样式、颜色及搭配方式,适用于多种场景。具备多件服装搭配、多场景支持及智能推荐功能,适用于电商、时尚设计等领域,提升用户体验与效率。

HK

HK-O1aw是一款由香港生成式AI研发中心与北京大学合作推出的专业法律推理大模型,基于深度学习技术和神经网络架构,专注于慢思考和链式推理。它能够深入分析法律文本,提供逻辑严密的法律意见,涵盖合同审查、消费者权益保护、商业调解等多个应用场景,适合法律从业者、教育机构以及普通用户使用。

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。

Object Cutter

Object Cutter是一款基于AI的智能图像处理工具,支持文字指令和框选操作,实现高精度图像分割。它能够自动识别并抠出图像中的特定对象,尤其擅长处理复杂背景和细节丰富的图像。其主要功能包括智能抠图、背景移除和高精度图像分割,广泛应用于电商展示、设计创作、影视后期及个人照片编辑等领域。

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

ReasonIR

ReasonIR-8B 是由 Meta AI 开发的推理密集型检索模型,基于 LLaMA3.1-8B 训练,采用双编码器架构,提升复杂查询处理能力。结合合成数据生成工具,增强模型在长上下文和抽象问题中的表现。在多个基准测试中表现优异,适用于问答系统、教育、企业知识管理和科研等领域。

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎,采用 BiCodec 技术实现音色与语义的精准控制,支持 3 秒语音克隆、多角色、多情绪表达及中英切换,语音自然流畅,接近广播级水平,适用于智能客服、有声书、影视配音等场景。

疯语咒AI

疯语咒AI是AI技术和教育的先行者,提供海量免费的AI学习材料。