深度学习

硅语AI

硅基智能开发的AI数字人及视频翻译技术,支持用您自己的语调、口型同步和说话风格免费进行视频语言翻译,创建能够与人类进行互动的虚拟人物。

通义仁心

通义仁心是一款由阿里巴巴集团开发的医疗健康领域人工智能服务平台,利用自然语言处理和深度学习技术,提供疾病、症状、药品及医疗报告解读等多方面的信息服务。它致力于为用户提供权威、专业的医学知识科普,并强调不替代专业医疗建议。主要功能包括问报告、问症状、问用药和问疾病等,同时适用于个人健康咨询和医疗机构资源管理。

ProtGPS

ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型,用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构,能准确识别蛋白质在12种不同亚细胞区域的分布,并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响,为疾病机制研究、蛋白质工程和药物开发提供新思路。

Inf

Inf-DiT是由清华大学与智谱AI联合开发的图像上采样技术,基于扩散模型并引入单向块注意力机制(UniBA),有效降低内存消耗,支持超高分辨率图像生成。其采用扩散变换器(DiT)架构,具备灵活的图像上采样能力,并通过全局图像嵌入和交叉注意力机制增强图像的一致性与质量。该技术适用于设计、影视、印刷及医学等领域,具有广泛的应用前景。

Avaturn

Avaturn是一款基于AI的3D虚拟形象生成平台,支持用户通过上传照片生成逼真的3D头像和全身模型。它提供丰富的定制选项,如面部特征、发型、肤色、服装和配饰,并具备实时预览功能。Avaturn适用于社交媒体、在线游戏、虚拟会议、电子商务、教育培训及健康医疗等领域,旨在推动虚拟互动和数字身份的发展。

生数

生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案。

ElevenLabs

ElevenLabs 是一个为内容创作者和出版商提供功能强大且用途广泛的 AI 语音软件的平台。它允许用户使用其先进的多用途 AI 语音工具以任何语音和风格生成高质量的口语音频。

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

Fancy123

Fancy123是一种基于深度学习的3D网格生成工具,利用单张图像生成高质量3D模型。其核心技术包括多视图扩散模型、大型重建模型、外观增强模块、保真度增强模块及反投影操作,能够有效解决多视图图像的局部不一致问题,提升网格保真度和清晰度。该工具适用于虚拟现实、游戏开发、影视制作等多个领域,具备高度灵活性和实用性。

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API,具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术,尤其是Transformer架构,来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域,为用户提供了一个全面而高效的AI解决方案。