深度学习 - 智狐AI导航

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 496 浏览

AiNiee

AiNiee是一款基于AI技术的多功能翻译工具，支持多种文件格式和语言的自动翻译，包括游戏文件、小说、字幕等。它通过接入主流AI平台，提供高效的多语言翻译服务，支持自定义参数设置和批量翻译功能，确保翻译结果的准确性和流畅性，广泛应用于游戏本地化、字幕制作、电子书阅读等多个领域。

AI项目与工具 2025年06月12日 60 点赞 0 评论 490 浏览

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型，能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术，提供了多种功能，如超分辨率、风格迁移和零样本学习。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 490 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 487 浏览

SVFR

SVFR是一款由腾讯优图实验室与厦门大学联合开发的视频人脸修复框架，能够统一处理视频中的人脸修复、着色和缺失区域补全任务。基于Stable Video Diffusion模型，结合任务嵌入、统一潜在正则化等技术，提升修复精度与时间稳定性。适用于影视后期、网络视频制作及数字档案修复等领域，具有广泛的应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 486 浏览

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手，集成DeepSeek R1/V3 671B满血版模型，支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互，支持360°视觉追踪，提升交互体验。适用于办公、学习、多设备协同等场景，支持网页与移动端同步，打造无缝智能服务生态。

AI项目与工具 2025年06月12日 44 点赞 0 评论 485 浏览

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 484 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 484 浏览

Kolors Virtual Try

Kolors Virtual Try-On 是一款基于深度学习技术的 AI 虚拟换衣工具，能够分析用户上传的照片并智能适配服装，生成逼真的试穿效果。主要功能包括 AI 虚拟换衣、自动适配光线和阴影、支持多种服装和风格、快速生成效果图以及个性化试穿体验。该工具适用于在线购物、时尚搭配、内容创作和电商营销等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 482 浏览

LayerSkip

LayerSkip 是一种针对大型语言模型推理优化的技术，通过层 dropout 和早期退出损失机制，实现从早期层的精准退出，降低计算成本并提高解码效率。该方法结合自我推测解码技术，支持模型在早期层生成预测并通过后续层验证修正，广泛适用于文档摘要、编程任务、语义解析等自然语言处理任务，同时确保高精度与低延迟。

AI项目与工具 2025年06月12日 72 点赞 0 评论 482 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期