学习 - 智狐AI导航

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 695 浏览

HiDream.ai是一家由前京东副总裁梅涛创立的AI初创公司，推出了名为Pixeling千象的多模态AI视觉平台。该平台支持AI图像、视频和3D生成，集成了先进的神经网络和深度学习技术，具备强大的推理和创造性思维能力，能够实现不同模态之间的无缝转换和互操作性，为用户提供丰富的视觉内容创作及高效的生产力解决方案。主要功能包括智能图片生成、视频创意制作、商品图生成、视频风格转换、3D模型生成、智能重

AI项目与工具 2024年01月01日 31 点赞 0 评论 538 浏览

PhotoMaker

PhotoMaker V2是腾讯推出的一款AI图像生成框架，能够快速生成逼真的人物照片。它在角色的一致性和可控性上取得了显著进步，用户可以通过文本指令进行精准控制。该工具利用深度学习技术和生成对抗网络（GANs），能够将文本描述转化为图像，并通过集成脚本增强生成过程的个性化和可控性。PhotoMaker V2广泛应用于游戏开发、电影制作、广告、社交媒体、艺术创作和教育等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 863 浏览

InstantID

InstantID 是一种基于扩散模型的图像生成技术，专注于实现零次（zero-shot）身份保留（Identity-Preserving）的个性化图像合成。该技术允许用户仅使用一张面部图像，在多种风格中生成个性化的图像，同时确保高保真度。其主要功能包括个性化图像合成、身份特征保留、风格迁移、新视角合成、身份插值和多身份合成。InstantID 兼容预训练模型，无需额外微调即可实现灵活的图像生成。

AI项目与工具 2024年01月01日 56 点赞 0 评论 844 浏览

VideoCrafter2

VideoCrafter2 是一款由腾讯AI实验室开发的视频生成模型，通过将视频生成过程分解为运动和外观两个部分，能够在缺乏高质量视频数据的情况下，利用低质量视频保持运动的一致性，同时使用高质量图像提升视觉质量。该工具支持文本到视频的转换，生成高质量、具有美学效果的视频，能够理解和组合复杂的概念，并模拟不同的艺术风格。

AI项目与工具 2024年01月01日 49 点赞 0 评论 535 浏览

哄哄模拟器

哄哄模拟器是一款利用AI技术提升用户情商和沟通技巧的应用。该应用基于Moonshot的Kimi智能助手大模型，融合了自然语言处理和人际交往的知识，通过模拟日常生活和恋爱中的沟通场景，帮助用户改善情感智慧和沟通能力。它支持网页版和iOS版本，具备模拟争执场景、文字交流实训、情感状态模拟、沉浸式音效、恋爱交往文本分析以及场景角色定制等功能。

AI项目与工具 2025年06月12日 17 点赞 0 评论 487 浏览

AnimateDiff

AnimateDiff是一款由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员共同开发的框架，旨在将文本到图像模型扩展为动画生成器。该框架利用大规模视频数据集中的运动先验知识，允许用户通过文本描述生成动画序列，无需进行特定的模型调优。AnimateDiff支持多种领域的个性化模型，包括动漫、2D卡通、3D动画和现实摄影等，并且易于与现有模型集成，降低使用门槛。

AI项目与工具 2024年01月01日 59 点赞 0 评论 607 浏览

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 655 浏览

YOLOv9

YOLOv9是一款先进的目标检测系统，由台北中研院和台北科技大学的研究团队开发。该系统在YOLO算法系列基础上进行了优化，引入了可编程梯度信息（PGI）和泛化高效层聚合网络（GELAN），显著提升了模型的准确性、参数效率、计算复杂度和推理速度。YOLOv9在多个应用场景中表现出色，包括视频监控、自动驾驶、机器人视觉和野生动物监测。

AI项目与工具 2024年01月01日 91 点赞 0 评论 725 浏览

Transformer Debugger

Transformer Debugger (TDB) 是一款由OpenAI的对齐团队开发的工具，用于帮助研究人员和开发者理解和分析Transformer模型的内部结构和行为。它提供了无需编程即可探索模型结构的能力，并具备前向传递干预、组件级分析、自动生成解释、可视化界面及后端支持等功能。TDB 支持多种模型和数据集，包括GPT-2模型及其自动编码器。

AI项目与工具 2024年01月01日 95 点赞 0 评论 637 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期