模型 - 智狐AI导航

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 540 浏览

Ivy

Ivy-VL是一款专为移动端和边缘设备设计的轻量级多模态AI模型，具备约30亿参数，专注于视觉问答、图像描述及复杂推理等任务，能够有效降低计算资源需求，同时在多模态任务中表现出色，尤其适用于增强现实、智能家居及移动学习等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 540 浏览

scade.pro

scade.pro 是一款无代码AI集成平台，提供超过1500种AI模型和可视化工作流构建工具，支持用户通过拖放节点快速创建和部署AI应用。其功能包括模板驱动的开发、性能监控、多场景适配等，广泛应用于客户服务、内容创作、市场分析等多个领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 540 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 540 浏览

奇智孔明AInnoGC工业大模型

奇智孔明AInnoGC工业大模型是创新奇智在工业智能制造领域的重要成果，它通过其强大的参数量和专业的工业领域适应性，为制造业提供了全面的AI解决方案。

创作工具 1970年01月01日 0 点赞 0 评论 541 浏览

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 541 浏览

Deepfakes Web

一个使用人工智能技术通过交换脸部来轻松生成视频的在线应用程序。该应用程序在云端运行，确保用户数据的隐私。

Ai图片处理 2025年06月05日 23 点赞 0 评论 541 浏览

琅琊

琅琊是中国科学院海洋研究所推出的一款海洋人工智能大模型，专注于全球海洋状态变量的中短期高精度预报。它采用先进的机器学习技术与海洋科学知识相结合的方式，提供1至7天的温度、盐度和海流等关键指标的高分辨率预报，显著提高海洋预报的准确性与可靠性。未来版本将扩展至更多复杂海洋现象的预测，增强灾害预警能力。 ---

AI项目与工具 2025年06月12日 12 点赞 0 评论 541 浏览

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。

Ai开源项目 2025年06月05日 10 点赞 0 评论 542 浏览

MotionCanvas

MotionCanvas是一种图像到视频生成工具，能将静态图像转化为动态视频。它提供相机与物体运动的联合控制，支持复杂轨迹设计和局部运动调整，具备3D感知能力，可生成高质量长视频。适用于电影制作、动画创作、VR/AR、游戏开发及教育等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 543 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期