教育

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。

OpenCoder

OpenCoder是一个开源代码大型语言模型(LLM),具备代码生成、审查、补全、错误调试等功能,支持多种编程语言,通过预训练、指令微调及优化策略提升性能,推动代码AI研究的透明化与可重复性,广泛应用于开发效率提升、代码质量保障及编程教育等领域。

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。

Lamucal

Lamucal是一款由人工智能驱动的音乐创作工具,主要功能包括实时生成歌曲的和弦、吉他谱、歌词及旋律,支持AI翻唱、人声移除和音轨分离等操作。它不仅适用于个人音乐学习和音乐教育,还能满足音乐制作人和内容创作者的需求,广泛覆盖音乐创作、教学及娱乐场景。

Vispunk Video

一款极简、强大的免费 AI文生视频制作工具。Vispunk Motion可让您仅使用文字创建逼真的短视频。您可以使用它来制作短片或社交媒体视频。

artflow

Artflow 是一款利用人工智能技术打造的动画创作工具,用户只需输入文本便能生成包含剧情的动画视频。它支持动画合成、AI 角色生成及视频制作,涵盖多种语言与视觉风格选项,适合教育、营销、娱乐等多个领域应用,帮助用户实现高效且个性化的创意输出。

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型,包含文本转语音(Takin TTS)、音色转换(Takin VC)及声音风格变换(Takin Morphing)。它采用最新大型语言模型技术,可生成接近真人的高质量语音,并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域,具有音色精准、风格多样等特点。

AI Hug

AI Hug 是一款基于人工智能技术的在线工具,能够将静态照片转换成动态拥抱视频。它通过智能人物识别、情感丰富的动画生成以及用户友好的界面设计,使得非专业用户也能够轻松创作出具有个性化的拥抱视频。AI Hug 在个人情感表达、社交媒体互动、商业营销活动及教育领域均有广泛应用。

MolyPix.AI

Molypix.AI是一款利用生成式AI技术的在线图形设计工具,支持用户通过简单文字输入快速生成专业级视觉内容。平台提供多样化的模板及强大的编辑功能,适用于海报、邀请函、明信片等多个领域,同时拥有免费及付费版本供不同需求用户选择。