生成

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具,支持超过30种性别和语言的声音选择,用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件,适用于产品演示、教育培训、营销推广等多种场景,助力高效生成高质量语音内容。

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Fox

Fox-1是一系列由TensorOpera开发的小型语言模型,基于大规模预训练和微调数据,具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色,适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。

钛镁AI

钛镁AI是一家专注于企业级AIGC营销解决方案的平台服务商,提供从市场洞察到舆情管理的全链路服务。其核心功能包括智能体、AI搜索、数智员工、多模态生成能力及专属大模型定制,旨在帮助企业提升营销效率和决策准确性,推动营销AI化转型。

学术云端AI写作助手

学术云端AI写作助手是一款面向学生、教师和研究人员的高效学术写作工具。其核心功能包括智能选题、摘要生成、段落布局建议、智能纠错、文献检索与引用、内容生成等,旨在提升论文写作效率和质量。支持多种论文类型,适用于选题规划、论文撰写及教学辅助等多种场景,具备良好的实用性与专业性。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

MiniCPM 3.0

MiniCPM 3.0是一款由面壁智能开发的高性能端侧AI模型,具有40亿参数。它采用LLMxMapReduce技术,支持无限长文本处理,增强了上下文理解能力。MiniCPM 3.0在Function Calling方面表现出色,接近GPT-4o的水平。该模型还包括RAG三件套,提升了中文检索和内容生成的质量。模型已开源,量化后仅占用2GB内存,适合端侧设备部署,保障数据安全和隐私。

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,可在CPU上运行,单个消费级GPU即可训练,适合在MacBook上部署。它能够处理多模态输入,生成动作序列,并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

Audio

Audio-SDS是由NVIDIA研发的音频处理技术,基于文本提示引导音频生成,支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型,即可将预训练音频扩散模型扩展为多功能工具,具备高效推理能力,适用于游戏、音乐制作、教育及智能家居等多个领域。

Lovable.dev

一个基于AI的全栈应用开发平台,用户可以通过自然语言描述自己的想法,平台将其转化为实际的代码和功能,从而快速构建和部署网站或应用。