思必驰 DFM-2 大模型 思必驰 DFM-2 大模型作为思必驰的自研对话式语言大模型,展现了其在多模态交互和行业应用中的潜力。它通过结合先进的AI技术,为用户提供了更加智能化和个性化的体验,推动了智能语... Ai平台模型 1970年01月01日 0 点赞 0 评论 385 浏览
VoiceCraft VoiceCraft是一款开源的神经编解码器语言模型,专攻零样本语音编辑和文本到语音(TTS)任务。它采用Transformer架构,通过token重排过程结合因果掩蔽和延迟叠加技术,实现在现有音频序列内高效生成自然的语音。VoiceCraft在多种口音、风格和噪声条件下表现出色,适用于有声读物制作、视频内容创作、播客音频编辑及多语言内容生产等场景。 AI项目与工具 2024年01月01日 31 点赞 0 评论 384 浏览
VoicePen Ai 一款语音转博客AI工具,使用VoicePen可以在几分钟内将音频、视频、语音备忘录和网站转换为博客文章。 Ai语音工具 2025年06月05日 76 点赞 0 评论 384 浏览
Azure AI Azure AI 语音服务为用户提供了一套全面的语音处理解决方案,支持多种语言,具备高度的自定义能力,适用于各种规模的公司和多样化的应用场景。 创作工具 1970年01月01日 0 点赞 0 评论 383 浏览
Freestyler Freestyler是一款由多机构合作开发的AI工具,专注于说唱音乐的自动化生成。它通过结合语言模型、条件流匹配技术和神经声码器,实现了从歌词和伴奏到高质量说唱音频的全流程转化。Freestyler还推出了RapBank数据集,并支持零样本音色控制,广泛应用于音乐创作、现场表演、游戏音效及教育等领域。 AI项目与工具 2025年06月12日 17 点赞 0 评论 383 浏览
MNN MNN是一个由阿里巴巴开源的轻量级深度学习推理框架,支持多种模型格式和网络结构,具备高性能、低内存占用及跨平台特性。它通过模型量化、计算图优化和异构计算等技术,在移动设备和嵌入式系统中实现高效推理。主要功能涵盖模型转换、硬件加速、内存优化及多模型支持,广泛应用于图像识别、语音处理、智能家居及工业检测等领域。 AI项目与工具 2025年06月12日 76 点赞 0 评论 383 浏览
豆包大模型1.5 豆包大模型1.5是字节跳动推出的高性能AI模型,采用大规模稀疏MoE架构,具备卓越的综合性能和多模态能力。支持文本、语音、图像等多种输入输出方式,适用于智能辅导、情感分析、文本与视频生成等场景。模型训练数据完全自主,性能优于GPT-4o和Claude 3.5 Sonnet等主流模型,且具备成本优势。 AI项目与工具 2025年06月12日 23 点赞 0 评论 382 浏览
悦录 悦录依托同花顺的语音识别技术,为用户提供免费的录音转文字、语音转文字、视频字幕等服务,1小时音频最快5分钟出稿,准确率高达97%+,全程加密,文件信息安全。 创作工具 1970年01月01日 0 点赞 0 评论 382 浏览
小虫快读BugQR 一款基于OCR技术和AI大语言模型的高效阅读工具。小虫快读通过拍照书籍页面,应用可以自动识别并总结书籍内容,帮助你快速获取书籍的核心信息,还能通过语音播放总结内容。 Ai办公效率 2025年06月05日 10 点赞 0 评论 381 浏览
AiSofiya Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强... Ai语音工具 1970年01月01日 0 点赞 0 评论 381 浏览