SpeechGPT 2.0 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。 AI项目与工具 2025年06月12日 23 点赞 0 评论 249 浏览
Kimi Latest Kimi Latest是月之暗面推出的实时更新AI模型,支持128k上下文长度,可自动选择模型规模并优化成本。具备图像理解、自动上下文缓存和多模态处理能力,适用于聊天应用、内容创作及数据分析等多种场景,为开发者和用户提供稳定高效的AI解决方案。 AI项目与工具 2025年06月12日 38 点赞 0 评论 248 浏览
HiDream AI HiDream AI的目标是帮助用户零基础掌握AIGC的一站式能力,唤醒创造力、赋予作品生命感和价值感,同时解放生产力,提升全流程工作效率。 创作工具 1970年01月01日 0 点赞 0 评论 246 浏览
Media2Face 一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。 Ai开源项目 2025年06月05日 56 点赞 0 评论 246 浏览
CustomVideoX CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架,能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差(TAB)和实体区域感知增强(ERAE),有效提升视频的时间连贯性和语义一致性。支持多种应用场景,如艺术设计、广告营销、影视制作等,具备高效、精准和可扩展的特点。 AI项目与工具 2025年06月12日 98 点赞 0 评论 246 浏览
MT MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架,支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库,提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术,实现大规模语言模型的高效分布式训练,适用于科研、企业及定制化 AI 应用场景。 AI项目与工具 2025年06月12日 25 点赞 0 评论 245 浏览
LTX Studio LTX Studio 是由知名 AI 平台 Lightricks(也是 Facetune、Videoleap 和 Photoleap 等应用的开发者)推出的一项创新服务,它是一个生成式 AI 电影制作和视频短片生成平台。 Ai视频生成 1970年01月01日 0 点赞 0 评论 245 浏览
WeGen WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 245 浏览
山海大模型 山海大模型是一款由云知声推出的多模态人工智能模型,具备强大的知识储备和多模态交互能力。它能够通过文本、音频和图像等形式与用户进行实时互动,提供信息查询、知识学习和灵感激发等服务。主要功能包括内容生成与理解、知识问答、逻辑推理、代码能力以及多模态交互特色,如实时响应、情绪感知、音色切换和视觉场景理解。该模型可应用于智能客服、教育辅助、医疗咨询、个人助理和内容创作等多个领域。 AI项目与工具 2025年06月12日 55 点赞 0 评论 245 浏览
卡奥斯智能交互引擎 一款基于工业大模型技术开发的的工业知识智能搜索和解决方案精准生成平台,融合了智能检索、智能应用和多模态连续交互等多种功能。 AI搜索问答 2025年06月05日 86 点赞 0 评论 245 浏览