人工智能

Soundwave

Soundwave是由香港中文大学(深圳)开发的开源语音理解大模型,专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术,提升语音特征压缩效率,支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域,具有广泛的应用前景。

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术,基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示,适用于电商、设计、社交及品牌推广等场景,提升用户体验与决策效率。

Artinails

Artinails 是一款基于 AI 技术的美甲设计工具,支持用户通过简单输入生成个性化美甲方案。平台涵盖多种美甲风格,如法式、水晶、凝胶等,并提供颜色、形状和图案的自定义功能。界面简洁易用,适合个人及美甲从业者使用,同时支持季节性设计灵感,提升创作效率与个性化体验。

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。

Reve Image

Reve Image 是一款基于 AI 的图像生成工具,具备强大的视觉表现力与精准的提示理解能力。支持文生图和图生图模式,适用于广告设计、社交媒体内容创作、艺术创作及产品设计等多种场景。模型在色彩、光影和排版上优化显著,可生成高质量且富有设计感的图像。

StarVector

StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。

瀚海智语

瀚海智语(OceanDS)是国内首个面向海洋领域的垂直大语言模型,基于360智脑和Deepseek-R1大模型开发,具备海洋知识问答、信息检索、政策分析等功能。拥有全球最丰富的海洋中文知识库,词元总量超18亿,采用增量式数据库与加密技术保障信息安全。适用于海洋科研、教育、灾害预警及政策支持等领域,提供高效、专业的AI服务。

ReasonGraph

ReasonGraph 是一个开源平台,用于可视化和分析大语言模型(LLM)的推理过程。它支持多种主流模型和推理方法,提供直观的图表展示和交互式功能,帮助用户理解 AI 思考逻辑、优化模型表现。模块化设计使其易于扩展,适用于学术研究、教育、开发等多个领域。

15个AI数字人制作工具,快速生成口播和直播视频

AI数字人通过AI技术模拟真人外貌与行为,实现自然对话与情感表达。本文介绍多款数字人制作工具,支持视频创作、营销推广、教育培训等场景,功能包括3D内容生成、自定义编辑、后期包装等,适用于个人及企业用户,助力内容生产效率提升。

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型,具备深度推理能力,可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式,拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异,适用于学术研究、软件开发、创意工作和企业应用等多个领域。