AI

Faceswapper

尖端技术保证完美,自然的面部交换,无缝地隐藏任何编辑痕迹

从容大模型

从容大模型是云从科技推出的多模态AI模型,在国际评测中表现优异,具备视觉语言理解与推理能力。其核心技术包括多模态对齐、高效工程优化和原生多模态推理,支持复杂场景下的文本识别和开放域问答。该模型在医学健康、金融、制造、政务等多个领域实现规模化应用,助力智能化转型。

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统,支持37种语言,具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传,准确度高,适用于国际会议、商务交流、教育等场景,支持译文长度调节和设备兼容,提升跨语言沟通效率。

腾讯会议·AI小助手

腾讯会议推出覆盖会议全流程的AI小助手,通过简单自然的指令,完成信息提取、内容分析、会管会控等多种复杂任务,提升开会和信息流转效率。

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

Wisecut

Wisecut 是一款利用人工智能技术的在线视频编辑工具,其核心功能包括 AI 高光检测、自动字幕生成与多语言翻译、基于语音的故事板编辑、智能背景音乐匹配以及静音段落自动移除等。它特别适合用于社交媒体内容创作、视频博客、在线教育、产品营销和企业培训等领域,帮助用户快速制作高质量的短视频或音频内容。

MUSICHERO

MUSICHERO是一款利用AI技术实现文本到音乐转换的在线生成工具,基于Suno V3.5算法,支持用户通过简单描述快速生成专业级别的音乐作品,涵盖流行、摇滚、电子等多种风格。该平台具备直观易用的特点,支持免费体验及定制化设置,适用于音乐制作、内容创作、教育培训等多个领域。

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型,支持40种语言及22种中文方言,具备高精度语音转文字能力。采用CTC-Attention架构,结合E-Branchformer和Transformer技术,提升识别效率与准确性。模型开源,支持自定义语言与地区设置,适用于会议记录、语音输入、智能助手等多种场景。

Q.AI

Q.AI是一款基于AI技术的视频创作平台,涵盖AI写真、视频生成、文生图及帧库管理等功能。它能够将文字描述转化为高质量的视频或图像,并提供智能配音、自动字幕匹配等辅助工具,助力个人与企业快速完成视频创作。主要应用场景包括视频制作、内容创作、社交媒体运营、广告营销以及教育培训等领域。

麦芽岛

麦芽岛是一款由科大讯飞开发的AI虚拟角色互动聊天应用,允许用户创建和自定义虚拟角色,进行沉浸式对话体验,提供情感陪伴及剧情互动功能。它支持多种角色选择,包括名著、历史及娱乐领域的经典形象,并设有麦岛广场供用户探索和互动。