AI项目与工具

优雅YOYA

优雅(YOYA)是中科闻歌推出的多模态文生视频平台,基于大语言模型和多模态技术,支持从脚本生成到视频剪辑的全流程自动化。用户仅需输入主题,即可快速生成高质量视频,并支持语音克隆、口型翻译、数字人等功能。平台还具备多模态素材智能剪辑能力,提升创作效率与可控性,适用于媒体、影视、企业宣传及教育等领域。

Kimi 创作空间

Kimi创作空间是一款利用AI技术辅助视频制作的工具,支持12种预设风格模板以及自定义素材上传,用户可通过输入场景描述和选择音乐快速生成音乐视频。其功能涵盖模板选择、自定义创作、场景描述输入、音乐添加、视频生成、编辑预览及下载,适用于社交媒体、商业宣传、个人娱乐等多种应用场景。

Mochii AI

Mochii AI 是一款多功能AI助手,支持智能对话、文档分析、网页总结、图像识别等功能,兼容多种AI模型。用户可跨平台使用,适用于文档处理、内容创作、代码生成及数据分析等场景,具备个性化定制和上下文理解能力,提升工作效率与体验。

Shallow Research

Shallow Research 是一种基于“小模型+大模型”架构的快速信息处理工具,能够在短时间内完成大量网页内容的搜索、整理和初步分析,适合需要高效获取信息和生成初步结论的场景,提升研究与决策效率。

脸猫

脸猫是一款基于AI技术的多功能图像处理软件,支持一键换装、AI换脸及风格写真等功能。其特色在于提供多样化模板选择,涵盖多种场景需求,并能实时生成高质量的照片和视频。无论是个人娱乐还是商业用途,脸猫都提供了灵活的操作方式和强大的编辑能力。

Miracle F1

Miracle F1 是一款由美图 WHEE 推出的 AI 图像生成工具,具备高真实感的图像生成能力,能精准处理光影、材质和空间效果。其语义理解能力强,可准确还原复杂描述,如“纯色背景”“夜景灯光”等。支持多种风格,涵盖 3D 立体、二次元、复古等,适用于电商展示、活动海报、插画设计等多个场景。基于扩散模型和优化算法,提升了生成效率与质量。

AtomThink

AtomThink是一个由多所高校与企业联合研发的多模态数学推理框架,通过构建长链思维(CoT)引导多模态大型语言模型(MLLMs)进行复杂推理。它包含自动CoT注释引擎、原子步骤微调策略及多种搜索策略,旨在提升原子步骤质量并增强MLLMs的推理能力。AtomThink提出的大规模多模态数据集AtomMATH及其评估方法为模型训练和测试提供了重要支持,广泛应用于教育辅助、自动化测试、学术研究等领域

Hunyuan

Hunyuan-Large是一款由腾讯开发的大规模混合专家(MoE)模型,以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构,擅长处理长文本任务,同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制,Hunyuan-Large实现了高效的推理吞吐量,并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

IngestAI

IngestAI是一款无需编码即可将企业文档转化为智能问答机器人的AI平台,支持Slack、Discord、WhatsApp和Telegram等多种通信工具。通过自然语言处理技术,用户可以便捷地实现知识检索与交互,并享受实时更新和个性化推荐的服务。主要适用于客户服务、内部知识管理、员工培训、销售支持及项目协作等领域。

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。