AI

PC Agent

PC Agent是一款基于人工智能的多功能系统,通过模拟人类认知过程,实现复杂数字任务的自动化处理,包括文档编辑、数据分析、项目管理和客户服务等。它采用多智能体系统架构,结合PC Tracker采集的人机交互数据,利用两阶段认知完成流程生成富含认知信息的轨迹,从而支持高效的决策制定与任务执行。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

Caricaturer

Caricaturer是一款利用深度学习技术的在线AI漫画头像生成工具,能将用户上传的照片转换为64种不同风格的漫画效果。它具备快速生成、高分辨率输出及隐私保护等特点,适用于个人娱乐、艺术创作、企业营销等多个场景。

Sassbook AI

利用先进的人工智能实现文本内容工作流程自动化。这些工具包括人工智能作家、人工智能故事作家、人工智能摘要器、人工智能释义器和人工智能标题生成器。这些解决方案极大地改进了内容创建、管理和消费。

Talk to Ash

Talk to Ash 是一款基于人工智能的心理健康支持平台,通过语音对话技术提供全天候的情感支持与心理辅导服务。平台结合认知行为疗法(CBT)和辩证行为疗法(DBT)等专业方法,能根据用户对话生成个性化建议。具备语音交互、情绪倾听、目标追踪、隐私保护等功能,适用于压力管理、人际关系改善和个人成长等场景。

PaperAcc

论文重复率检测、论文降重、论文在线修改、论文格式规范等一站式服务

ImagePulse

ImagePulse是由魔搭社区推出的开源项目,专注于图像理解和生成模型的数据集支持。它通过将复杂任务拆解为“修改、添加、移除”“风格迁移”“人脸保持”等原子能力,构建专门的数据集,提升模型在特定任务上的性能。项目提供开源脚本,支持数据集的生成与扩展,并结合多种技术资源实现多模型协同,适用于艺术创作、视频制作、产品展示等多个领域。

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。

西安电子科技大学人工智能学院

学院拥有一支结构合理、具有国际视野的高水平师资队伍,其中:欧洲科学院外籍院士、俄罗斯科学院外籍院士1人,入选国家高端人才15人次(国家级领军人才5人次、国家级青年人才10人...

GameNGen

GameNGen是谷歌推出的一款AI游戏引擎,它能够以每秒20帧的速度实时生成高质量的DOOM游戏画面,使大多数玩家难以分辨真假。该工具无需编程,简化了开发流程,同时具备高逼真度和交互式体验,为游戏创作提供了新的可能性。除了游戏开发,它还能应用于虚拟现实、自动驾驶等多个领域,具有广泛的应用前景。